Todas las colecciones
Herramientas Avanzadas
XPath & Expresión regular
¿Cómo solucionar problemas de campo de datos? (Campos faltantes, en blanco, mal ubicados)
¿Cómo solucionar problemas de campo de datos? (Campos faltantes, en blanco, mal ubicados)
Actualizado hace más de una semana

Cuando ejecutas tareas localmente o en la nube, es posible que los datos se extraigan en las "columnas" incorrectas o que no se extraigan en absoluto. Es probable que esto se deba a que XPath incorrecto no pudo ubicar los datos correctos y extraerlos.

A continuación, se muestra un ejemplo de datos obtenidos en los campos de datos incorrectos.

Estos son los datos que necesitamos:

Y esta es una muestra de datos. Observa que todos los datos resaltados no se extraen correctamente.

¿Cómo arreglarlo?

Para asegurarse de que los datos siempre se extraigan correctamente en los campos de datos correspondientes, debemos escribir un nuevo XPath que siempre señalará los datos correctos en todas las páginas. Para hacer esto, consulta nuestro tutorial paso a paso sobre cómo ubicar el elemento con XPath. Alternativamente, si extraes pares nombre-valor, consults cómo asociar datos con texto cercano.

Una vez que tengamos el nuevo XPath, sigue los pasos a continuación para actualizar el XPath.

Paso 1. En la vista previa de datos, selecciona el campo de datos. Haz clic en el icono "Más" y luego selecciona la opción "Personalizar XPath"

mceclip0.png

Paso 2. Cambia el XPath por el nuevo y haz clic en Aceptar para guardar

mceclip2.png

En algunos casos, podríamos encontrar que los datos se pueden extraer en la vista previa, pero no es así después de ejecutar la tarea, entonces podemos intentar:

  • Configura "Desplazarse hacia abajo" para cargar completamente los elementos de destino antes de raspar

  • Agrega "Tiempo de espera" si los datos del objetivo tardan un poco en cargarse por completo, como imágenes

  • Si es contenido privado, verifica si fallaron los pasos de inicio de sesión o si la cookie caducó

¿Ha quedado contestada tu pregunta?