Todas las colecciones
FAQ
¿Cómo tratar con los datos que faltan en la ejecución en la nube?
¿Cómo tratar con los datos que faltan en la ejecución en la nube?
Actualizado hace más de una semana

Puede ocurrir el caso de perder datos en la extracción en la nube cuando:

1. Las tareas que se ejecutan en la nube son dividibles y funcionan demasiado rápido, por lo que algunos elementos pueden omitirse.

Las tareas con el modo de bucle "Lista fija", "Lista de URLs" y "Lista de texto" son dividibles. Las tareas principales se dividirán en subtareas ejecutadas con múltiples servidores en la nube simultáneamente. Entonces, en este caso, cada paso de la tarea funcionará muy rápido, por lo que es posible que algunas páginas no se carguen por completo antes de pasar al siguiente paso.

2. El sitio web que buscas es en realidad multirregional.

Un sitio web multirregional podría tener diferentes estructuras de páginas para el contenido proporcionado a los visitantes de diferentes países. Cuando una tarea está configurada para ejecutarse en la nube, se ejecuta con nuestra IP basada en Estados Unidos. En este caso, para las tareas dirigidas a sitios web fuera de Estados Unidos, es posible que se omitan algunos datos, ya que no se pueden encontrar en el sitio web abierto en la nube.

3. Cuando la tarea tiene situaciones 1 y 2.

A continuación, se incluyen soluciones comunes para hacer frente a los datos que faltan en la extracción de la nube.

- Para asegurarse de que la página web se cargue completamente en la nube, puedes intentar

1. Aumentar el tiempo de espera para el paso "Ir a la página web"

mceclip0.png

Se puede configurar un tiempo de espera para todos los pasos creados en el flujo de trabajo.

mceclip1.png

3. Configurar un elemento de anclaje para buscar antes de la acción

Este paso garantizará que la extracción solo comience después de que se haya encontrado un determinado elemento. Puedes elegir el XPath de cualquier elemento de los campos deseados.

En primer lugar, haz clic en el paso 'Extraer datos'. En segundo lugar, llena el elemento con un XPath y cambia "Esperar antes de la acción" a "30s".

mceclip2.png

Tips: Cómo obtener el XPath de un determinado elemento en la página.

En primer lugar, en la Vista previa de datos, haz clic en "Más" y elige la opción "Personalizar XPath".

mceclip4.png

Está justo aquí.

mceclip5.png

- Para identificar si el sitio web es multirregional, puedes

- Probar la tarea con extracción local. Si no faltan datos como ocurre en la extracción de la nube, lo más probable es que el sitio web sea multirregional. En este caso, como el contenido de destino solo se puede encontrar al abrir el sitio web con su propia IP, te sugerimos Extracción local para obtener los datos en su lugar.

- Extraer el HTML externo de toda la página. Al verificar el HTML extraído, puedes encontrar qué ha causado la falta de datos en el mensaje en el código fuente como "Acceso denegado".

¿Ha quedado contestada tu pregunta?