A veces puede encontrar que Octoparse se detiene o tarda mucho en avanzar después de hacer clic en el botón "Siguiente" para raspar la paginación. Esto puede deberse a la técnica de JavaScript (particularmente AJAX, abreviatura de JavaScript asíncrono y XML) utilizada en el botón "Siguiente", por lo que Octoparse no puede identificar la recarga de la página sin la configuración de AJAX.
Mientras raspa datos de la web, Octoparse toma la recarga como la señal para ejecutar la acción, como "Haga clic en el elemento" y "Haga clic para paginar". Para la página web que usa AJAX, actualiza nuevos contenidos sin recargar. Como no hay recargar, Octoparse no recibe la señal para actuar y se quedaría estancado en el último paso. Como resultado, podemos obtener mucho menos datos extraídos de lo que esperamos.
Para solucionar este problema, deberá configurar el tiempo de espera de “Carga AJAX” en “Opciones avanzadas” de la acción “Hacer clic en elemento”.
¡Consejos! La configuración del tiempo de espera de AJAX en Octoparse se basa en el tiempo que tardan en cargar las páginas web. También puede configurar un valor más alto siempre que haya suficiente tiempo para que se cargue la página siguiente. |
De hecho, muchos sitios web actualizan nuevos datos con la configuración de AJAX como Amazon, eBay, Google, etc. A veces, si Octoparse tarda tanto en raspar los datos después de hacer clic en un elemento, también debe configurar el tiempo de espera de AJAX para asegurarse de que haya suficiente tiempo para páginas de detalles cargar.
Si tiene preguntas sobre AJAX, lea más detalles aquí
Comentarios
0 comentarios
Inicie sesión para dejar un comentario.