Muchos sitios web aplican la técnica AJAX para crear páginas web mejores, más rápidas y más interactivas. Octoparse puede manejar fácilmente páginas con AJAX, por lo que en este artículo, le mostraré cómo manejar AJAX en Octoparse.
1. ¿Qué es AJAX?
AJAX significa "JavaScript y XML asíncronos", que permite que una página web actualice información sin recargar toda la página y solicite / reciba datos después de que se cargue la página. Cuando se usa AJAX, solo una parte de la página se actualiza cuando presiona botones como el botón "página siguiente" o "mostrar más" en la página web.
2. ¿Cómo sé si una página web carga contenido usando AJAX?
Cuando tiene que hacer una acción de clic para cargar datos web, es bastante sencillo saber si se está utilizando AJAX. Cuando se usa AJAX, la página web carga el contenido adicional sin volver a cargar la página. Por lo tanto, el icono de recarga es un buen indicador para diferenciar si se ha utilizado AJAX.
- Cuando hay AJAX involucrado, la página no debe recargarse cuando se carga contenido adicional. Por lo tanto, NO debería haber ninguna señal de recarga en este caso.


- Si no hay AJAX involucrado, debería ver que la página se recarga con el ícono de recarga ejecutándose cuando hace clic para cargar más información.


3. ¿Cómo manejar AJAX en Octoparse?
Octoparse toma la recarga como una señal al ejecutar el elemento de clic. Si la página se vuelve a cargar después de hacer clic en un elemento, ejecutará la siguiente acción después de que finalice la recarga. Pero como las páginas con AJAX no se recargan, Octoparse no recibe la señal para actuar y se atasca. Por lo tanto, debemos configurar el tiempo de espera de AJAX para "Hacer clic en elemento" o "Hacer clic para paginar" para decirle a Octoparse que vaya a la siguiente acción cuando se alcance el tiempo de espera. Hay dos formas en que se puede configurar AJAX en Octoparse.
-
Detección automática de AJAX
Octoparse configuraría el tiempo de espera de AJAX automáticamente cuando se detecta AJAX para la página.
Por ejemplo, el sitio web de Walmart usa AJAX para cargar la página siguiente. Entonces, cuando elegimos hacer clic en el botón de la página siguiente, Octoparse configura automáticamente el tiempo de espera de AJAX para la acción.
Si necesita un tiempo de espera más largo o más corto, simplemente haga clic en el menú desplegable y elija el que desee.
-
Configurar AJAX manualmente
Cuando una tarea se crea manualmente o si Octoparse fracasa en detectar AJAX, también es posible configurarlo manualmente haciendo clic en el botón de configuración de la acción "Hacer clic en elemento" o "Hacer clic para paginar".
Tips! El tiempo de espera de AJAX debe ser lo suficientemente largo para que la página cargue la información que necesitamos. |
4. Considere usar el tiempo de espera de AJAX para páginas web sin AJAX
Incluso para las páginas que no usan AJAX, el tiempo de espera de AJAX aún se puede usar para mejorar el tiempo de espera prolongado para algunas páginas. Por ejemplo, si tiene una página que tarda una eternidad en cargarse, mucho después de que se haya cargado la información que necesita, puede usar el tiempo de espera de AJAX para "forzar" a Octoparse a pasar al siguiente paso en lugar de que Octoparse espere la página se carga para terminar.
FAQs relacionadas con AJAX: |
Si tiene algún problema en configurar su tarea, no dude en enviar un ticket a nuestro equipo de Soporte.
Comentarios
0 comentarios
Inicie sesión para dejar un comentario.