El desplazamiento infinito, también conocido como "desplazamiento sin fin" es una técnica que utilizan con mayor frecuencia los sitios web con JavaScript o AJAX para cargar contenido adicional de forma dinámica a medida que los usuarios se desplazan hacia la parte inferior de la página web. Por lo general, cuando arrastra la barra lateral hacia la parte inferior directamente, puedes ver el signo "cargando" y el nuevo contenido se agregará a la página muy pronto:
De manera similar a cómo se desplazará manualmente hacia abajo en la página, Octoparse lo hace de la misma manera con la configuración adecuada. Básicamente, todo lo que necesitas hacer es decirle a Octoparse qué página debe desplazarse, cuántas veces debe desplazarse y el intervalo de tiempo entre cada dos desplazamientos.
En este tutorial, te mostraremos cómo lidiar con el desplazamiento infinito en Octoparse, es posible que desees utilizar esta URL para seguir adelante.
https://biomarket.com.ar/product-category/almacen/desayuno/
* Ten en cuenta que este tutorial es para desplazarse por toda la página. Si solo necesitas desplazarse por un área designada de la página, marca Desplazamiento dentro del área designada de una página web
1) Utilizar el algoritmo de detección automática para solucionarlo
2) Configurar el desplazamiento infinitivo manualmente
1) Utilizar el algoritmo de detección automática para solucionarlo
- Selecciona "Detectar automáticamente los datos de la página web" en el panel Tips.
- Modificar la configuración de desplazamiento
1. Haz clic en "Editar" debajo de "Agregar un desplazamiento de página" y configura el método de desplazamiento, los tiempos de repetición y el tiempo de espera según sea necesario.
2. Haz clic en "Confirmar" para guardar la configuración. Asegúrate de configurar suficientes tiempos de desplazamiento hacia abajo e intervalos adecuados entre dos desplazamientos.
Tips! 1. Desplazarse hasta la parte inferior de la página: Octoparse se desplazaría hacia la parte inferior de la página directamente sin detenerse en el medio de la página. Deberías considerar usar esta opción cuando la página solo carga elementos cuando llega al final de la página. 2. Desplazarse por una pantalla: Octoparse se desplazaría por una pantalla cada vez. Considera usar esta opción si la página carga contenido mientras se desplaza hacia abajo de forma continua. (El desplazamiento para una pantalla se puede utilizar para todos los sitios web, mientras que el desplazamiento hasta la parte inferior de la página puede no funcionar para algunos sitios web específicos.) 3. Ingresar un número para Repeticiones, que es el número de veces que te gustaría repetir el desplazamiento hacia abajo (es decir, el número de desplazamientos). Es posible que primero desees desplazarse manualmente por la página web de destino, solo para averiguar cuántos pergaminos necesitarías para cargar toda la información requerida. 4. Seleccionar un tiempo de espera adecuado entre cada uno de los dos pergaminos. Es posible que desees elegir un tiempo de espera más largo para las páginas que tardan más en cargarse. |
- Crear el flujo de trabajo con la configuración
- Obtener el flujo de trabajo como se muestra a continuación
- Hacer clic en "Desplazamiento de página" para comprobar o modificar la configuración del desplazamiento
- Comprobar si el elemento de bucle creado puede ubicar todos los elementos
Puedes ir a la configuración del elemento de bucle para ver si se encuentran todos los elementos. Además, asegúrate de que en la parte "Modo de bucle", sea una "Lista de variables" con el Xpath correcto.
2) Configurar el desplazamiento infinitivo manualmente
Puedes configurar un desplazamiento a "Ir a la página web" o "Hacer clic en el elemento", o agregar un nuevo elemento de bucle para desplazarse hacia abajo manualmente.
- Haz clic en el elemento y haz clic en "Seleccionar todo", luego haz clic en "Hacer clic en bucle en cada URL"
El elemento de bucle creado hará clic en la URL de cada producto para obtener los datos.
- Configurar el desplazamiento hacia abajo
a. Haz clic en la acción Ir a la página web para acceder al menú de configuración. Luego, busca la sección "Desplazarse hacia abajo en la página después de que se cargue" en "Opciones".
b. Agrega un elemento de bucle al flujo de trabajo y configura el modo de bucle como "Desplazamiento de página"
- Modifica el XPath para ubicar los elementos correctos: //div[contains(@class,'product-grid-item')]/div/a
- Haz clic en la acción "Elemento de bucle", luego elige mdo de bucle como "Lista variable"
- Copia y pega el XPath debajo de la parte "Elemento XPath"
Tips! Encuentra más detalles sobre la función de desplazamiento hacia abajo de la página en Desplazar la página hacia abajo. Encuentra más detalles sobre el elemento de bucle en: elemento de bucle. |
Si necesitas ayuda con la configuración de tareas o la recopilación de datos, envía un ticket a nuestro equipo de soporte. Nos comunicaremos contigo pronto.
Comentarios
0 comentarios
Inicie sesión para dejar un comentario.