Muchos sitios web utilizan un botón "Cargar más" o "Mostrar más" para cargar contenido de manera continua. Esta técnica es muy utilizada por los sitios web para crear una mejor experiencia de usuario.
A diferencia de la paginación con un botón "Siguiente", el botón "Cargar más" sigue agregando más contenido en una sola página web, lo que hace que sea más complicado el web scraping. En este artículo, te mostraré cómo tratar el botón "Cargar más" en Octoparse.
1. Utilizar la detección automática para tratar el botón "Cargar más"
2. Crear una acción de paginación manualmente
1. Utilizar la detección automática para tratar el botón "Cargar más"
Si estás creando una nueva tarea con la detección automática de páginas web, Octoparse escanea automáticamente la página web en busca de botones "Cargar más". Usemos esta página web (https://www.capterra.com/search/category?search=CRM%20Software) para la demostración.
- Inicia el proceso de detección automática y se te proporcionará la opción de hacer clic en un botón "Cargar más" en el panel de Tips.
- Haz clic en "Comprobar" para ver si Octoparse ha seleccionado el botón correcto. Si no crees que haya seleccionado el botón correcto, puedes hacer clic en "Editar" para seleccionar el botón correcto manualmente e ingresar el número deseado de clics.
- Haz clic en "Crear flujo de trabajo" para generar la configuración.
- Si por alguna razón, Octoparse no detecta el botón "Cargar más" durante el proceso de detección automática, aún puedes hacer que se cree el flujo de trabajo primero, luego elige la opción "Hacer clic en un botón Cargar más". Sigue los consejos para seleccionar el botón "Cargar más" en la página web e ingresa el número deseado de clics.
Ten en cuenta que hay dos elementos de bucle en el flujo de trabajo generado. Octoparse seguirá haciendo clic en el botón "Cargar más" durante un cierto número de veces antes de comenzar a scrapear la lista de elementos.
2. Crear una acción de paginación manualmente
Incluso cuando la detección automática no funciona o si está creando una tarea de raspado sin la detección automática, aún puedes tratar el botón "Cargar más" creando una acción de paginación manualmente.
- Selecciona el botón "Cargar más" en la página web y elige "Hacer clic en un solo botón en bucle"
- Configura un tiempo de espera AJAX adecuado(what is AJAX?)
Tips! Si solo quieres hacer clic en el botón "Cargar más" X veces, haz clic en el icono de configuración del cuadro de paginación y haz clic en abrir "Salir del bucle", configura Repeticiones con el número X. |
- Una vez que hayas terminado de crear el ciclo de paginación para el botón "Cargar más", puedes continuar para crear una lista de elementos de página para recorrer.
Tips! Si el ciclo de extracción se ha construido dentro del ciclo de paginación, arrástralo manualmente, ya que querríamos terminar el primer ciclo antes de ejecutar el segundo. |
Artículos relacionados:
¿Se ha configurado Infinite Scroll pero no se agregaron elementos nuevos a la lista?
Tratar la paginación (sin botón "Siguiente")
Si tienes alguna duda en configurar tu tarea, no dudes en enviar un ticket a nuestro equipo de Soporte.
Comentarios
0 comentarios
Inicie sesión para dejar un comentario.