Muchos sitios web utilizan un botón "Cargar más" o "Ver más" para cargar contenido de manera continua. Esta técnica es muy utilizada por los sitios web para ofrecer una mejor experiencia de usuario.
Las versiones anteriores de Octoparse siguen haciendo clic en el botón "Cargar más" varias veces antes de extraer todos los datos. Es decir, si el "Número de clics" se establece en 20, Octoparse no extraerá datos hasta que haga clic en el botón "Cargar más" 20 veces. A veces confunde a los usuarios cuando su tarea no puede extraer datos después de un largo tiempo de hacer clic en el botón "Cargar más". Y podría ser fácil romper la página web después de cargar demasiados elementos. Para obtener más información, consulta Tratar la paginación (con el botón ¨Cargar más¨).
Por el contrario, Octoparse 8.2.2 hará clic en el botón "Cargar más" junto con la extracción de datos. Si el "Número de clics" se establece en 20, y cada vez que hace clic en el "botón Cargar más", se cargarán 20 elementos nuevos, Octoparse extraerá los 20 elementos recién cargados cada vez que haga clic en el botón "Cargar más".
Descarga Octoparse 8.2.2 aquí.
¿Cómo utilizar esta nueva función "Cargar más"?
En este tutorial, aprenderás cómo tratar los sitios web mencionados anteriormente en Octoparse 8.2.2. Vamos a utilizar este URL https://www.capterra.com/search/category?search=CRM%20Software para hacer demo.
1.Utilizar el algoritmo de detección automática
2.Crear una acción de paginación manualmente
1.Utilizar el algoritmo de detección automática
Paso 1: Ingresar la (s) URL (s) y hacer clic en "Iniciar". Seleccionar "Detectar automáticamente datos de páginas web" en el panel de Tips.
Octoparse comenzará a detectar los datos de la página y esperemos a que termine.
Paso 2: Verificar y editar la configuración
Haz clic en "Comprobar" para ver si Octoparse ha seleccionado el botón correcto. Si crees que no ha seleccionado el botón correcto, puedes hacer clic en "Editar" para seleccionar el botón correcto manualmente y también puedes ingresar el número de clics que quieras.
Haz clic en "Editar" debajo de "Agregar un desplazamiento de página" para configurar los tiempos de repetición y el tiempo de espera adecuados.
Paso 3: Crear el flujo de trabajo
Haz clic en "Crear flujo de trabajo" en el panel de Tips para generar el flujo de trabajo. Como podemos ver, se ha configurado un flujo de trabajo adecuado. También puedes ir a la configuración del elemento de bucle y hacer clic en "Salir del bucle" para editar el número de clics según tu situación.
Paso 4: Guardar y ejecutar la tarea
Haz clic en "Guardar" y "Ejecutar". Elige "Ejecutar en tu dispositivo". Verás que Octoparse scrapea cada vez después de hacer clic en el botón "Cargar más" en la ventana de extracción.
2.Crear una acción de paginación manualmente
Paso 1: Ingresar las URLs y hacer clic en "Iniciar"
Paso 2: Configurar un elemento de bucle para la extracción de datos
Paso 3: Configurar un elemento de bucle para hacer clic en bucle en el botón "Cargar más"
Haz clic en el botón "Cargar más" y selecciona "Hacer clic en un solo elemento en bucle". Ve a la configuración del cuadro de Paginación y haz clic para abrir "Salir de bucle" para configurar "Repeticiones" en el número que quieras.
Paso 4: Configurar el desplazamiento de página para "Hacer clic en un botón 'Cargar más'"
Abre la configuración de esta acción de Clic y configura las veces de repetición y el tiempo de espera.
Paso 4: Guardar y ejecutar la tarea
Haz clic en "Guardar" y "Ejecutar". Elige "Ejecutar en tu dispositivo".
Comentarios
0 comentarios
Inicie sesión para dejar un comentario.