La paginación es el proceso de dividir un documento en páginas discretas, ya sean páginas electrónicas o páginas impresas. Configurar la paginación es un proceso crucial para obtener una gran cantidad de datos de varias páginas. Las formas comunes de paginación incluyen la paginación con un botón "Siguiente", un botón "Cargar más" o con desplazamiento infinito.
En este tutorial, hablemos de la forma de tratar la paginación con un botón "Siguiente" en Octoparse.
Hay dos formas de configurar la paginación con un botón "Siguiente":
1) Utilizar el algoritmo de detección automática para configurarla
2) Configurar la paginación manualmente
1) Utilizar el algoritmo de detección automática para configurarla
Necesitas este enlace de ejemplo para seguir: https://www.amazon.com/s?k=sunglass&ref=nb_sb_noss_2
1. Haz clic en "Detectar automáticamente los datos de páginas web" en el panel de Tips.
2. Cuando se complete el proceso de detección automática, examina si la opción "Paginar para scrapear más páginas" está marcada. (Generalmente, esta opción se mostrará automáticamente en el panel de Tips).
3. Haz clic en el botón "Verificar" para inspeccionar qué botón se identifica como botón "Siguiente".
Cuando Octoparse no reconoce el botón correcto de la página siguiente, haga clic en "Editar" para seleccionar el botón "siguiente" manualmente.
4. Haz clic en "Crear flujo de trabajo" en el panel de Tips y verás un flujo de trabajo con la paginación creada.
5. Prueba el flujo de trabajo haciendo clic en "Paginación" y haciendo clic en "Haga clic para paginar" para ver si Octoparse puede moverse a la página siguiente. Si encuentras que Octoparse puede ir a la página siguiente, eso significa que tu paginación se configuró correctamente.
Tips! Cuando no hay la opción "Paginar para scrapear más páginas" en el panel de Tips después de que se completa la detección automática, podemos hacer clic en "Crear flujo de trabajo" primero, y luego veremos la opción que se muestra en Tips.
Selecciona el botón de página siguiente en la página web y haz clic en Confirmar. |
2) Configurar la paginación manualmente
1. Haz clic en el botón / icono de la página siguiente. Después de eso, elige "Hacer clic en bucle cada URL" en el panel de Tips.
2. Cuando la paginación esté configurada, haz clic en la barra "Paginación" y luego haz clic en "Hacer clic para paginar" para examinar si Octoparse puede pasar a la página siguiente. Si encuentras que Octoparse puede ir a la página siguiente, eso significa que tu paginación se configuró correctamente.
Tips! Cuando no hay "Hacer clic en bucle URL única" en el Tips, puede seleccionar "Hacer clic en bucle en la página siguiente" o "Hacer clic en bucle en el single elemento". |
Si tienes alguna duda en configurar tu tarea, no dudes en enviar un ticket a nuestro equipo de Soporte.
Comentarios
0 comentarios
Inicie sesión para dejar un comentario.