Cuando se extraen las informaciones de los sitios web, en la maypría de los casos se espera extraer datos no solo de la página de resultados de la búsqueda (normalmente una página de listado), sino también de la página de detalles de cada producto.
Si no estás segur@ de cómo lograr este propósito con Octoparse, puedes consultar este tutorial: Obtener datos - Haga clic en una lista y capture datos de cada página de elementos
Sin embargo, en algunos casos, cuando la página de detalles no puede abrirse en una nueva pestaña, Octoparse no puede volver a la página del listado para raspar la siguiente página de detalles. Si no podemos localizar un botón de volver en las páginas de detalle, tendremos que separar la tarea en dos partes. De lo contrario, habrá duplicados en blanco después de obtener la primera línea de datos.
Este tutorial te mostrará cómo solucionar este problema con la nueva función Volver a la página anterior de Octoparse.
Para seguir este tutorial, podrías utilizar la siguiente URL:
Supongamos que ya has configurado un bucle para hacer clic en la página de detalles desde la página del listado.
Para empezar, tendrías que asegurarte de que la página actual en el navegador de Octoparse no es la página del listado sino la de detalles.
- Hace clic para añadir un paso en el flujo de trabajo
- Selecciona Volver en el panel derecho
Y en el flujo de trabajo se presentará un cuadro de Volver a la página anterior:
A continuación se muestra un ejemplo de datos del local. Los formatos Excel, CSV, HTML y JSON están disponibles para la exportación.
Si tienes alguna otra duda con la tarea o tienes alguna sugerencia que haga de este un mejor recurso para ti, nos encantaría escucharlo. Podrías enviar una solicitud aquí.
Comentarios
0 comentarios
Inicie sesión para dejar un comentario.