En este tutorial, le mostraremos cómo recopilar detalles del producto en bukalapak.com con Octoparse.
Puede visitar nuestras plantillas de tarea en la página de inicio de Octoparse. Todo lo que necesita es escribir varios parámetros y la tarea está lista para comenzar. Para más detalles, puede consultarlo aquí: Plantillas de tarea.
Para seguir, puede usar esta URL en el tutorial:
Estos son los pasos principales de este tutorial [Descargar el demo tareas archivo aquí ]
- "Ir a la página web" - para abrir la página web de detalles
- "Activar el modo de autodetección - para crear una tarea de scrapeo
- Modificar XPath del elemento de bucle - para localizar todos los campos de datos que quiera
- Modicar la configuración de la paginación - para cargar por completo todos los datos de la página
- Ejecutar la tarea - para exportar datos que quieras
1."Ir a la página web" - para abrir la página web de detalles
- Pegue la URL en el cuadro de texto de la página de inicio
- Haga clic en "Empezar" para continuar
- Desplácese hacia abajo y haga clic en el botón "Ir a la página“ en el panel de trabajo
- Seleccione la opción "Desplazarse hacia abajo en la página después de que se cargue" y "para una pantalla"
- Modifique la frecuencia de desplazamiento a 12 veces
¡Consejos! AJAX timeout a menudo se puede usar como web page timeout for Click Action. Por ejemplo, cuando tiene una página que se tarda mucho tiempo en cargar los datos completo, puede usar convenientemente el tiempo de espera de AJAX para indicarle a Octoparse que pase a la siguiente acción cuando se alcance el tiempo establecido. Si desea obtener más información sobre AJAX, puede ver del video tutorial aquí |
2. Activar el modo de autodetección - para crear una tarea de scrapeo
- Haga clic en Detectar automáticamente los datos de la página web
-
Haga clic en los campos de datos en Vista previa de datos y eliminar los que no quiera o renombrarlos
-
Desactive Agregar un desplazamiento de página
-
Haga clic en Crear workflow
3. Modificar XPath del elemento de bucle - para localizar todos los campos de datos que quiera
-
Haga clic en Elemento de bucle en el panel de trabajo
-
Cambie XPath a: //div[@class="bl-flex-container flex-wrap is-gutter-16"]/div
-
Seleccione Hacer clic para pagina en el panel de > Hacer clic en Opciones
-
Active Desplazarse hacia abajo en la página después de que se cargue
-
Configure modo de desplazamiento como al final de la página
-
Configure la frecuencia de desplazamiento como 12 veces
-
Haga clic en Guardar para luego ejecutar la tarea sin perder la configuración actual
-
Haga clic en Ejecutar
-
Selecione Ejecutar en el dispositivo
-
Espere que termine el proceso de la extracción
Aquí es la muestra de los datos extraídos con su equipo local:
Artículos relacionados:
Scraping de detalles de productos de Wayfair
Comentarios
0 comentarios
Inicie sesión para dejar un comentario.