Los contenidos de las páginas web suelen estar organizados en algunos tipos de patrones. Y uno de los patrones más comunes es una lista. A continuación, te mostraremos algunos ejemplos de que cuándo el contenido se presenta como una lista.

Example URL: https://www.yellowpages.com/search?search_terms=dentist&geo_location_terms=new+york
Esta página web consta de elementos que comparten la misma estructura. Cada elemento contiene título, dirección, número de teléfono, calificaciones de estrellas, imagen / video ...
Nuestro objetivo es obtener estos datos extraídos en Excel como así:
Ahora, vamos a explorar las diferentes formas de hacer esto en Octoparse.
1. Extraer lista con Detección Automática
Extraer lista con Detección Automática
Una vez que hayas creado una nueva tarea usando la URL de ejemplo, selecciona "Detectar automáticamente datos de página web". Octoparse ahora detectará cualquier dato en la página y podemos hacer clic en "Crear flujo de trabajo" para generar el flujo de trabajo.
Extraer lista manualmente
Si la detección automática no detecta la lista o si está creando una tarea sin la detección automática, siempre puedes extraer la lista manualmente.
1) Carga la página web en Octoparse, coloca el cursor sobre uno de los elementos de la lista hasta que toda la sección se resalte en azul, luego haz clic en ella.
Tips! Por favor, asegúrate de que todos los subelementos que deseasextraer estén incluidos en esta sección resaltada. |
2) Una vez que hayas seleccionado el elemento, observarás cómo los subelementos se resaltan en rojo, lo que significa que Octoparse ha identificado correctamente esos subelementos, luego, haz clic en "Seleccionar subelementos".
3) Luego, haz clic en "Seleccionar todo" para seleccionar todos los elementos similares detectados en la página.
4) A continuación, selecciona "Extraer datos". Un elemento de bucle se generará automáticamente para scrapear elementos de la lista en la página.
5) Si quieres editar los campos de datos extraídos, puedes hacer clic en el icono de configuración para la acción Extraer datos.
Si tienes algún problema en configurar tu tarea, no dudes en enviar un ticket a nuestro equipo de Soporte.
Comentarios
0 comentarios
Inicie sesión para dejar un comentario.