La generación de leads es una de las partes más importantes de cualquier proceso de ventas. Yellowpages es un buen recurso de datos para que las empresas de cualquier industria recopilen clientes potenciales. En este tutorial, te mostraremos cómo extraer los clientes potenciales de Yellowpages.
Para Yellowpages, puedes visitar nuestra "Plantilla de tareas" en la pantalla principal de Octoparse. Todo lo que necesitas es escribir varios parámetros y la tarea está lista para comenzar. Para más detalles, puedes consultar aquí: Plantillas de tareas
Si quieres saber cómo crear una tarea desde cero con Octoparse, sigue los pasos a continuación. Usaremos la URL a continuación para recopilar datos como el título, la dirección, el teléfono, etc.
https://www.yellowpages.com/search?search_terms=Anesthesiologists&geo_location_terms=New+York
Estos son los pasos principales de este tutorial:[Descargar archivo de tarea de demo aquí ]
- "Ir a la página web" - Abrir la página web de destino
- Detectar automáticamente la página web - crear un flujo de trabajo
- Hacer clic en cada enlace de detalles para obtener más información
- Extraer datos - extraer datos en las páginas de detalles
- Configurar el tiempo de espera - reducir la velocidad de raspado
- Iniciar extracción - ejecutar la tarea y obtener datos
1) "Ir a la Página Web" - Abrir la página web de destino
- Ingresa la URL en la página de inicio y haz clic en Iniciar
2) Detectar automáticamente la página web - crear un flujo de trabajo
- Haz clic en "Detectar automáticamente los datos de la página web" y espera a que se complete la detección.
- Ve a "Vista previa de datos" para ver si está de acuerdo con la muestra de datos actual
- Puedes eliminar los campos de datos innecesarios directamente haciendo clic en el icono
- También puedes modificar los nombres de los campos de datos aquí directamente haciendo clic en el icono
- Puedes eliminar los campos de datos innecesarios directamente haciendo clic en el icono
- Haz clic en "Crear flujo de trabajo".
Si todos los datos que necesitas se pueden extraer de la página de listado, puedes saltar a configurar tiempo de espera para reducir la velocidad de extracción. Si quieres hacer clic en cada enlace de detalles para obtener más información, sigue el siguiente paso.
3. Haz clic en cada enlace de detalles para obtener más información
- Elige "Hacer clic en los vínculos para scrapear las páginas vinculadas" en el panel de Tips.
- Selecciona "Hacer clic en un campo de datos extraídos" y selecciona el que quieres hacer clic en el menú desplegable (puedes confirmar si es el enlace correcto en la Vista previa de datos)
- Haz clic en "Confirmar"
4. Extraer datos - extraer datos en las páginas de detalles
- Seleccionar información en la página web
- Elige "Extraer texto del elemento seleccionado"
- Repite los pasos anteriores para extraer todos los datos que necesitas
- Edita el nombre del campo de datos si es necesario
5. Configura el tiempo de espera para reducir la velocidad de raspado
Dado que Yellowpages puede bloquear su IP si la scrapeas demasiado, necesitamos controlar la velocidad de raspado
- Haz clic en abrir la configuración de acción de la acción "Extraer datos1"
- Marca "Esperar antes de la acción"
- Configura el tiempo como 5 a 10s
6. Ejecutar la extracción - ejecuta tu tarea y obtendrás datos
- Haz clic en "Guardar"
- Haz clic en "Ejecutar" en la parte superior izquierda
- Selecciona "Run task on your device" para ejecutar la tarea en tu computadora, o selecciona "Run task in the cloud" para ejecutar la tarea en la nube (solo para usuarios del plan premium)
Aquí tienes una muestra de datos.
Si tienes alguna duda en configurar tu tarea, no dudes en enviar un ticket a nuestro equipo de Soporte.
Comentarios
0 comentarios
Inicie sesión para dejar un comentario.