La generación de leads es una de las partes más importantes de cualquier proceso de ventas. Yellowpages es un buen recurso de datos para que las empresas de cualquier industria recopilen clientes potenciales. En este tutorial, te mostraremos cómo extraer los clientes potenciales de Yellowpages.
Para Yellowpages, puedes visitar nuestra "Plantilla de tareas" en la pantalla principal de Octoparse. Todo lo que necesitas es escribir varios parámetros y la tarea está lista para comenzar. Para más detalles, puedes consultar aquí: Plantillas de tareas
Si quieres saber cómo crear una tarea desde cero con Octoparse, sigue los pasos a continuación. Usaremos la URL a continuación para recopilar datos como el título, la dirección, el teléfono, etc.
Estos son los pasos principales de este tutorial:[Descargar archivo de tarea de demo aquí]
1) "Ir a la Página Web" - Abrir la página web de destino
Ingresa la URL en la página de inicio y haz clic en Iniciar
2) Detectar automáticamente la página web - crear un flujo de trabajo
Haz clic en "Detectar automáticamente los datos de la página web" y espera a que se complete la detección.
Ve a "Vista previa de datos" para ver si está de acuerdo con la muestra de datos actual
Haz clic en "Crear flujo de trabajo".
Si todos los datos que necesitas se pueden extraer de la página de listado, puedes saltar a configurar tiempo de espera para reducir la velocidad de extracción. Si quieres hacer clic en cada enlace de detalles para obtener más información, sigue el siguiente paso.
3. Haz clic en cada enlace de detalles para obtener más información
Elige "Hacer clic en los vínculos para scrapear las páginas vinculadas" en el panel de Tips.
Selecciona "Hacer clic en un campo de datos extraídos" y selecciona el que quieres hacer clic en el menú desplegable (puedes confirmar si es el enlace correcto en la Vista previa de datos)
Haz clic en "Confirmar"
4. Extraer datos - extraer datos en las páginas de detalles
Seleccionar información en la página web
Elige "Extraer texto del elemento seleccionado"
Repite los pasos anteriores para extraer todos los datos que necesitas
Edita el nombre del campo de datos si es necesario
5. Configura el tiempo de espera para reducir la velocidad de raspado
Dado que Yellowpages puede bloquear su IP si la scrapeas demasiado, necesitamos controlar la velocidad de raspado
Haz clic en abrir la configuración de acción de la acción "Extraer datos1"
Marca "Esperar antes de la acción"
Configura el tiempo como 5 a 10s
6. Ejecutar la extracción - ejecuta tu tarea y obtendrás datos
Haz clic en "Guardar"
Haz clic en "Ejecutar" en la parte superior izquierda
Selecciona "Run task on your device" para ejecutar la tarea en tu computadora, o selecciona "Run task in the cloud" para ejecutar la tarea en la nube (solo para usuarios del plan premium)
Aquí tienes una muestra de datos.