Extraer datos de un motor de búsqueda es una buena forma de recopilar información relacionada con un tema. En este tutorial, te mostraremos cómo extraer los datos de los resultados de búsqueda en la búsqueda de Google.
Puedes ir a "Plantillas de tareas" en la pantalla de inicio de Octoparse y comenzar directamente con la plantilla de búsqueda de Google para ahorrar tiempo. Con esta plantilla, no es necesario configurar tareas de raspado. Para más detalles, puedes consultarlo aquí: Task Templates
También puedes utilizar nuestro modo avanzado para crear tu propia tarea. Para continuar, necesitamos utilizar esta URL en el tutorial. https://www.google.com/
Recopilamos datos como el título, la URL y la descripción de la página de resultados de búsqueda con Octoparse.
Estos son los pasos principales de este tutorial:[Descargar archivo de demostración aquí ]
- Abrir la página web de destino
- Detectar automáticamente la página web para crear pasos para ingresar texto
- Modificar la configuración de "Hacer Clic en el Elemento de clic"
- Detectar automáticamente la página de resultados de búsqueda para extraer datos
- Configurar el tiempo de espera para reducir la velocidad de raspado
- Guardar y comenzar a ejecutar la tarea y obtener datos
1) Abrir la página web de destino
- Ingresa la URL en la página de inicio y haz clic en Iniciar
2) Detectar automáticamente la página web para crear pasos para ingresar texto
- Haz clic en "Detectar automáticamente los datos de la página web" y espera a que se complete la detección
- Elige "Buscar con palabras clave" en el panel de Tips y verás instrucciones que te ayudarán a configurar los pasos.
a. "Agregar un cuadro de búsqueda": haz clic en "Configuración" y selecciona el cuadro de búsqueda en la página web
b. "Agregar palabra (s) clave": haga clic en e ingresa la (s) palabra (s) clave. Una palabra clave por línea.


- Haz clic en "Confirmar" para generar el flujo de trabajo.
3) Modificar la configuración del "Hacer Clic en el Elemento "
- Haz doble clic en "Hacer clic en el elemento" para acceder al panel de Configuración de acciones.
- Marca "Abrir en una pestaña nueva"
- Prolonga el tiempo de espera de carga de AJAX
4) Detectar automáticamente la página de resultados de búsqueda para extraer datos
- Detectar automáticamente la página nuevamente
- Haz clic en "Crear flujo de trabajo".
- Cambia el nombre de los campos o elimina los que no quieres
5) Configura el tiempo de espera para reducir la velocidad de raspado
- Haz doble clic en la acción Extraer datos
- Marca "Esperar antes de la acción"
- Selecciona el tiempo de espera como 1s-3s

6) Guardar y comenzar a ejecutar la tarea y obtener datos
- Haz clic en Guardar"
- Haz clic en "Ejecutar" en la parte superior izquierda
- Selecciona "Ejecutar en el dispositivo" para ejecutar la tarea en tu computadora, o selecciona "Ejecutar en la nube" para ejecutar la tarea en la nube (solo para usuarios premium)
Aquí tienes una muestra de datos.
Si tienes alguna pregunta, no dudes en ponerte en contacto con nuestro equipo de Soporte.
Comentarios
0 comentarios
Inicie sesión para dejar un comentario.