Google Maps no es solo un sitio web de mapas para ayudarte a encontrar la ubicación, sino también una poderosa base de datos donde puedes obtener una gran cantidad de información empresarial. Muchas personas recopilan datos de Google Maps para agregar su propio directorio comercial o crear una base de clientes potenciales comerciales.
Este tutorial te guiará sobre cómo obtener información comercial de Google Maps.
Primero, déjame presentar la manera más fácil - Plantilla de Google Maps.
Con las plantillas, solo necesitas ingresar una palabra clave (por ejemplo, Bufete en Madrid) y luego espera a que salgan los datos.
Aquí está la muestra de datos de la plantilla. Para probar la plantilla, puedes solicitar una prueba premium de 14 días para comenzar: ¡Comienza la prueba gratis del plan premium de 14 días de Octoparse!
Si quieres aprender cómo configurar un rastreador por tu parte, puedes continuar con este tutorial: https://www.google.es/maps/search/bufete+de+abgado+en+Madrid/@40.4281148,-3.7830385,12z/data=!3m1!4b1?hl=es
Vamos a extraer los siguientes campos de datos: Título, Número de revisión, Rating, Dirección, Teléfono, Sitio web, Horario.
Estos son los principales pasos en este tutorial:
- Ir a la página web - para abrir la página web de destino
- Crear un bucle de paginación - para extraer todos los resultados de varias páginas
- Crear un "Elemento de bucle"- para hacer clic en bucle en los elementos de la página actual
- Extraer datos - para seleccionar los datos para la extracción
- Extraer de datos a nivel de página - para extraer coordenadas GPS (opcional)
- Hacer clic en el elemento - hacer clic en "Volver a los resultados"
- Iniciar extracción - para ejecutar la tarea y obtener datos
1) Ir a la página web - para abrir la página web de destino
- Ingresa la URL de ejemplo en la barra de búsqueda y haz clic en "Empezar".
Si tienes muchas URLs para raspar, puedes ingresar varias URLs en la barra. Para obtener más información sobre "Abrir página web", consulte esta guía: Ingresar URLs por lotes
- Haz clic en "Ir a la página web" y establece un tiempo de espera más largo en la parte inferior, como "120 s", luego haz clic en "Aplicar".
2) Crear un bucle de paginación - para extraer todos los resultados de varias páginas
- Haz clic en el botón de la página siguiente ">"
- Haz clic en "Hacer clic en bucle en un solo elemento" en el panel de Tips.
Después de las acciones anteriores, se crea una "Paginación" en el flujo de trabajo. Puedes hacer clic en el cuadro de paginación y en "Hacer clic para paginar" para probar si funciona bien para paginar a la página siguiente.
El XPath predeterminado para la paginación funciona bien en la mayoría de los casos, pero hay un problema al raspar los datos de la última página. En este caso, deberíamos revisar XPath para la "Paginación".
- Haz clic en el paso "Paginación" en el flujo de trabajo.
- Copiea y pega el XPath revisado en el cuadro de texto "Elemento Xpath": //button[contains(@jsaction,"pane.paginationSection.nextPage")][not(contains(@class,"button-disabled "))]
- Haz clic en "Hacer clic para paginar" en el flujo de trabajo.
- Haz clic en "Opciones"
- Ajusta el tiempo de espera de AJAX a "7 s" o más
- Haz clic en "Aplicar"
Tips! Si deseas obtener más información sobre AJAX, consulta esta guía: Tratar AJAX |
3) Crear un "Elemento de bucle"- para hacer clic en bucle en los elementos de la lista
- Haz clic en el primer bloque de empresa de la lista.
- Selecciona "Hacer clic en la URL" en el panel de Tips.
- Estableceel tiempo de espera de AJAX de 5 a 10 s
- Luego ve al final del flujo de trabajo y haz clic en "Opciones"
- Desmarca "Abrir en una nueva pestaña" y haz clic en "Aplicar".
- Haz clic en el nombre en el primer bloque de la lista que se muestra en la página.
- Haz clic en "Seleccionar todo"
- Haz clic en "Hacer clic en bucle en cada elemento"
- Configura el AJAX en 5s-10s
4) Extraer datos - para seleccionar los datos para la extracción
- Selecciona la información que desees en la página web
- Selecciona "Extraer el texto del elemento"
Ten en cuenta que Google es bastante estricto con el raspado de datos y tiene un código fuente muy difícil de leer, por lo que debemos revisar el elemento XPath para cada campo de datos para garantizar el raspado con precisión.
¡No hay problema! Hemos preparado todo lo que necesitas para ti. Puedes usar el elemento XPath que se proporciona a continuación.
- Ve a la vista previa de datos y haz clic en "Más"
- Haz clic en "Personalizar Xpath"
- Reemplaza el XPath predeterminado por el revisado.
Puedes elegir según tus necesidades de raspado. XPath es para hacer coincidir los elementos que se pueden encontrar en la página web.
-
- Título: //h1
- Rating: //ol[@class="section-star-array"]/preceding-sibling::span
- Número de reseñas: //button[@jsaction="pane.rating.moreReviews"]
- Categoría: //button[@jsaction="pane.rating.category"]
- Dirección: //button[@data-item-id="address"]
- Sitio web: //button[@data-item-id="authority"]
- Teléfono: //button[contains(@data-item-id,"phone")]
- Horario: //div[contains(@class,"open-hours")]
- Haz clic en "Aplicar" para guardar
Tips! Si deseas obtener más información sobre XPath, consulta el siguiente tutorial: |
5) Extraer de datos a nivel de página - para extraer coordenadas GPS (opcional)
Como muchos de vosotros habéis solicitado, este paso te enseñará cómo extraer datos de coordenadas GPS de Google Maps.
Las coordenadas están realmente ocultas en la URL de la página. Entonces, primero, necesitamos extraer la URL de la página en el bucle.
- Haz clic en el icono "Agregar campo personalizado" en la sección de vista previa de datos.
- Selecciona "Datos a nivel de página" y luego "Página URL"
A continuación, necesitamos hacer coincidir las coordenadas de la URL de la página con la herramienta RegEx.
- Haz clic en los tres puntos del campo de datos Página URL y selecciona "Reformatear datos".
- Haz clic en "+ Agregar paso" y luego en "Coincidir con Expresión Regular"
Prueba la herramienta RegEx si no quieres escribir expresiones regulares tú mismo.
- Ingresa los siguientes parámetros y marca "Coincidir con todos",
- Marca la casilla "Resultados" para ver si los datos están en nuestro formato deseado
- Haz clic en "Aplicar" para guardar la configuración
6) Hacer clic en el elemento - hacer clic en "Volver a los resultados"
Normalmente, no necesitamos agregar esto, pero Google Maps es un caso especial. Esto es para ayudar a que la tarea vuelva a la página de resultados anterior y continúe raspando la página siguiente.
- Haz clic en el icono "Flecha" en la página web.
- Elige el botón "Hacer clic en el botón" en Tips
- Extiende el tiempo de espera de AJAX a 7s-10s según la condición de la red
- Arrastra la acción en el flujo de trabajo al lugar correcto
7) Iniciar extracción - para ejecutar la tarea y obtener datos
- Haz clic en "Guardar" para guardar la tarea.
- Haz clic en "Ejecutar" en la parte superior izquierda.
- Seleccione "Ejecutar tarea en tu dispositivo" para ejecutar la tarea en tu computadora
- Normalmente, las ejecuciones locales son para hacer pruebas. Si deseas que el rastreador se ejecute a mayor velocidad, puedes seleccionar "Ejecutar tarea en la nube" para ejecutar la tarea en la nube (solo para usuarios premium)
- ¡Comienza la prueba gratis del plan premium de 14 días de Octoparse!
- Normalmente, las ejecuciones locales son para hacer pruebas. Si deseas que el rastreador se ejecute a mayor velocidad, puedes seleccionar "Ejecutar tarea en la nube" para ejecutar la tarea en la nube (solo para usuarios premium)
Si tienes algún problema en extraer datos de Google Maps, no dudes en escribir a nuestro equipo de Soporte. Nos pondremos en contacto contigo dentro de 24 horas.
Comentarios
0 comentarios
Inicie sesión para dejar un comentario.