Todas las colecciones
Tutorial de Casos
E-Commerce
Extraer información comercial de Google Maps
Extraer información comercial de Google Maps
Actualizado hace más de una semana

Google Maps no es solo un sitio web de mapas para ayudarte a encontrar la ubicación, sino también una poderosa base de datos donde puedes obtener una gran cantidad de información empresarial. Muchas personas recopilan datos de Google Maps para agregar su propio directorio comercial o crear una base de clientes potenciales comerciales.

Este tutorial te guiará sobre cómo obtener información comercial de Google Maps.

Primero, déjame presentar la manera más fácil - Plantilla de Google Maps.

Con las plantillas, solo necesitas ingresar una palabra clave (por ejemplo, Bufete en Madrid) y luego espera a que salgan los datos.

mceclip0.png

Aquí está la muestra de datos de la plantilla. Para probar la plantilla, puedes solicitar una prueba premium de 14 días para comenzar: ¡Comienza la prueba gratis del plan premium de 14 días de Octoparse!

mceclip2.png

Si quieres aprender cómo configurar un rastreador por tu parte, puedes continuar con este tutorial: https://www.google.es/maps/search/bufete+de+abgado+en+Madrid/@40.4281148,-3.7830385,12z/data=!3m1!4b1?hl=es

Vamos a extraer los siguientes campos de datos: Título, Número de revisión, Rating, Dirección, Teléfono, Sitio web, Horario.

Estos son los principales pasos en este tutorial:

1) Ir a la página web - para abrir la página web de destino

  • Ingresa la URL de ejemplo en la barra de búsqueda y haz clic en "Empezar".

Si tienes muchas URLs para raspar, puedes ingresar varias URLs en la barra. Para obtener más información sobre "Abrir página web", consulte esta guía: Ingresar URLs por lotes

  • Ingresa la URL de ejemplo en la barra de búsqueda y haz clic en "Empezar".

Si tienes muchas URLs para raspar, puedes ingresar varias URLs en la barra. Para obtener más información sobre "Abrir página web", consulte esta guía: Ingresar URLs por lotes

  • Haz clic en "Ir a la página web" y establece un tiempo de espera más largo en la parte inferior, como "120 s", luego haz clic en "Aplicar".

2) Crear un bucle de paginación - para extraer todos los resultados de varias páginas

  • Haz clic en el botón de la página siguiente ">"

  • Haz clic en "Hacer clic en bucle en un solo elemento" en el panel de Tips.

Después de las acciones anteriores, se crea una "Paginación" en el flujo de trabajo. Puedes hacer clic en el cuadro de paginación y en "Hacer clic para paginar" para probar si funciona bien para paginar a la página siguiente.

El XPath predeterminado para la paginación funciona bien en la mayoría de los casos, pero hay un problema al raspar los datos de la última página. En este caso, deberíamos revisar XPath para la "Paginación".

  • Haz clic en el paso "Paginación" en el flujo de trabajo.

  • Copiea y pega el XPath revisado en el cuadro de texto "Elemento Xpath": //button[contains(@jsaction,"pane.paginationSection.nextPage")][not(contains(@class,"button-disabled "))]

Paginaci_n_para_Google_Maps_ES_.gif

Acción adicional - Configurar AJAX para "Hacer clic para paginar"

A veces, la página web puede tardar más en cargarse. Puedes modificar el tiempo de espera de AJAX según las condiciones de la red.

  • Haz clic en "Hacer clic para paginar" en el flujo de trabajo.

  • Haz clic en "Opciones"

  • Ajusta el tiempo de espera de AJAX a "7 s" o más

  • Haz clic en "Aplicar"

AJAX_para_Google_Maps.png

Tips!

Si deseas obtener más información sobre AJAX, consulta esta guía: Tratar AJAX

3) Crear un "Elemento de bucle"- para hacer clic en bucle en los elementos de la lista

  • Haz clic en el primer bloque de empresa de la lista.

  • Selecciona "Hacer clic en la URL" en el panel de Tips.

mceclip1.png
  • Estableceel tiempo de espera de AJAX de 5 a 10 s

mceclip2.png
  • Luego ve al final del flujo de trabajo y haz clic en "Opciones"

  • Desmarca "Abrir en una nueva pestaña" y haz clic en "Aplicar".

mceclip3.png
  • Haz clic en el nombre en el primer bloque de la lista que se muestra en la página.

  • Haz clic en "Seleccionar todo"

  • Haz clic en "Hacer clic en bucle en cada elemento"

  • Configura el AJAX en 5s-10s

Elemento_de_bucle_para_Google_Maps_ES_.gif

4) Extraer datos - para seleccionar los datos para la extracción

  • Selecciona la información que desees en la página web

  • Selecciona "Extraer el texto del elemento"

Extraer_datos_de_Google_Maps_ES_.gif

Ten en cuenta que Google es bastante estricto con el raspado de datos y tiene un código fuente muy difícil de leer, por lo que debemos revisar el elemento XPath para cada campo de datos para garantizar el raspado con precisión.

¡No hay problema! Hemos preparado todo lo que necesitas para ti. Puedes usar el elemento XPath que se proporciona a continuación.

  • Ve a la vista previa de datos y haz clic en "Más"

  • Haz clic en "Personalizar Xpath"

mceclip4.png
  • Reemplaza el XPath predeterminado por el revisado.

Puedes elegir según tus necesidades de raspado. XPath es para hacer coincidir los elementos que se pueden encontrar en la página web.

    • Título: //h1

    • Rating: //ol[@class="section-star-array"]/preceding-sibling::span

    • Número de reseñas: //button[@jsaction="pane.rating.moreReviews"]

    • Categoría: //button[@jsaction="pane.rating.category"]

    • Dirección: //button[@data-item-id="address"]

    • Sitio web: //button[@data-item-id="authority"]

    • Teléfono: //button[contains(@data-item-id,"phone")]

    • Horario: //div[contains(@class,"open-hours")]

  • Haz clic en "Aplicar" para guardar

mceclip6.png

Tips!

Si deseas obtener más información sobre XPath, consulta el siguiente tutorial:

5) Extraer de datos a nivel de página - para extraer coordenadas GPS (opcional)

Como muchos de vosotros habéis solicitado, este paso te enseñará cómo extraer datos de coordenadas GPS de Google Maps.

Las coordenadas están realmente ocultas en la URL de la página. Entonces, primero, necesitamos extraer la URL de la página en el bucle.

  • Haz clic en el icono "Agregar campo personalizado" en la sección de vista previa de datos.

  • Selecciona "Datos a nivel de página" y luego "Página URL"

P_gina_URL_Google_Maps.png

A continuación, necesitamos hacer coincidir las coordenadas de la URL de la página con la herramienta RegEx.

  • Haz clic en los tres puntos del campo de datos Página URL y selecciona "Reformatear datos".

    mceclip7.png
  • Haz clic en "+ Agregar paso" y luego en "Coincidir con Expresión Regular"

Limpieza_de_datos_coordinados_Google_Maps.png

Prueba la herramienta RegEx si no quieres escribir expresiones regulares tú mismo.

  • Ingresa los siguientes parámetros y marca "Coincidir con todos",

  • Marca la casilla "Resultados" para ver si los datos están en nuestro formato deseado

  • Haz clic en "Aplicar" para guardar la configuración

mceclip8.png

6) Hacer clic en el elemento - hacer clic en "Volver a los resultados"

Normalmente, no necesitamos agregar esto, pero Google Maps es un caso especial. Esto es para ayudar a que la tarea vuelva a la página de resultados anterior y continúe raspando la página siguiente.

  • Haz clic en el icono "Flecha" en la página web.

mceclip9.png
  • Elige el botón "Hacer clic en el botón" en Tips

mceclip10.png
  • Extiende el tiempo de espera de AJAX a 7s-10s según la condición de la red

mceclip12.png
  • Arrastra la acción en el flujo de trabajo al lugar correcto

Arrastrar_paso_de_clic_Google_Maps_ES_.gif

7) Iniciar extracción - para ejecutar la tarea y obtener datos

  • Haz clic en "Guardar" para guardar la tarea.

  • Haz clic en "Ejecutar" en la parte superior izquierda.

  • Seleccione "Ejecutar tarea en tu dispositivo" para ejecutar la tarea en tu computadora

mceclip13.png

Si tienes algún problema en extraer datos de Google Maps, no dudes en escribir a nuestro equipo de Soporte. Nos pondremos en contacto contigo dentro de 24 horas.

¿Ha quedado contestada tu pregunta?