Google Maps no es solo un sitio web de mapas para ayudarte a encontrar la ubicación, sino también una poderosa base de datos donde puedes obtener una gran cantidad de información empresarial. Muchas personas recopilan datos de Google Maps para agregar su propio directorio comercial o crear una base de clientes potenciales comerciales.
Este tutorial te guiará sobre cómo obtener información comercial de Google Maps.
Primero, déjame presentar la manera más fácil - Plantilla de Google Maps.
Con las plantillas, solo necesitas ingresar una palabra clave (por ejemplo, Bufete en Madrid) y luego espera a que salgan los datos.
Aquí está la muestra de datos de la plantilla. Para probar la plantilla, puedes solicitar una prueba premium de 14 días para comenzar: ¡Comienza la prueba gratis del plan premium de 14 días de Octoparse!
Si quieres aprender cómo configurar un rastreador por tu parte, puedes continuar con este tutorial: https://www.google.es/maps/search/bufete+de+abgado+en+Madrid/@40.4281148,-3.7830385,12z/data=!3m1!4b1?hl=es
Vamos a extraer los siguientes campos de datos: Título, Número de revisión, Rating, Dirección, Teléfono, Sitio web, Horario.
Estos son los principales pasos en este tutorial:
1) Ir a la página web - para abrir la página web de destino
Ingresa la URL de ejemplo en la barra de búsqueda y haz clic en "Empezar".
Si tienes muchas URLs para raspar, puedes ingresar varias URLs en la barra. Para obtener más información sobre "Abrir página web", consulte esta guía: Ingresar URLs por lotes
Ingresa la URL de ejemplo en la barra de búsqueda y haz clic en "Empezar".
Si tienes muchas URLs para raspar, puedes ingresar varias URLs en la barra. Para obtener más información sobre "Abrir página web", consulte esta guía: Ingresar URLs por lotes
Haz clic en "Ir a la página web" y establece un tiempo de espera más largo en la parte inferior, como "120 s", luego haz clic en "Aplicar".
2) Crear un bucle de paginación - para extraer todos los resultados de varias páginas
Haz clic en el botón de la página siguiente ">"
Haz clic en "Hacer clic en bucle en un solo elemento" en el panel de Tips.
Después de las acciones anteriores, se crea una "Paginación" en el flujo de trabajo. Puedes hacer clic en el cuadro de paginación y en "Hacer clic para paginar" para probar si funciona bien para paginar a la página siguiente.
El XPath predeterminado para la paginación funciona bien en la mayoría de los casos, pero hay un problema al raspar los datos de la última página. En este caso, deberíamos revisar XPath para la "Paginación".
Haz clic en el paso "Paginación" en el flujo de trabajo.
Copiea y pega el XPath revisado en el cuadro de texto "Elemento Xpath": //button[contains(@jsaction,"pane.paginationSection.nextPage")][not(contains(@class,"button-disabled "))]
Acción adicional - Configurar AJAX para "Hacer clic para paginar"
A veces, la página web puede tardar más en cargarse. Puedes modificar el tiempo de espera de AJAX según las condiciones de la red.
Haz clic en "Hacer clic para paginar" en el flujo de trabajo.
Haz clic en "Opciones"
Ajusta el tiempo de espera de AJAX a "7 s" o más
Haz clic en "Aplicar"
Tips!
Si deseas obtener más información sobre AJAX, consulta esta guía: Tratar AJAX |
3) Crear un "Elemento de bucle"- para hacer clic en bucle en los elementos de la lista
Haz clic en el primer bloque de empresa de la lista.
Selecciona "Hacer clic en la URL" en el panel de Tips.
Estableceel tiempo de espera de AJAX de 5 a 10 s
Luego ve al final del flujo de trabajo y haz clic en "Opciones"
Desmarca "Abrir en una nueva pestaña" y haz clic en "Aplicar".
Haz clic en el nombre en el primer bloque de la lista que se muestra en la página.
Haz clic en "Seleccionar todo"
Haz clic en "Hacer clic en bucle en cada elemento"
Configura el AJAX en 5s-10s
4) Extraer datos - para seleccionar los datos para la extracción
Selecciona la información que desees en la página web
Selecciona "Extraer el texto del elemento"
Ten en cuenta que Google es bastante estricto con el raspado de datos y tiene un código fuente muy difícil de leer, por lo que debemos revisar el elemento XPath para cada campo de datos para garantizar el raspado con precisión.
¡No hay problema! Hemos preparado todo lo que necesitas para ti. Puedes usar el elemento XPath que se proporciona a continuación.
Ve a la vista previa de datos y haz clic en "Más"
Haz clic en "Personalizar Xpath"
Reemplaza el XPath predeterminado por el revisado.
Puedes elegir según tus necesidades de raspado. XPath es para hacer coincidir los elementos que se pueden encontrar en la página web.
Título: //h1
Rating: //ol[@class="section-star-array"]/preceding-sibling::span
Número de reseñas: //button[@jsaction="pane.rating.moreReviews"]
Categoría: //button[@jsaction="pane.rating.category"]
Dirección: //button[@data-item-id="address"]
Sitio web: //button[@data-item-id="authority"]
Teléfono: //button[contains(@data-item-id,"phone")]
Horario: //div[contains(@class,"open-hours")]
Haz clic en "Aplicar" para guardar
Tips!
Si deseas obtener más información sobre XPath, consulta el siguiente tutorial:
|
5) Extraer de datos a nivel de página - para extraer coordenadas GPS (opcional)
Como muchos de vosotros habéis solicitado, este paso te enseñará cómo extraer datos de coordenadas GPS de Google Maps.
Las coordenadas están realmente ocultas en la URL de la página. Entonces, primero, necesitamos extraer la URL de la página en el bucle.
Haz clic en el icono "Agregar campo personalizado" en la sección de vista previa de datos.
Selecciona "Datos a nivel de página" y luego "Página URL"
A continuación, necesitamos hacer coincidir las coordenadas de la URL de la página con la herramienta RegEx.
Haz clic en los tres puntos del campo de datos Página URL y selecciona "Reformatear datos".
Haz clic en "+ Agregar paso" y luego en "Coincidir con Expresión Regular"
Prueba la herramienta RegEx si no quieres escribir expresiones regulares tú mismo.
Ingresa los siguientes parámetros y marca "Coincidir con todos",
Marca la casilla "Resultados" para ver si los datos están en nuestro formato deseado
Haz clic en "Aplicar" para guardar la configuración
6) Hacer clic en el elemento - hacer clic en "Volver a los resultados"
Normalmente, no necesitamos agregar esto, pero Google Maps es un caso especial. Esto es para ayudar a que la tarea vuelva a la página de resultados anterior y continúe raspando la página siguiente.
Haz clic en el icono "Flecha" en la página web.
Elige el botón "Hacer clic en el botón" en Tips
Extiende el tiempo de espera de AJAX a 7s-10s según la condición de la red
Arrastra la acción en el flujo de trabajo al lugar correcto
7) Iniciar extracción - para ejecutar la tarea y obtener datos
Haz clic en "Guardar" para guardar la tarea.
Haz clic en "Ejecutar" en la parte superior izquierda.
Seleccione "Ejecutar tarea en tu dispositivo" para ejecutar la tarea en tu computadora
Normalmente, las ejecuciones locales son para hacer pruebas. Si deseas que el rastreador se ejecute a mayor velocidad, puedes seleccionar "Ejecutar tarea en la nube" para ejecutar la tarea en la nube (solo para usuarios premium)
Si tienes algún problema en extraer datos de Google Maps, no dudes en escribir a nuestro equipo de Soporte. Nos pondremos en contacto contigo dentro de 24 horas.