Google Maps no es solo un sitio web de mapas para ayudarte a encontrar la ubicación, sino también una base de datos donde puedes encontrar una gran cantidad de información empresarial. Muchas personas recopilan datos de Google Maps para agregar su propio directorio comercial o crear una base de clientes potenciales comerciales.
Este tutorial te guiará sobre cómo obtener información comercial de Google Maps.
Primero, déjame presentarte la forma más fácil - Plantilla de Google Maps.
Con la (s) plantilla (s), solo necesitas ingresar una palabra clave (por ejemplo, Accounting, NY) o la URL de una página web (por ejemplo,https://www.google.com/maps/search/insurance+West+University+Place,+TX/@29.716598,-95.4987615,10z/data=!3m1!4b1) y luego espera a que salgan los datos.
Aquí está la muestra de datos de la plantilla para tu referencia. Para probar la plantilla, puedes solicitar una prueba premium de 14 días para comenzar: ¡Solicita una prueba gratuita de 14 días!
Si quieres aprender cómo configurar el rastreador por tu cuenta, puedes continuar con este tutorial.
URL de ejemplo:
Open time.Scrapearemos los campos de datos: Título, Número de reseñas, Calificación de reseñas, Dirección, Teléfono, Sitio web, Tiempo abierto.
Estos son los pasos principales de este tutorial: [Descargar archivo de tarea aquí]
- Ir a la página web - para abrir la página web de destino
- Crear un bucle de paginación - para extraer todos los resultados de varias páginas
- Crear un "elemento de bucle" - para repetir todos los elementos de la página actual
- Extraer datos - para seleccionar los datos para la extracción
- Hacer clic en el elemento - hacer clic en "Volver a los resultados"
- Iniciar extracción - para ejecutar la tarea y obtener datos
1) Ir a la página web - para abrir la página web de destino
- Ingresa la URL de ejemplo en la barra de búsqueda y haz clic en "Iniciar".
Si tienes muchas URLs para scrapear, puedes ingresar varias URLs en la barra. Para obtener más información sobre "Abrir página web", consulta este tutorial: Ir a la página web
- Haz doble clic en "Ir a la página web" y establece un tiempo de espera más largo, como "120s"
2) Crear un bucle de paginación - para extraer todos los resultados de varias páginas
- Haz clic en el botón de la página siguiente ">"
- Haz clic en "Hacer clic en bucle en un solo elemento" en el panel de Tips.
Después de las acciones anteriores, se crea una "Paginación" en el flujo de trabajo. Puedes hacer clic en el cuadro de paginación y en "Hacer clic para paginar" para probar si funciona bien para paginar a la página siguiente.
El XPath predeterminado para la paginación funciona bien en la mayoría de los casos, pero tiene un problema para scrapear los datos de la última página. En este caso, es posible que debas revisar XPath para la "Paginación".
- Haz doble clic en el paso "Paginación" o haz clic en el
- Copia y pega el XPath revisado en el cuadro de texto://button[contains(@jsaction,"pane.paginationSection.nextPage")][not(contains(@class,"button-disabled"))]
- Haz doble clic en "Hacer clic para paginar".
- Ajusta el tiempo de espera de AJAX a "7 s" o más

Tips! Si quieres obtener más información sobre AJAX, consulta este tutorial: Tratar AJAX |
3) Crear un "elemento de bucle" - para repetir todos los elementos de la página actual
- Haz clic en el primer y segundo título de la lista hasta que Octoparse detecte todos los demás elementos similares
- Haz clic en "Hacer clic en bucle en cada elemento" en el panel de Tips.
Después de las acciones anteriores, se genera un "Elemento de bucle" en el flujo de trabajo. Además, se abre la página del primer elemento.
Luego, necesitamos hacer algunos ajustes en el "Elemento de bucle".
- Haz doble clic en "Elemento de bucle"
- Cambiar el modo de bucle de "Lista fija" a "Lista de variables"
- Ingresa el XPath del elemento: //h3
También necesitamos modificar la configuración de Hacer Clic en el Elemento.
- Haz doble clic en "Hacer clic en el elemento"
- Desmarca la opción "Abrir en una nueva pestaña"
- Ajusta el tiempo de espera de AJAX a "10 s" (puedes configurarlo según la condición de tu red local si lo ejecutas en tu dispositivo local)
4) Extraer datos - para seleccionar los datos para la extracción.
Ahora estás en la página de detalles de la empresa.
- Haz clic en la información que necesitas en la página, como el título, la dirección, etc.
- Selecciona "Extraer el texto del elemento seleccionado" en el panel "Tips".
- Sigue repitiendo hasta que obtengas todos los campos de datos que necesita
- Haz doble clic en el paso "Extraer datos" del flujo de trabajo.
- Haz clic en los nombres de los campos para cambiar el nombre de los campos si es necesario
Google es bastante estricto con el raspado de datos y tiene un código fuente muy difícil de leer, por lo que necesitamos revisar el elemento XPath para cada campo de datos.
¡No te preocupes! Hemos preparado todo lo que necesitas para ti. Puedes usar el XPath del elemento que se muestra a continuación.
- Haz clic en el icono
para modificar el XPath uno por uno
- Reemplaza el XPath predeterminado por el revisado (puede elegir según tus necesidades de raspado. XPath es para hacer coincidir los elementos que se pueden encontrar en la página web).
- Title: //h1
- Number of review: //button[@jsaction="pane.rating.moreReviews"]
- Review rating: //span[@class="section-star-display"]
- Category: //button[@jsaction="pane.rating.category"]
- Address: //button[@data-item-id="address"]
- Website: //button[@data-item-id="authority"]
- Phone number: //button[contains(@data-item-id,"phone")]
- Open time: //div[contains(@class,"open-hours")]
- Haz clic en "Aceptar" para guardar
Tips! Si quieres aprender más sobre XPath, consulta el siguiente tutorial: |
5) Hacer clic en Elemento - Hacer clic en "Volver a los resultados"
Normalmente, no necesitamos agregar esto, pero Google Maps es un caso especial. Esto es para ayudar a que la tarea vuelva a la página de resultados anterior y continúe scrapeando el siguiente elemento.
- Haz clic en el botón "Volver a los resultados" en la página web.
- Elige "Hacer clic en el botón" en Tips de acciones
- Extiende el tiempo de espera de AJAX de 7 a 10 segundos según la condición de la red
6) Iniciar extracción - para ejecutar la tarea y obtener datos
- Haz clic en "Guardar" para guardar la tarea.
- Haz clic en "Ejecutar" en la parte superior izquierda
- Selecciona "Ejecutar la tarea en tu dispositivo" para ejecutar la tarea en tu computadora
- Las ejecuciones locales son normalmente para pruebas. Si quieres que el rastreador se ejecute a mayor velocidad, puedes seleccionar "Ejecutar tarea en la nube" para ejecutar la tarea en la nube (solo para usuarios premium)
- ¡Solicita una prueba gratuita de 14 días!
Aquí tienes una muestra de datos.
Comentarios
0 comentarios
Inicie sesión para dejar un comentario.