Como el rey de las aplicaciones de navegación, Google Maps comenzó ofreciendo una manera fácil de obtener direcciones de un lugar a otro, pero ha evolucionado continuamente hasta convertirse en una base de datos global interactiva repleta de la información comercial más valiosa disponible en Internet.
Sin embargo, si eres propietario de una empresa y deseas extraer reseñas de empresas o lugares de Google Maps, pronto descubrirás que la forma oficial de obtener reseñas a través de la API de Google Places está limitada a 5 reseñas, lo cual no es suficiente para hacer un análisis.
Pero no te preocupes, con Octoparse 8.5, ahora puedes crear tu propio rastreador y recopilar una cantidad ilimitada de reseñas para empresas o lugares directamente desde Google Maps en pocos minutos.
En este tutorial, te guiaremos a través de los pasos para diseñar tu propio flujo de trabajo de tareas para extraer reseñas de Google Maps.
Nota: Este tutorial solo funciona para la versión 8.4 y 8.5, ya que la tarea requiere la función Desplazamiento parcial recientemente agregada. Si tienes una versión anterior de Octoparse, te recomendamos encarecidamente que actualices a la última versión para disfrutar de esta nueva y poderosa función, así como de una interfaz de edición de tareas recientemente diseñada. |
To delve into the task properly, we will use Google Maps reviews for Restaurante Ático as an example.
Aquí se listan los pasos principales en este tutorial:
- Ir a la página web - para abrir la página web de destino
- Hacer clic en el elemento - para ir a la página "Todas las reseñas"
- Crear un Elemento de bucle con Desplazamiento Parcial - para desplazarse hacia abajo en la columna de revisión
- Extraer datos en el bucle - seleccionar los datos para la extracción
- Limpiar los campos de datos - refinar los datos
- Iniciar la extracción - ejecutar la tarea y obtener los datos
1. Ir a la página web - para abrir la página web de destino
- Ingresa la URL en la barra de búsqueda en la pantalla de inicio y haz clic en "Empezar".
También puedes ingresar la URL creando la tarea en Modo Avanzado.
- Busca el botón "+ Nuevo" en la barra lateral, haz clic en él y luego selecciona "Modo Avanzado".
- Ingresa manualmente la URL en el cuadro del sitio web y haz clic en "Guardar" para comenzar
De cualquier manera, verifica si se ha generado una acción "Ir a la página web" en el flujo de trabajo. Si tienes más de una URL, consulta este artículo para ver cómo Octoparse maneja una lista de URL.
2. Hacer clic en el elemento - para ir a la página "Todas las reseñas"
- Haz clic en "600 reseñas" que te dirigirá a la página "Todas las reseñas" y selecciona "Hacer clic en el botón" para generar una acción "Hacer clic en elemento" en tu flujo de trabajo
- Establece el tiempo de espera de AJAX en 15 segundos o más
3. Crear un Elemento de bucle con Desplazamiento Parcial - para desplazarse hacia abajo en la columna de revisión
Encontrarás que la nueva página tiene múltiples barras de desplazamiento y las revisiones que deseas están dentro de una columna desplazable a la izquierda. La página no cargará más revisiones a menos que te desplaces dentro de la columna izquierda, por lo tanto, debemos configurar un elemento de bucle con un desplazamiento parcial para que nuestro flujo de trabajo se desplace y extraiga al mismo tiempo.
- Agrega un paso "Elemento de bucle" a tu flujo de trabajo
- Haz clic en "Elemento de bucle", establece el modo de bucle en "Desplazamiento de página" y cambia el área de desplazamiento de "Predeterminado" a "Parcial"
- Ingresa el XPath del área de desplazamiento para decirle a Octoparse dónde desplazarse
Ingresa el XPath directamente si sabes cómo escribir un XPath. Consulta este artículo para embarcarse en su viaje para convertirse en un maestro de XPath.
¿No sabes cómo escribir un XPath? No te preocupes, no estás solo. Gracias a la última actualización, ahora puede simplemente hacer clic en el ícono y seleccionar el área de desplazamiento completa manualmente desde la página web. Octoparse generará automáticamente un XPath para ti.
Tips: Ajusta el área seleccionada para asegurarte de haber seleccionado toda el área desplazable (incluida la barra de desplazamiento). El XPath generado automáticamente e incluso los que escribes por tu cuenta no funcionarán bien todo el tiempo. ¡Aprende de pruebas y errores! |
- Elige entre desplazarse "hasta el final de la página" o "para una pantalla"
- Establece veces de repeticiones de desplazamiento (cuántas veces desea desplazarse)
- Establece un tiempo de espera (intervalo de tiempo entre cada desplazamiento)
- Haz clic en "Aplicar" para guardar tu configuración
4. Extraer datos en el bucle - seleccionar los datos para la extracción
Este paso es rápido y fácil con la innovadora función de detección automática de Octoparse.
- Haz clic en Detectar automáticamente los datos de la página web en el cuadro Tips y espera a que se complete
Note: Si por algún motivo, la detección automática no detecta la lista, también puedes seleccionar varios elementos similares en la página web para indicarle a Octoparse el patrón de selección. Consulta este artículo para ver cómo configurar una extracción de lista manualmente. |
- Cambia el nombre de los campos de datos que deseas y elimina los que no
En este caso, queremos extraer datos como Nombre, Fecha, Número de reseñas, Contenido de la reseña y Megusta que recibe cada comentario.
- Confirma la configuración dentro del cuadro "Tips" y haz clic en "Crear workflow"
- Asegúrate de que el elemento de bucle que crees (debe llamarse Elemento de bucle 1 de forma predeterminada) se coloque dentro del elemento de bucle anterior.
5. Limpiar los campos de datos - refinar los datos
Puedes notar que algunos datos en la columna "Número de reseñas" tienen un punto inútil delante de ellos. Usa "Reformatear datos" para eliminar los puntos de repuesto.
- Haz clic en los tres puntos para ver más opciones para los campos de datos
- Haz clic en "Reformatear datos"
- Haz clic en "+Agregar paso" y selecciona la opción "Reemplazar"
- Ingresa un punto en la barra "Reemplazar" y reemplázalo con un espacio en blanco (simplemente deje la barra "Con" en blanco)
- Haz clic en "Evaluar" para ver si hemos obtenido el resultado deseado
- Haz clic en "Confirmar" para aplicar el cambio
6. Iniciar la extracción - ejecutar la tarea y obtener los datos
- Haz clic en "Guardar" y "Ejecutar" en el lado superior izquierdo
- Selecciona "Ejecutar en el dispositivo" para ejecutar la tarea en tu computadora, o selecciona "Ejecutar en la nube" para ejecutarla en nuestros servidores en la nube (solo para usuarios premium)
Tip: Las ejecuciones locales son excelentes para revisar problemas de tareas y ejecuciones de manera rápida. Si se trata de tareas más complicadas, se recomienda que seleccione "Ejecutar en la nube" para ejecutar la tarea en la plataforma basada en la nube de Octoparse para una mayor velocidad. Prueba esta función premium registrándote para la prueba gratuita de 14 días aquí. También puedes configurar extracciones programadas y recibir datos regularmente. |
Si tienes algún problema en extraer reseñas de Google Maps, no dudes en escribir a nuestro equipo de Soporte. Nos pondremos en contacto contigo dentro de 24 horas.
Comentarios
0 comentarios
Inicie sesión para dejar un comentario.