Todas las colecciones
Tutorial de Casos
E-Commerce
Scrapear comentarios de Google Play
Scrapear comentarios de Google Play
Actualizado hace más de una semana

Google Play es un buen sitio web para recopilar reseñas de aplicaciones móviles. Las revisiones pueden ayudar a los usuarios a tomar una mejor decisión sobre qué aplicación usar, o impulsar a los desarrolladores para que mejoren sus aplicaciones.

En este tutorial, vamos a scrapear las reseñas de aplicaciones de Google Play.

Puedes visitar nuestra "Plantilla de tareas" en la pantalla de inicio de Octoparse. Todo lo que necesitas hacer es escribir varios parámetros y la tarea estará lista para comenzar. Para obtener más detalles, consulta: Plantillas de Tarea

mceclip0.jpg

Para continuar, necesitamos utilizar esta URL en el tutorial:

Scrapeamos datos como el nombre de usuario, el tiempo de reseña y el contenido de reseña de cada página de detalles de la APP con Octoparse.

El sitio web aplica desplazamiento infinito junto con un "Mostrar más" para cargar más reseñas. Después de desplazar la página hacia la parte inferior como 4 veces, se revelaría un botón "mostrar más" y si queremos seguir cargando reseñas, tenemos que hacer clic en el botón.

Estos son los pasos principales de este tutorial. [Descarga la tarea de demostración aquí

]

1. "Ir a la Página Web" - abrir la página web de destino

  • Ingresa la URL de la página en la pantalla de inicio y haz clic en Iniciar

mceclip1.jpg

2. Detectar automáticamente los datos de la página web - crear el flujo de trabajo

  • Elige "Detectar automáticamente los datos de la página web".

  • Espera a que se complete la detección

2_1.gif
    • Verifica los campos de datos en la Vista Previa de Datos, y también puedes eliminar los campos no deseados o cambiar el nombre de los campos si es necesario

1x2.png
  • Haz clic en "Editar" debajo de la opción "Agregar desplazamiento de página" en el panel de Tips.

  • Configura el tiempo de espera en 4-5 segundos (asegúrate de que el tiempo sea lo suficientemente largo para que la página cargue nuevas reseñas)

2.2.gif
  • Haz clic en "Crear workflow" en el panel de Tips

mceclip4.png

3. Hacer clic en bucle en el botón "Mostrar más" - cargar más reseñas

  • Elige "Haga clic en un botón 'Cargar más'" en el panel de Tips

  • Selecciona el botón "SHOW MORE" en la página web

Tips!

Primero debemos seleccionar el bloque grande del botón Mostrar más. Si seleccionamos el botón directamente, Octoparse puede hacer clic en él en lugar de seleccionarlo.

mceclip0.png

Luego hacemos clic en la flecha a la derecha de la última etiqueta DIV y elegimos DIV en la ventana emergente.

3.2.png
  • Configura la cantidad de clics según la cantidad de revisiones que necesites

  • Haz clic en "Confirmar"

3.gif
  • Haz clic en abrir la configuración de "Hacer clic en un botón Cargar más"

  • Configura AJAX Load como 5s

AJAX5.jpg
  • Configura "desplazarse hasta el final de la página", se repite 4 veces y espera 4 segundos entre cada desplazamiento

  • Haz clic en "Aceptar" para confirmar

mceclip2.jpg

4. Modificar el XPath de Loop Item1 - localizar el botón "Mostrar más" con precisión

  • Haz clic para abrir la configuración de "Loop Item1"

  • Ingresa el XPath //span[text()='Show More']/..

mceclip0.jpg

Tips!

Si quieres obtener más información sobre XPath, consulta el siguiente tutorial:

5. Ejecutar la extracción - ejecutar la tarea y obtener datos

  • Haz clic en "Guardar"

  • Haz clic en "Ejecutar" en la parte superior izquierda

  • Selecciona "Run task on your device" para ejecutar la tarea en tu computadora, o selecciona"Run task in the cloud" para ejecutar la tarea en la nube (solo para usuarios de plan premium)

mceclip1.jpg

Aquí tienes una muestra de datos.

mceclip0x2.png
¿Ha quedado contestada tu pregunta?