Google Play es un buen sitio web para recopilar reseñas de aplicaciones móviles. Las revisiones pueden ayudar a los usuarios a tomar una mejor decisión sobre qué aplicación usar, o impulsar a los desarrolladores para que mejoren sus aplicaciones.
En este tutorial, vamos a scrapear las reseñas de aplicaciones de Google Play.
Puedes visitar nuestra "Plantilla de tareas" en la pantalla de inicio de Octoparse. Todo lo que necesitas hacer es escribir varios parámetros y la tarea estará lista para comenzar. Para obtener más detalles, consulta: Plantillas de Tarea
Para continuar, necesitamos utilizar esta URL en el tutorial:
https://play.google.com/store/apps/details?id=com.target.ui&hl=en&showAllReviews=true
Scrapeamos datos como el nombre de usuario, el tiempo de reseña y el contenido de reseña de cada página de detalles de la APP con Octoparse.
El sitio web aplica desplazamiento infinito junto con un "Mostrar más" para cargar más reseñas. Después de desplazar la página hacia la parte inferior como 4 veces, se revelaría un botón "mostrar más" y si queremos seguir cargando reseñas, tenemos que hacer clic en el botón.
Estos son los pasos principales de este tutorial. [Descarga la tarea de demostración aquí]
- "Ir a la Página Web" - abrir la página web de destino
- Detectar automáticamente los datos de la página web - crear el flujo de trabajo
- Hacer clic en buble en el botón "Mostrar más" - cargar más reseñas
- Modificar el XPath de Loop Item1 - localizar el botón "Mostrar más" con precisión
- Ejecutar la extracción - ejecutar tu tarea y obtener datos
1. "Ir a la Página Web" - abrir la página web de destino
- Ingresa la URL de la página en la pantalla de inicio y haz clic en Iniciar
2. Detectar automáticamente los datos de la página web - crear el flujo de trabajo
- Elige "Detectar automáticamente los datos de la página web".
- Espera a que se complete la detección
-
- Verifica los campos de datos en la Vista Previa de Datos, y también puedes eliminar los campos no deseados o cambiar el nombre de los campos si es necesario
- Haz clic en "Editar" debajo de la opción "Agregar desplazamiento de página" en el panel de Tips.
- Configura el tiempo de espera en 4-5 segundos (asegúrate de que el tiempo sea lo suficientemente largo para que la página cargue nuevas reseñas)
- Haz clic en "Crear workflow" en el panel de Tips
3. Hacer clic en bucle en el botón "Mostrar más" - cargar más reseñas
- Elige "Haga clic en un botón 'Cargar más'" en el panel de Tips
- Selecciona el botón "SHOW MORE" en la página web
Tips! Primero debemos seleccionar el bloque grande del botón Mostrar más. Si seleccionamos el botón directamente, Octoparse puede hacer clic en él en lugar de seleccionarlo. Luego hacemos clic en la flecha a la derecha de la última etiqueta DIV y elegimos DIV en la ventana emergente. |
- Configura la cantidad de clics según la cantidad de revisiones que necesites
- Haz clic en "Confirmar"
- Haz clic en abrir la configuración de "Hacer clic en un botón Cargar más"
- Configura AJAX Load como 5s
- Configura "desplazarse hasta el final de la página", se repite 4 veces y espera 4 segundos entre cada desplazamiento
- Haz clic en "Aceptar" para confirmar
4. Modificar el XPath de Loop Item1 - localizar el botón "Mostrar más" con precisión
- Haz clic para abrir la configuración de "Loop Item1"
- Ingresa el XPath //span[text()='Show More']/..
Tips! Si quieres obtener más información sobre XPath, consulta el siguiente tutorial: |
5. Ejecutar la extracción - ejecutar la tarea y obtener datos
- Haz clic en "Guardar"
- Haz clic en "Ejecutar" en la parte superior izquierda
- Selecciona "Run task on your device" para ejecutar la tarea en tu computadora, o selecciona"Run task in the cloud" para ejecutar la tarea en la nube (solo para usuarios de plan premium)
Aquí tienes una muestra de datos.
Si tienes alguna duda en configurar tu tarea, no dudes en enviar un ticket a nuestro equipo de Soporte.
Comentarios
0 comentarios
Inicie sesión para dejar un comentario.