Google Play es un buen sitio web para recopilar reseñas de aplicaciones móviles. Las revisiones pueden ayudar a los usuarios a tomar una mejor decisión sobre qué aplicación usar, o impulsar a los desarrolladores para que mejoren sus aplicaciones.
En este tutorial, vamos a scrapear las reseñas de aplicaciones de Google Play.
Puedes visitar nuestra "Plantilla de tareas" en la pantalla de inicio de Octoparse. Todo lo que necesitas hacer es escribir varios parámetros y la tarea estará lista para comenzar. Para obtener más detalles, consulta: Plantillas de Tarea
Para continuar, necesitamos utilizar esta URL en el tutorial:
Scrapeamos datos como el nombre de usuario, el tiempo de reseña y el contenido de reseña de cada página de detalles de la APP con Octoparse.
El sitio web aplica desplazamiento infinito junto con un "Mostrar más" para cargar más reseñas. Después de desplazar la página hacia la parte inferior como 4 veces, se revelaría un botón "mostrar más" y si queremos seguir cargando reseñas, tenemos que hacer clic en el botón.
Estos son los pasos principales de este tutorial. [Descarga la tarea de demostración aquí
]
1. "Ir a la Página Web" - abrir la página web de destino
Ingresa la URL de la página en la pantalla de inicio y haz clic en Iniciar
2. Detectar automáticamente los datos de la página web - crear el flujo de trabajo
Elige "Detectar automáticamente los datos de la página web".
Espera a que se complete la detección
Verifica los campos de datos en la Vista Previa de Datos, y también puedes eliminar los campos no deseados o cambiar el nombre de los campos si es necesario
Haz clic en "Editar" debajo de la opción "Agregar desplazamiento de página" en el panel de Tips.
Configura el tiempo de espera en 4-5 segundos (asegúrate de que el tiempo sea lo suficientemente largo para que la página cargue nuevas reseñas)
Haz clic en "Crear workflow" en el panel de Tips
3. Hacer clic en bucle en el botón "Mostrar más" - cargar más reseñas
Elige "Haga clic en un botón 'Cargar más'" en el panel de Tips
Selecciona el botón "SHOW MORE" en la página web
Tips!
Primero debemos seleccionar el bloque grande del botón Mostrar más. Si seleccionamos el botón directamente, Octoparse puede hacer clic en él en lugar de seleccionarlo.
Luego hacemos clic en la flecha a la derecha de la última etiqueta DIV y elegimos DIV en la ventana emergente.
|
Configura la cantidad de clics según la cantidad de revisiones que necesites
Haz clic en "Confirmar"
Haz clic en abrir la configuración de "Hacer clic en un botón Cargar más"
Configura AJAX Load como 5s
Configura "desplazarse hasta el final de la página", se repite 4 veces y espera 4 segundos entre cada desplazamiento
Haz clic en "Aceptar" para confirmar
4. Modificar el XPath de Loop Item1 - localizar el botón "Mostrar más" con precisión
Haz clic para abrir la configuración de "Loop Item1"
Ingresa el XPath //span[text()='Show More']/..
Tips!
Si quieres obtener más información sobre XPath, consulta el siguiente tutorial:
|
5. Ejecutar la extracción - ejecutar la tarea y obtener datos
Haz clic en "Guardar"
Haz clic en "Ejecutar" en la parte superior izquierda
Selecciona "Run task on your device" para ejecutar la tarea en tu computadora, o selecciona"Run task in the cloud" para ejecutar la tarea en la nube (solo para usuarios de plan premium)
Aquí tienes una muestra de datos.