Las reseñas online pueden ayudar al comprador a elegir el producto correcto o al vendedor a mejorar su producto y servicio. En este tutorial, te mostraremos cómo scrapear las reseñas de productos de Amazon.com.
Antes de comenzar, debes preparar una URL de producto como esta: https://www.amazon.com/PlayStation-Portable-3000-System-Sony-PSP/dp/B001KMRN0M/ref=lp_11076481_1_1?s=videogames&ie=UTF8&qid=1601797632&sr=1-1
Para la extracción de URL de productos de Amazon, puedes utilizar la "Plantilla de tareas" en la pantalla de inicio para obtener algunas URLs de productos. Todo lo que necesitas es rellenar varios parámetros (palabras clave) y la tarea está lista para comenzar. Para más detalles, puedes consultar aquí: Plantillas de Tarea
Scrapeamos datos como el nombre de los clientes, la calificación, el título, la hora y el contenido de la reseña de la página de detalles del producto con Octoparse.
Estos son los pasos principales de este tutorial: [Descargar archivo de tarea aquí]
1) Abrir la página web de destino
Ingresa la URL en la página de inicio y haz clic en Iniciar
2) Hacer clic en el botón "Ver todas las reseñas"
Desplaza la página hacia abajo para encontrar el botón "Ver todas las reseñas".
Haz clic en él y elige "Hacer clic en URL" en Tips de Acción.
3) Detectar automáticamente la página web para generar el flujo de trabajo
Haz clic en "Detectar automáticamente los datos de la página web" y espera a que se complete la detección.
Tips!
A veces, puede que te encuentres con una detección de robot que necesita que ingreses el código de seguridad. En este caso, puedes hacer clic en
para volver a cargar la primera página. Si aún no funciona, puedes intentar cambiar al modo de navegador haciendo clic en
en la parte superior derecha del navegador integrado. Y luego escribe el código para pasar la detección. Finalmente, haz clic en
para volver al modo de selección. |
Ve a "Vista previa de datos" para ver si está de acuerdo con la muestra actual de datos
Haz clic en "Crear flujo de trabajo".
4) Configurar el tiempo de espera de AJAX para "Hacer clic para paginar"
Haz clic en abrir la configuración de acción de "Hacer clic para paginar"
Marca "Cargar con AJAX" y selecciona 10 segundos como tiempo de espera de AJAX
5) Ejecutar la extracción: ejecuta tu tarea y obtendrás datos
Haz clic en Guardar"
Haz clic en "Ejecutar" en la parte superior izquierda
Selecciona "Run task on your device" para ejecutar la tarea en tu computadora, o selecciona"Run task in the cloud" para ejecutar la tarea en la nube (solo para usuarios de plan premium)
Aquí está una muestra de datos.