Las reseñas online pueden ayudar al comprador a elegir el producto correcto o al vendedor a mejorar su producto y servicio. En este tutorial, te mostraremos cómo scrapear las reseñas de productos de Amazon.com.
Antes de comenzar, debes preparar una URL de producto como esta: https://www.amazon.com/PlayStation-Portable-3000-System-Sony-PSP/dp/B001KMRN0M/ref=lp_11076481_1_1?s=videogames&ie=UTF8&qid=1601797632&sr=1-1
Para la extracción de URL de productos de Amazon, puedes utilizar la "Plantilla de tareas" en la pantalla de inicio para obtener algunas URLs de productos. Todo lo que necesitas es rellenar varios parámetros (palabras clave) y la tarea está lista para comenzar. Para más detalles, puedes consultar aquí: Plantillas de Tarea
Scrapeamos datos como el nombre de los clientes, la calificación, el título, la hora y el contenido de la reseña de la página de detalles del producto con Octoparse.
Estos son los pasos principales de este tutorial: [Descargar archivo de tarea aquí]
- Abrir la página web de destino
- Hacer clic en el botón "Ver todas las reseñas"
- Detectar automáticamente la página web para generar el flujo de trabajo
- Configurar el tiempo de espera de AJAX para "Hacer clic para paginar"
- Ejecutar la extracción: ejecutar tu tarea y obtener datos
1) Abrir la página web de destino
- Ingresa la URL en la página de inicio y haz clic en Iniciar
2) Hacer clic en el botón "Ver todas las reseñas"
- Desplaza la página hacia abajo para encontrar el botón "Ver todas las reseñas".
- Haz clic en él y elige "Hacer clic en URL" en Tips de Acción.
3) Detectar automáticamente la página web para generar el flujo de trabajo
- Haz clic en "Detectar automáticamente los datos de la página web" y espera a que se complete la detección.
Tips! A veces, puede que te encuentres con una detección de robot que necesita que ingreses el código de seguridad. En este caso, puedes hacer clic en |
- Ve a "Vista previa de datos" para ver si está de acuerdo con la muestra actual de datos
- Puedes eliminar los campos de datos innecesarios directamente haciendo clic en el icono
- También puedes modificar los nombres de los campos de datos aquí directamente haciendo clic en el icono
- Puedes eliminar los campos de datos innecesarios directamente haciendo clic en el icono
- Haz clic en "Crear flujo de trabajo".
4) Configurar el tiempo de espera de AJAX para "Hacer clic para paginar"
- Haz clic en abrir la configuración de acción de "Hacer clic para paginar"
- Marca "Cargar con AJAX" y selecciona 10 segundos como tiempo de espera de AJAX
5) Ejecutar la extracción: ejecuta tu tarea y obtendrás datos
- Haz clic en Guardar"
- Haz clic en "Ejecutar" en la parte superior izquierda
- Selecciona "Run task on your device" para ejecutar la tarea en tu computadora, o selecciona"Run task in the cloud" para ejecutar la tarea en la nube (solo para usuarios de plan premium)
Aquí está una muestra de datos.
Si tienes alguna duda en configurar tu tarea, no dudes en enviar un ticket a nuestro equipo de Soporte.
Comentarios
1 comentario
no son correctos estos pasos, pido que pongan el paso a paso de esta accion ya que en la version 8 no es asi. saludos
Inicie sesión para dejar un comentario.