Todas las colecciones
Tutorial de Casos
E-Commerce
Scrapear reseñas de productos desde Amazon
Scrapear reseñas de productos desde Amazon
Actualizado hace más de una semana

Las reseñas online pueden ayudar al comprador a elegir el producto correcto o al vendedor a mejorar su producto y servicio. En este tutorial, te mostraremos cómo scrapear las reseñas de productos de Amazon.com.

Para la extracción de URL de productos de Amazon, puedes utilizar la "Plantilla de tareas" en la pantalla de inicio para obtener algunas URLs de productos. Todo lo que necesitas es rellenar varios parámetros (palabras clave) y la tarea está lista para comenzar. Para más detalles, puedes consultar aquí: Plantillas de Tarea

121612..png

Scrapeamos datos como el nombre de los clientes, la calificación, el título, la hora y el contenido de la reseña de la página de detalles del producto con Octoparse.

Estos son los pasos principales de este tutorial: [Descargar archivo de tarea aquí]

1) Abrir la página web de destino

  • Ingresa la URL en la página de inicio y haz clic en Iniciar

96551515151.png

2) Hacer clic en el botón "Ver todas las reseñas"

  • Desplaza la página hacia abajo para encontrar el botón "Ver todas las reseñas".

  • Haz clic en él y elige "Hacer clic en URL" en Tips de Acción.

2.png

3) Detectar automáticamente la página web para generar el flujo de trabajo

  • Haz clic en "Detectar automáticamente los datos de la página web" y espera a que se complete la detección.

3.png

Tips!

A veces, puede que te encuentres con una detección de robot que necesita que ingreses el código de seguridad. En este caso, puedes hacer clic en

14651561.png

para volver a cargar la primera página. Si aún no funciona, puedes intentar cambiar al modo de navegador haciendo clic en

1495615615.png

en la parte superior derecha del navegador integrado. Y luego escribe el código para pasar la detección. Finalmente, haz clic en

19515.png

para volver al modo de selección.

  • Ve a "Vista previa de datos" para ver si está de acuerdo con la muestra actual de datos

    • Puedes eliminar los campos de datos innecesarios directamente haciendo clic en el icono

      mceclip13.png
    • También puedes modificar los nombres de los campos de datos aquí directamente haciendo clic en el icono

      mceclip14.png
4.png
  • Haz clic en "Crear flujo de trabajo".

5.1.png

4) Configurar el tiempo de espera de AJAX para "Hacer clic para paginar"

  • Haz clic en abrir la configuración de acción de "Hacer clic para paginar"

  • Marca "Cargar con AJAX" y selecciona 10 segundos como tiempo de espera de AJAX

    5.3.gif

5) Ejecutar la extracción: ejecuta tu tarea y obtendrás datos

  • Haz clic en Guardar"

  • Haz clic en "Ejecutar" en la parte superior izquierda

  • Selecciona "Run task on your device" para ejecutar la tarea en tu computadora, o selecciona"Run task in the cloud" para ejecutar la tarea en la nube (solo para usuarios de plan premium)

    5.2.png

Aquí está una muestra de datos.

mceclip0.png
¿Ha quedado contestada tu pregunta?