Scrapear las tiendas en línea como eBay o Amazon se han convertido en una fuente de datos de importancia crítica, que te permite hacer la comparación entre los productos de venta caliente a partir de precios, características y descripciones de productos, de manera conveniente. El raspado web de comercio electrónico es de gran importancia, ya que puede ayudarte a comparar los productos de venta caliente de diferentes tiendas en línea como eBay y Amazon en función de sus precios, características y descripciones de productos.
En este tutorial, aprenderás cómo extraer datos de productos de eBay.
Puedes ir a "Plantilla de Tareas" en la pantalla principal de Octoparse y comenzar directamente con las Plantillas de eBay para ahorrar tiempo. Con esta función, no es necesario configurar las tareas de raspado. Para más detalles, puedes consultar: Plantillas de Tarea
Si quieres saber cómo construir la tarea desde cero, puedes continuar leyendo el siguiente tutorial.
Recogeremos datos como el nombre, la condición, el precio y más información de la página de detalles del producto con Octoparse.
Para continuar, necesitamos esta URL en el tutorial:
https://www.ebay.com/sch/Digital-Cameras-/31388/i.html
Vamos a scrapear la información del producto de "cámara digital" en eBay. Consulta los pasos principales en el tutorial a continuación. [Descarga archivo de tarea ]
- "Ir a la Página Web" - abrir la página web de destino
- Detectar automáticamente los datos de la página web - crear el flujo de trabajo
- Seleccionar el enlace para extraer datos en la página de detalles
- Extraer datos en la página de detalles del producto
- Modificar el XPath de los campos de datos
- Iniciar la extracción - ejecutar la tarea y obtener los datos
1. "Ir a la Página Web" - abrir la página web de destino
- Introduce la URL de ejemplo y haz clic en "Empezar".
2. Detectar automáticamente los datos de la página web - crear el flujo de trabajo
- Haz clic en "Detectar automáticamente los datos de la página web" y espera a que se complete la detección.
- Elimina los campos no deseados o modifica los nombres de los campos en la Vista Previa de Datos
- Elige "Crear flujo de trabajo" en el panel de Tips.
Ahora, obtendrás un flujo de trabajo como se muestra a continuación.
3. Selecciona el enlace para extraer datos en la página de detalles
- Elige "Hacer clic en los vínculos para extraer las páginas vinculadas".
- Elige "Title_URL" en la opción desplegable
- Elige "Confirmar"
Octoparse iría automáticamente a la primera página de detalles del producto.
4. Extraer datos en la página de detalles del producto
- Elige "Detectar automáticamente datos de páginas web".
- Si Octoparse detecta los datos que necesitas, elige "Crear flujo de trabajo"
- Si no, elige "Cancelar"
- Haz clic en los elementos que desees y elige "Extraer el texto del elemento“.
- Haz clic en
para modificar el nombre del campo si es necesario
Tips! Puedes modificar el paso de "Extraer datos" haciendo doble clic en él en el flujo de trabajo. Consulta los siguientes tutoriales para obtener más detalles: |
5. Modificar el XPath de los campos de datos
Puede que necesites modificar el XPath de algunos campos de datos que no se muestran en cada página de producto, o la posición del campo varía de una página a otra, como MPN o UPC. Podemos modificar XPath para hacer que el raspado de datos sea más preciso. ¡No te preocupes! Hemos preparado algunos XPath de uso frecuente para ti. Puedes usar el XPath del elemento que se proporciona a continuación.
- Haz doble clic en "Extraer Datos1"
- Haz clic en la opción "Modificar XPath" de un campo
- Reemplaza el XPath con el revisado (puedes elegir según tus necesidades de raspado. XPath es para hacer coincidir los elementos que se pueden encontrar en la página web).
- MPN: //td[contains(text(),'MPN')]/following-sibling::td[1]
- EAN: //td[contains(text(),'EAN')]/following-sibling::td[1]
- UPC: //td[contains(text(),'UPC')]/following-sibling::td[1]
- Item Weight: //td[contains(text(),'Item Weight')]/following-sibling::td[1]
- Haz clic en "Aceptar" para guardar
Tips! Puedes consultar los tutoriales de XPath a continuación para escribir XPath para otros campos si es necesario: |
5. Ejecutar la extracción - ejecutar tu tarea y obtener datos
- Haz clic en Guardar"
- Haz clic en "Ejecutar" en la parte superior izquierda
- Selecciona "Run task on your device" para ejecutar la tarea en tu computadora, o selecciona"Run task in the cloud" para ejecutar la tarea en la nube (solo para usuarios de plan premium)
Aquí tienes una muestra de datos.
Si tienes alguna duda en configurar tu tarea, no dudes en enviar un ticket a nuestro equipo de Soporte.
Comentarios
0 comentarios
Inicie sesión para dejar un comentario.