Rastrear las tiendas en línea como eBay y Amazon se han convertido en una fuente de datos de importancia crítica, lo que te permite hacer la comparación entre los productos de venta caliente a partir de precios, características y descripciones de productos, de manera conveniente.
En este tutorial, aprenderás cómo extraer datos de productos de eBay.
Puedes ir a "Plantillas de tarea" en la pantalla principal de Octoparse y comenzar con la Plantilla de eBay directamente para ahorrar tiempo. Con esta función, no es necesario configurar las tareas de raspado. Para obtener más detalles, puedes consultar aquí: Plantillas de tarea
Aquí está la muestra de datos de la plantilla. Para probar la plantilla, puedes solicitar una prueba premium de 14 días para comenzar: ¡Comienza la prueba gratis del plan premium de 14 días de Octoparse!
Si quieres saber cómo construir la tarea desde cero, puedes continuar leyendo el siguiente tutorial. Extraeremos datos como nombre, condición, precio y más información de la página de detalles del producto con Octoparse.
Tomamos esta URL como ejemplo:
Vamos a raspar la información del producto de "cámara" en eBay. Consulta los pasos principales en el tutorial a continuación.
- "Ir a la página web" - abrir la página web de destino
- Detectar automáticamente los datos de la página web - crear el flujo de trabajo
- Seleccionar el enlace para extraer datos de la página de detalles
- Extraer datos de la página de detalles del producto
- Modificar XPath de los campos de datos
- Iniciar la extracción - ejecutar la tarea y obtener los datos
1. "Ir a la página web" - abrir la página web de destino
- Ingresa la URL de ejemplo y haz clic en "Empezar"
2. Detectar automáticamente los datos de la página web - crear el flujo de trabajo
- Haz clic en "Detectar automáticamente los datos de la página web" y espera a que se complete la detección.
- Elimina los campos no deseados o modifica los nombres de los campos en la Vista previa de datos
- Desmarca la casilla "Agregar un desplazamiento de página".
- Elige "Crear flujo de trabajo" en el panel de Tips.
Ahora obtendrás el flujo de trabajo a continuación.
Si todos los datos que necesitas se pueden extraer de la página de la lista, puede detener aquí y saltar a Iniciar extracción - ejecutar la tarea y obtener los datos. Si quieres ir a la página de detalles de cada producto para obtener más información, sigue los pasos a continuación.
3. Seleccionar el enlace para extraer datos de la página de detalles
- Elige "Hacer clic en los vínculos para scrapear las páginas vinculadas".
- Elige "Título_URL" en el menú desplegable
- Elige "Confirmar"
Octoparse iría automáticamente a la primera página de detalles del producto.
4. Extraer datos de la página de detalles del producto
- Haz clic en los elementos que desees y selecciona "Extraer el texto del elemento".
- Haz doble clic en el nombre del campo para cambiar el nombre si es necesario
Tips! Consulta los siguientes tutoriales para saber qué tipo de datos puedes extraer: |
5. Modificar XPath de los campos de datos
Puede que necesites modificar el XPath de algunos campos de datos que no se muestran en cada página de producto, o la posición del campo varía de una página a otra, como MPN o UPC. Podemos modificar XPath para que el raspado de datos sea más preciso. ¡No hay problema! Hemos preparado para ti algunos XPaths de algunos campos populares. Puedes usar los elementos XPath que se proporciona a continuación.
- Haz clic en "Más"
- Haz clic en "Personalizar XPath"
- Reemplaza el XPath con el revisado
- MPN: //td[contains(text(),'MPN')]/following-sibling::td[1]
- EAN: //td[contains(text(),'EAN')]/following-sibling::td[1]
- UPC: //td[contains(text(),'UPC')]/following-sibling::td[1]
- Item Weight: //td[contains(text(),'Item Weight')]/following-sibling::td[1]
- Haz clic en "Aplicar" para guardar
Tips! Puedes consultar los tutoriales de XPath a continuación para escribir XPath para otros campos si es necesario: |
6. Iniciar la extracción - ejecutar la tarea y obtener los datos
- Haz clic en Guardar y Ejecutar en el lado superior izquierdo
- Selecciona "Ejecutar tarea en el dispositivo" para ejecutar la tarea en tu computadora, o selecciona "Ejecutar tarea en la nube" para ejecutarla en nuestros servidores en la nube (solo para usuarios premium)
Si tienes algún problema en extraer datos de eBay, no dudes en escribir a nuestro equipo de Soporte. Nos pondremos en contacto contigo dentro de 24 horas.
Comentarios
0 comentarios
Inicie sesión para dejar un comentario.