Las tiendas en línea de desguace web como eBay o Amazon se han convertido en una fuente de datos de importancia crítica, lo que le permite hacer la comparación y scrape entre los productos de venta caliente a partir de precios, características y descripciones de productos convenientemente.
Este tutorial le mostrará lo fácil que es recuperar los datos del producto de eBay por Octoparse 7.X, una herramienta de raspado web aincreíblemente fácil de usar para facilitar su extracción de datos en sitios web.
https://www.ebay.com/sch/Digital-Cameras-/31388/i.html
Vamos a raspar la información del producto de "cámara digital" en eBay. Mira los pasos principales en el tutorial a continuación.
1) "Go To Web Page" - to open the target webpage
2) Create a pagination loop - to scrape all the results from multiple pages
3) Create a "Loop Item" - to scrape all the items on each page
4) Extract data - to select the data for extraction extracted
5) Customize data field - to clean the data by deleting extra strings (Optional)
6) Save and start extraction - to run the task and get data
1) "Ir a la página web" - para abrir la página web de destino
· Seleccione "Modo avanzado", cree una tarea. El modo avanzado admite la extracción de datos en varios sitios web y la configuración mucho más flexible.
· Ingrese la URL y haga clic en "Guardar URL".
· Active el modo "Flujo de trabajo" para verificar y editar su flujo de trabajo convenientemente.
2)Crear un ciclo de paginación - para raspar todos los datos de varias páginas
· Haga clic en el botón de la página siguiente, seleccione "Bucle, haga clic en el enlace seleccionado" en el panel "Consejos de acción".
3) Cree un "Elemento de Bucle" - para raspar todos los elementos de cada página
· Haga clic en el título del primer producto listado, Octoparse 7.X identificará automáticamente la URL similar en la página.
· Haga clic en "Seleccionar todo" en los "Consejos de acción"
· Haga clic en "Bucle, haga clic en cada URL"
4) Extraer datos - para seleccionar los datos extraídos de la página web
· Haga clic en los datos que necesita y seleccione "Extraer texto del elemento seleccionado" en los "Consejos de acción"
· Editar el nombre archivado
¡Consejos! 1. Si el elemento que seleccionó para extraer datos no tiene suficiente información, puede seleccionar el otro elemento en "Elemento de bucle" para completar el campo de datos. En este caso, los productos en eBay presentan su precio de una manera diferente, algunos mostrados por "Oferta actual", mientras que otros muestran por "Precio", por lo que seleccionamos la tercera opción en el "Elemento de bucle" para completar el campo de datos extraídos.
2. Como el precio en las tiendas en línea puede cambiar de vez en cuando, es posible que desee agregar el momento de la extracción de datos. Ahora, simplemente haciendo clic en "Agregar campos predefinidos" en la parte inferior del campo de datos, verá la opción de "Agregar hora actual". |
5) Personalizar campo de datos - para limpiar los datos eliminando cadenas adicionales (Opcional)
Ahora puede notar que el título de cada producto comienza con "Detalles acerca de", que tal vez desee eliminar para ordenar los datos. La operación es simple como sigue:
· Seleccione los datos
· Haga clic en "Personalizar campo de datos"
· Elija "Refinar datos extraídos"
· Haga clic en "Agregar paso" y elija "Reemplazar"
· Copie "Detalles sobre" en el campo "Reemplazar" y vacíelo en el campo "Con", luego haga clic en "evaluar"
· Haga clic "OK"
· "Save"
6) Guardar e iniciar extracción - para ejecutar su tarea y obtener datos
· Clic en Guardar"
· Haga clic en "Iniciar extracción"
¿Te resultó útil este artículo ¡Contáctenos en cualquier momento si necesita nuestra ayuda!
Comentarios
0 comentarios
Inicie sesión para dejar un comentario.