Todas las colecciones
Tutorial de Casos
E-Commerce
Scrapear detalles de productos de Mercadolibre
Scrapear detalles de productos de Mercadolibre
Actualizado hace más de una semana

Mercado Libre, como una empresa multinacional dedicada al comercio electrónico en Latinoamérica, se ha convertido en una fuente de datos de importancia crítica para operadores de comercio electrónico. Extraer datos de productos de Mercado Libre te permite hacer monitoreo de precio, investigación de mercado y predicción de demanda y tendencia, etc. a partir de datos como precios, características y descripciones de productos.

En este tutorial, te presentamos dos soluciones de extraer datos de productos de Mercado Libre con Octoparse.

Solución 1 Plantilla de tarea de Mercado Libre

Puedes ir a la categoría "Productos" de las plantillas de Octoparse y comenzar con la Plantilla de Mercado Libre directamente para ahorrar tiempo. Con esta función, no es necesario configurar las tareas de raspado. Para obtener más detalles sobre las plantillas prediseñadas de Octoparse, puedes consultar este artículo: Plantillas de tarea

mceclip7.png

Aquí está la muestra de datos que puedes conseguir con la plantilla. Para probar la plantilla, puedes solicitar una prueba premium de 14 días para comenzar: ¡Comienza la prueba gratis del plan premium de 14 días de Octoparse!

Solución 2 Configurar tarea para Mercado Libre en Octoparse

Si quieres extraer más información de los productos de manera flexible, puedes continuar conmigo en este tutorial y configuraremos una tarea demo para enseñarte cómo se hace. Extraeremos datos como nombre, condición, precio y más información de la página de detalles del producto con Octoparse. Tomamos esta URL como ejemplo: https://listado.mercadolibre.com.mx/celular#D[A:celular]

Estos son los pasos principales de la configuración de tarea para Mercado Libre:

1. "Ir a la página web" - abrir la página web de destino

  • Ingresa la URL de ejemplo y haz clic en "Empezar"

mceclip1.png

2. Detectar automáticamente los datos de la página web - crear el flujo de trabajo

  • Haz clic en "Detectar automáticamente los datos de la página web" y espera a que se complete la detección.

mceclip1.png

  • Elimina los campos no deseados o modifica el nombre de los campos en la Vista previa de datos

mceclip2.png

  • Desmarca la casilla "Agregar un desplazamiento de página".

  • Elige "Crear workflow" en el panel de Tips.

mceclip4.png

Ahora obtendrás el flujo de trabajo a continuación.

mceclip5.png

Si todos los datos que necesitas se pueden extraer de la página de listado, puedes detener aquí y saltar a Iniciar extracción - ejecutar la tarea y obtener los datos. Si quieres ir a la página de detalles de cada producto para obtener más información, sigue los pasos a continuación.

3. Agregar un paso de ¨Hacer clic en el elemento¨ para ir a la página de detalles y extraer más información

  • Poner el cursor en la fecha por debajo del paso "Extraer datos"

  • Haz clic en "Agregar paso" y elige "Hacer clic en" en el menú desplegable

mceclip0.png

  • Marca "XPath relativo al elemento de bucle" e ingresa el XPath de cada producto: //div[@class="ui-search-item__group ui-search-item__group--title"]/a

  • Haz clic en "Aplicar"

Configurar_paso_de_hacer_clic_en_el_elemento_en_el_flujo_de_trabajo_MercadoLibre.gif

Octoparse iría automáticamente a la primera página de detalles del producto.

Tips!

El Xpath es muy importante para localizar los datos con precisión en Octoparse. Puedes consultar este artículo a continuación para escribir XPath para otros campos si te es necesario:

4. Extraer datos de la página de detalles del producto

  • Haz clic en los elementos que desees y selecciona "Extraer el texto del elemento".

  • Haz doble clic en el nombre del campo para cambiar el nombre si te es necesario

Tips!

Consulta los siguientes tutoriales para saber qué tipo de datos puedes extraer con Octoparse:

5. Modificar XPath de los campos de datos

Puede que necesites modificar el XPath de algunos campos de datos que no se muestran en cada página de producto, o la posición del campo varía de una página a otra, como MPN o UPC. Podemos modificar XPath para que el raspado de datos sea más preciso. ¡No hay problema! Hemos preparado para ti algunos XPaths de algunos campos populares. Puedes usar los elementos XPath que se proporciona a continuación.

  • Haz clic en "Más"

  • Haz clic en "Personalizar XPath"

  • Reemplaza el XPath con el personalizado

    • Marca: //th[contains(text(),'Marca')]/following-sibling::td[1]

    • Línea: //th[contains(text(),'Línea')]/following-sibling::td[1]

    • Modelo: //th[contains(text(),'Modelo')]/following-sibling::td[1]

    • Color: //th[contains(text(),'Color')]/following-sibling::td[1]

  • Haz clic en "Aplicar" para guardar

Tips!

Puedes consultar los tutoriales de XPath a continuación para escribir XPath para otros campos si es necesario:

6. Iniciar la extracción - ejecutar la tarea y obtener los datos

  • Haz clic en "Guardar" y "Ejecutar" en el lado superior izquierdo

  • Selecciona "Ejecutar en el dispositivo" para ejecutar la tarea en tu computadora, o selecciona "Ejecutar en la nube" para ejecutarla en nuestros servidores en la nube (solo para usuarios premium)

mceclip0.png
¿Ha quedado contestada tu pregunta?