Todas las colecciones
Cursos Integrados de Octoparse
Capturar todas las imágenes de un carrusel de imágenes
Capturar todas las imágenes de un carrusel de imágenes
Actualizado hace más de una semana

Muchas páginas web de productos utilizan carruseles de imágenes (como el que se muestra a continuación) para mostrar varias imágenes como diapositivas que, por lo general, puede hojear manualmente. En este tutorial, te mostraré cómo extraer las imágenes de un carrusel en el formato deseado.

mceclip0.png

mceclip2.png

mceclip0_2.png

mceclip10.png

Tomamos este enlace como ejemplo:

1. Scrapear una imagen en una columna

Simplemente selecciona una de las imágenes y selecciona "Extraer la URL de la imagen seleccionada" en el Panel de Tips. Repite el mismo proceso para extraer todas las URLs de imágenes.

extraer_URL_de_imagen_ebay.gif

2. Scrapear imágenes en diferentes líneas

También es posible scrapear imágenes en diferentes líneas de la misma columna usando una acción de extracción de bucle.

1) Selecciona la primera imagen

2) Continúa para seleccionar la segunda imagen y elige "Extraer URLs de imagen".

extraer_URLs_en_diferentes_columnas_ebay.gif

3. Scrapear todas las imágenes en una columna

Hay dos formas de lograr scrapear todas las imágenes en una columna.

Opción 1. Combinar las URLs de las imágenes extraídas en una línea

Una vez que hayas extraído en bucle las URLs de la imagen en diferentes líneas (siguiendo los pasos de Scrapear imágenes en diferentes líneas), puedes combinar los datos extraídos para fusionar las líneas en una sola línea.

1) Haz clic en el icono "Más" para el campo de datos, luego selecciona "Combinar datos", luego "Combinar los datos capturados".

mceclip0.png

Opción 2. Extrae el código HTML del carrusel y haz coincidir las URL de la imagen del código.

1) Selecciona todo el carrusel y selecciona "Extraer el HTML externo del elemento seleccionado".

extraer_HTML_externo_ebay.gif

2) Haz clic en el icono "Más" del campo y selecciona "Reformatear datos".

mceclip1.png

3) Haz clic en "Agregar paso" y elige "Coincidir con Expresión Regular".

mceclip2.png

4) Inspecciona el código para encontrar el valor inicial y el valor final de la URL de la imagen.

mceclip3.png

5) Haz clic en "Probar la herramienta ReEx".

mceclip4.png

6) Ingresa el valor Iniciar con y Terminar con para generar una expresión regular y aplicar la configuración.

mceclip5.png

7) Marca "Coincidir con todos" y confirma

mceclip6.png

Tips!

1. Las URLs de las imágenes extraídas son URL en miniatura. Si necesitas obtener las URL completas de la imagen, puedes continuar agregando pasos para reformatear el campo. Por favor, consulta este tutorial:

¿Ha quedado contestada tu pregunta?