Muchas páginas web de productos utilizan carruseles de imágenes (como el que se muestra a continuación) para mostrar varias imágenes como diapositivas que normalmente puede hojear manualmente. En este tutorial, te mostraré cómo extraer las imágenes de un carrusel en el formato deseado.
1. Scrapear una imagen en una columna
2. Scrapear imágenes en diferentes líneas
3. Scrapear todas las imágenes en una columna
1. Scrapear una imagen en una columna
Scrapear varias imágenes en diferentes columnas es muy fácil, como scraper una imagen. Usemos esta URL de ejemplo para la demostración: https://www.ebay.com/itm/Lenovo-Legion-Y540-15-6-144Hz-i7-9750H-16GB-RAM-256GB-SSD-GTX-1660-Ti-Office/303553933195
Simplemente selecciona una de las imágenes y selecciona "Extraer la URL de la imagen seleccionada" en el Panel de Tips. Repite el mismo proceso para recuperar todas las URLs de imágenes.
2. Scrapear imágenes en diferentes líneas
También es posible scrapear imágenes en diferentes líneas de la misma columna usando una acción de extracción de bucle.
1) Selecciona la primera imagen
2) Continúa para seleccionar la segunda imagen y elige "Extraer URL de imagen".
3. Scrapear todas las imágenes en una columna
Hay dos formas de lograr scrapear todas las imágenes en una columna.
Opción 1. Combinar las URLs de las imágenes extraídas
Una vez que hayas extraído en bucle las URLs de la imagen en diferentes líneas (siguiendo los pasos de Scrapear imágenes en diferentes líneas), puedes combinar los datos extraídos para fusionar las líneas en una sola línea.
1) Haz clic en el icono de configuración para la acción Extraer datos.
2) Haz clic en el icono "ver más" para el campo de datos, luego selecciona "Combinar datos", luego "Combinar los datos capturados".
Opción 2. Extrae el código HTML del carrusel y haz coincidir las URL de la imagen del código.
1) Selecciona todo el carrusel y selecciona "Extraer el HTML externo del elemento seleccionado".
2) Ve a la configuración de la acción "Extraer datos", haz clic en el icono Ver más del campo y selecciona "Limpiar datos".
3) Inspecciona el código para encontrar el valor inicial y el valor final de la URL de la imagen.
4) Haz clic en "Agregar paso" y elige "Coincidir con expresión regular".
5) Haz clic en "Probar la herramienta ReEx"
6) Ingresa Start with y End con valor para generar una expresión regular y aplicar la configuración.
7) Marca "Coincidir con todos" y confirma
Tips! 1. Las URLs de las imágenes extraídas son URLs en miniatura. Si necesitas obtener las URLs completas de la imagen, consulta este tutorial: ¿Cómo scrapear las URLs de imágenes completas en lugar de las miniaturas? |
Si tienes algún problema en configurar tu tarea, no dudes en enviar un ticket a nuestro equipo de Soporte.
Comentarios
0 comentarios
Inicie sesión para dejar un comentario.