Todas las colecciones
Cursos Integrados de Octoparse
Extraer información de clasificación de estrellas
Extraer información de clasificación de estrellas
Actualizado hace más de una semana

A veces, no podemos extraer la información de calificación directamente como scrapear otra información en formato de texto, como el título de la página. En el caso siguiente, la información de calificación se almacena en el valor del atributo "alt" dentro del elemento "img". En este tutorial, te mostraremos cómo extraer la información de calificación de estrellas de las páginas web.

mceclip0.png

Hay dos formas de obtener la información de calificación por estrellas:

1) Extraer atributo del código fuente

2) Extrae y limpia el código HTML

1) Extraer atributo del código fuente

1. Selecciona el área de calificación en la página web y elige "Extraer la URL de la imagen seleccionada". También puedes optar por extraer el texto o el código HTML aquí. Este paso es solo para crear un campo de datos.

mceclip1.png

2. Haz clic en

mceclip4.png

para abrir la vista previa de datos.

mceclip3.png

3. Haz clic en el icono "...". Luego elige la opción "Personalizar campo".

mceclip2.png

4. Selecciona "Extraer atributo" y luego selecciona "alt". El resultado se mostrará en el cuadro "Ejemplo".

mceclip5.png

5. Después de guardar los cambios que realizaste, al regresar a la página de inicio, verás que el resultado se ha convertido en la información de calificación.

mceclip6.png

2) Extraer y limpiar el código HTML

1. Selecciona el área de calificación en la página web y elige "Extraer el HTML externo del elemento seleccionado".

mceclip7.png

2. Haz clic en

mceclip4.png

para abrir la vista previa de datos.

mceclip3.png

2. Haz clic en "Más" y elige "Reformatear datos".

mceclip8.png

3. Después de eso, haz clic en "Agregar paso" y luego elige "Coincidir con Expresión Regular".

mceclip9.png

4. Si sabes cómo usar la expresión regular, puedes ingresar la fórmula directamente en el cuadro Expresión Regular. Si no estás familiarizado con ella, haz clic en "¿No estás seguro sobre la expresión regular? "¡Prueba la herramienta RegEx!.

RegEx.png

5. Haz clic en "Comenzar con" y luego ingresa la parte de las cadenas antes de la información que realmente necesitamos. A continuación, haz clic en "Terminar con" y luego ingresa la parte de las cadenas después de la información que necesitamos.

Después de eso, marca "Coincidir todos" y luego haz clic en "Coincidir" para ver si la información coincidente es lo que necesitamos. Luego haz clic en "Aplicar".

regex_ejemplo.png

6. Vuelve a comprobar el resultado cuando vuelvas a la configuración. Marca la opción "Coincidir con todos" y confírmala.

mceclip10.png
¿Ha quedado contestada tu pregunta?