Octoparse ofrece algunos campos de datos predefinidos que son realmente útiles y convenientes para los usuarios.
¿Dónde agregar los campos de datos predefinidos?
Vaya al paso "Extraer datos" y puede encontrar el botón "Agregar campo predefinido" en el panel derecho.
¿Qué campos de datos predefinidos puedo agregar?
Hay cuatro tipos de campos de datos que puede agregar:
1. Agregar la hora actual
Este campo de datos significa el tiempo de extracción de la línea de datos scraping.
Por ejemplo, si tiene una tarea programada que se ejecuta todos los días y desea saber la fecha en que se raspan las líneas de datos, simplemente puede agregarla archivada.
¡Consejos! 1. Puede reformatear la fecha con Reformat extracted data/time 2. Agregar la hora actual en la extracción en la nube puede ayudar a mantener todos los duplicados: ¿Puedo mantener los duplicados extraídos en la nube? 3. El tiempo en la extracción en la nube se basa en el tiempo UTC. |
2. Agregar un campo fijo
Esta opción le permite crear un valor fijo para cada línea de datos.
Si está raspando de Amazon.com y Amazon.fr, por ejemplo, y desea agregar un campo "Sitio web" para indicar qué dominio se raspan los datos, puede crear el campo de datos utilizando esta opción.
3. Agregar un campo en blanco
Esta opción le ayuda a crear un campo en blanco para extraer cualquier campo que desee en la página. Para convertir un campo en blanco en uno útil, es imprescindible revisar el XPath.
Consejos Cómo revisar el XPath paso a paso, verifique aquí: |
4. Agregar información de la página actual
- URL de la página web: agregue la URL de la página actual junto con los datos correspondientes
Es útil cuando desea verificar los campos de datos faltantes en una página: ¿Qué hacer con esos campos en blanco que obtuvo en el resultado extraído?
- Título de la página: Scrape el contenido de la etiqueta del título.
Es una breve descripción de una página web y aparece en la parte superior de una ventana del navegador.
- Meta descripción: Scrape el contenido de la etiqueta de meta descripción
La etiqueta contiene un resumen del contenido de la página.
- Meta palabra clave: scrape el contenido de la etiqueta de palabra clave meta
Cuando los usuarios necesitan mejorar su SEO, es muy útil scrape el título de la página, la meta descripción y las meta palabras clave.
Comentarios
0 comentarios
Inicie sesión para dejar un comentario.