En este tutorial, te mostraremos cómo usar Octoparse para extraer datos a nivel de página, incluidos la URL de la página web, el título de la página, la meta descripción, las meta palabras clave y el código fuente HTML.
Cómo agregar los datos
1. Cuando estés en la acción "Extraer datos", haz clic en "Configuración de la acción"
2. Haz clic en para"Agregar campo (s) de datos"
3. Desplázate o haz clic en "Datos a nivel de página" para seleccionar los datos a nivel de página que desees.
Los datos de nivel de página seleccionados se agregarán automáticamente en "Campo de datos".
4. Cambia el nombre del campo de datos según tus necesidades
Tips! También puedes agregar los campos en el panel "Vista previa de datos". Haz clic en el icono para ver las opciones del menú desplegable. |
Significado de los campos
- URL de la página: agrega la URL de la página actual junto con los datos correspondientes
Es útil cuando deseas verificar los campos de datos que faltan en una página: ¿Qué hacer con esos campos en blanco que obtuve en el resultado extraído?
- Título de la página: scrapea el contenido de la etiqueta del título.
Es una breve descripción de una página web y aparece en la parte superior de la ventana del navegador.
- Meta descripción: scrapea el contenido de la etiqueta de la meta descripción
La etiqueta contiene un resumen del contenido de la página.
- Meta palabra clave: scrapea el contenido de la meta etiqueta de palabra clave
Scrapea el título de la página, la meta descripción y las meta palabras clave son útiles cuando los usuarios necesitan mejorar su SEO.
- Código fuente HTML: el código HTML completo de la página web.
Si tienes algún problema en configurar tu tarea, no dudes en enviar un ticket a nuestro equipo de Soporte.
Comentarios
0 comentarios
Inicie sesión para dejar un comentario.