XPath es un lenguaje que te permite localizar elementos específicos de una página. La modificación de XPath en Octoparse funciona muy bien con más flexibilidad y precisión que la XPath generada automáticamente al hacer clic en elementos durante la configuración de la tarea.
Octoparse te permite personalizar el elemento XPath para que podamos ubicar con precisión los datos que vamos a extraer. Te ayuda a resolver la falta de datos, la página omitida, los campos en blanco y los duplicados.
En este tutorial, te mostraremos cómo personalizar el elemento XPath.
¿Dónde puedo modificar XPath en Octoparse?
- Haz clic en el icono Configuración de acción
en el botón Extraer datos
- Haz clic en Personalizar XPath del campo que quieres modificar
- Ingresa el nuevo XPath en el cuadro de texto Matching XPath
Tips! Si "Extraer datos" está dentro de un "Elemento de bucle" para extraer información de los elementos de la lista de bucles, ten en cuenta que debes asegurarte de que la XPath relativa esté marcada y luego ingresa la XPath correcta. |
Para pasos como "Elemento de bucle" o "Paginación", también puedes encontrar fácilmente el cuadro de texto XPath en "Configuración de acción". Ingresa el nuevo XPath y haz clic en "Aceptar" para guardar los cambios.
¿Cómo escribir XPath?
Si eres nuevo en XPath, es posible que primero debas aprender algunos conceptos básicos de HTML. XPath localiza elementos según las etiquetas y atributos. Entonces, antes de comenzar a escribir tu propio XPath, primero debes inspeccionar la estructura HTML de la página. (Más tutoriales sobre HTML )
Entonces puedes consultar este tutorial para obtener más información sobre XPath Qué es XPath y cómo usarlo en Octoparse
Si tienes alguna pregunta, no dudes en enviar un ticket a nuestro equipo de Soporte.
Comentarios
0 comentarios
Inicie sesión para dejar un comentario.