XPath es un lenguaje que te permite localizar elementos específicos de una página. La modificación de XPath en Octoparse funciona muy bien con más flexibilidad y precisión que el XPath generado automáticamente al hacer clic en elementos durante la configuración de la tarea.
Octoparse nos permite personalizar el elemento XPath para que podamos ubicar con precisión los datos que vamos a extraer. Nos ayuda a resolver los problemas de la falta de datos, la página omitida, los campos en blanco y los duplicados.
En este tutorial, te mostraremos cómo personalizar el elemento XPath.
¿Dónde puedo modificar XPath en Octoparse?
- Haz clic en “Extraer datos" en el flujo de trabajo.
- Haz clic en “Personalizar XPath” del campo que quieres modificar
- Selecciona el tipo de Xpath, luego ingresa el nuevo XPath en el cuadro y haz clic en "Aplicar"
Tips! Si "Extraer datos" está dentro de un "Elemento de bucle" para extraer información de los elementos de la lista de bucles, ten en cuenta que debes asegurarte de que el XPath relativo esté marcada y luego ingresa el XPath correcto. |
Para pasos como "Elemento de bucle" o "Paginación", también puedes encontrar fácilmente el cuadro de texto XPath en "Configuración de acción". Ingresa el nuevo XPath y haz clic en "Aplicar" para guardar los cambios.
¿Cómo escribir XPath?
Si eres nuevo en XPath, es posible que primero debas aprender algunos conceptos básicos de HTML. XPath localiza elementos según las etiquetas y atributos. Entonces, antes de comenzar a escribir tu propio XPath, primero debes inspeccionar la estructura HTML de la página. (Más tutoriales sobre HTML )
Entonces puedes consultar este tutorial para obtener más información sobre XPath Qué es XPath y cómo usarlo en Octoparse
Si tienes alguna pregunta, no dudes en enviar un ticket a nuestro equipo de Soporte.
Comentarios
0 comentarios
Inicie sesión para dejar un comentario.