No todas las páginas son iguales. Cuando las páginas web muestran variaciones, puede utilizar "Branch conditions" para lograr un raspado basado en condiciones. Aquí puedes ver cómo funciona:
¿Cuándo deberías considerar el uso de "Branch Conditions"?
1) Cuando solo estés interesado en obtener datos de determinadas páginas con una etiqueta específica, como "Nuevo", "Más vendidos", "En oferta", etc.
2) Cuando los datos de la página se muestran en diferentes formas, es decir, a veces se muestran como texto, otras veces como imágenes.



- Pasa el cursor sobre el lugar
donde desea agregar el branch conditionl
- Haz clic en
para añadir una acción "Branch Conditions" en el bucle
- Haz clic en
de la rama en el lado izquierdo, selecciona "Ejecutar si la página actual contiene un elemento específico"
- Completa el XPath para el elemento
: "// div [@ class = 'pricing-price__savings']" en el cuadro de texto a continuación (how to get the XPath ).
Tips! Si escribir el XPath es demasiado difícil, puede hacer clic en |
- Hacer cllic en "OK"
- Haz clic en la rama del lado derecho, seleccione "Ejecutar siempre la rama"
- Hacer cllic en "OK"
Tips! En Octoparse, puedes establecer la condición en una de las siguientes opciones: 1. Ejecutar siempre la rama Cuando se selecciona esta opción, Octoparse no juzgará en absoluto y procederá a ejecutar las acciones dentro de la rama inmediatamente. Selecciona esta opción solo para la rama del lado derecho. 2. Ejecutar si la página contiene texto específico Cuando se selecciona, Octoparse buscará la cadena de texto designada dentro de la página actual. 3. Ejecutar si la página actual contiene un elemento específico Cuando se selecciona, Octoparse buscará el elemento designado (de acuerdo con el XPath completado) dentro de la página actual. 4. Ejecutar si el bucle actual contiene texto específico Cuando se selecciona, Octoparse buscará la cadena de texto designada dentro del elemento de bucle actual. 5. Ejecutar si el bucle actual contiene un elemento específico Cuando se selecciona, Octoparse buscará el elemento designado (de acuerdo con el XPath relativo completado) dentro del elemento del bucle actual. Utiliza esta opción solo cuando necesites juzgar entre elementos de un bucle. |

Haz clic en los campos de datos que desee para capturar (learn how ). CambiA el nombre de los campos si es necesario.
4) Arrastra la acción "Extraer datos" a la rama de la izquierda.
Entonces, ahora hemos configurado Octoparse para buscar el elemento en la página. Si se encuentra el elemento, capturará los datos deseados; de lo contrario, omitará el producto.
Tips! 1. Si una condición se configura como "si se encuentra un elemento", el elemento designado debe encontrarse de forma única en la página, si no, puede que el juicio no funcione. 2. Octoparse recorre las ramas de izquierda a derecha de forma predeterminada. Es importante mantener siempre la condición que desea probar dentro de la rama izquierda; si la condición para la rama izquierda es "Siempre ejecutar la rama", Octoparse no procederá a la rama de la derecha ya que "Siempre ejecutar la rama" siempre se probará como "Verdadero". 3. Puede dejar la rama en blanco si no se necesita ninguna acción de extracción de datos cuando no se cumple la condición. 4. Cuando se agrega una acción de extracción de datos a ambas ramas, tanto el número de campos de datos como el nombre de los campos de datos deben mantenerse iguales. 5. Puede usar el juicio de ramas anidadas para refinar aún más la prueba. |
Si encuentras algún problema en configurar tu tarea, no dudes en enviar un ticket a nuestro equipo de Soporte.
Comentarios
0 comentarios
Inicie sesión para dejar un comentario.