
Pregunta: ¿Cuándo debería considerar usar el juicio de rama?
Respuesta: Hay dos escenarios principales cuando el juicio de rama puede ser útil.
1) Cuando solo está interesado en obtener datos de ciertas páginas con una etiqueta específica, como "Nuevo", "Venta caliente", "En oferta", etc.
2) Cuando los datos en la página se muestran en diferentes formas, es decir, a veces aparecen como texto, otras veces aparecen como imágenes.
En la imagen de ejemplo a continuación, queremos información sobre todas las computadoras portátiles que están a la venta. Mirando de cerca la página de detalles del artículo, parece que podemos usar el ícono en oferta como condición para probar: si el elemento
se encuentra en la página del artículo, continuaremos y capturaremos la información del producto; de lo contrario, omitiremos la página/producto por completo.
https://www.bestbuy.com/site/all-laptops/pc-laptops/pcmcat247400050000.c?id=pcmcat247400050000
1) Cree un bucle para hacer clic en cada enlace de la lista (ver tutoriales)
2) Use el juicio de la rama para probar la condición: si está presente en la página del artículo
- Cambie al modo de flujo de trabajo alternando el botón
ubicado en el lado superior derecho
- Arrastre una acción
de Juicio de rama al interior del bucle
- Haga clic en la rama en el lado izquierdo, seleccione "Ejecutar rama cuando: Cuando la página actual contiene un elemento"
- Complete el elemento "Xpath for": ".//div[@class='pb-savings ']" en el cuadro de texto para "Elemento XPath" (how to find the XPath).
- Clic en Save"
- Haga clic en la rama en el lado derecho, seleccione "No juzgar. Ejecute siempre la rama"
- Clic en Save"
¡Consejos!
En Octoparse, puede establecer la condición en uno de los siguientes: 1. No juzgues. Ejecuta siempre la rama Cuando se selecciona esta opción, Octoparse no juzgará en absoluto y procederá a ejecutar las acciones dentro de la sucursal de inmediato. Solo seleccione esta opción para la rama en el lado derecho. 2. Ejecute la rama cuando la página actual contiene texto Cuando se selecciona, Octoparse buscará la cadena de texto designada dentro de la página actual. 3. Ejecute la rama cuando la página actual contiene un elemento Cuando se selecciona, Octoparse encontrará el elemento especificado en la página actual (de acuerdo con la XPath completa) 4. Ejecute la rama cuando el elemento del bucle actual contenga texto Cuando se selecciona, Octoparse buscará la cadena de texto designada dentro del elemento del bucle actual. 5. Ejecute la bifurcación cuando el elemento del bucle actual contiene un elemento Cuando se selecciona, Octoparse buscará el elemento designado (de acuerdo con la XPath relativa completada) dentro del elemento del bucle actual. Use esta opción solo cuando necesite juzgar entre los elementos de un bucle.
|
3) En la página del artículo del producto (seleccione uno del bucle que tiene elemento), haga clic en los campos de datos que desee capturar (aprenda cómo ). Cambie el nombre de los campos si es necesario.
4) Arrastre la acción "Extraer datos" a la rama a la izquierda
Entonces, ahora hemos configurado Octoparse para buscar el elemento en la página. Si se encuentra el elemento, capture los datos deseados, de lo contrario, omita el producto.
Consejos 1. Si una condición se establece como "si se encuentra un elemento", el elemento designado debe encontrarse de forma exclusiva en la página o la sentencia puede fallar. 2. Octoparse pasa por las ramas de izquierda a derecha por defecto. Es importante mantener siempre la condición que desea probar dentro de la rama izquierda; si la condición para la rama izquierda es "No juzgar", Octoparse no procederá a la rama a la derecha ya que "No juzgar" siempre se probará como "Verdadero". 3. Puede dejar la rama en blanco si no se necesita una acción de extracción de datos cuando no se cumple la condición. 4. Cuando se agrega una acción de extracción de datos a ambas ramas, tanto el número de campos de datos como el nombre de los campos de datos deben mantenerse iguales. 5. Puede usar el juicio de rama anidada para refinar aún más la prueba. on is needed when the condition is not met. |
Artículos relacionados:
Seleccionar elementos en un menú desplegable
Extraer varias páginas a través de la paginación
Comentarios
0 comentarios
Inicie sesión para dejar un comentario.