Cuando está scraping un sitio web que aplica el botón de desplazamiento hacia abajo / mostrar más para cargar más contenido, puede encontrar este escenario:
Incluso si ha configurado el desplazamiento con Octoparse, todavía no encuentra nuevos elementos agregados a la lista de elementos del bucle.
Aquí está la razón:
Octoparse generará automáticamente un modo de bucle basado en la estructura del sitio web. Si el modo de bucle de autogeneración no puede detectar nuevos elementos cuando se desplaza hacia abajo y carga más elementos, la razón sería la lista fija de autogeneración.
Puede seguir este tutorial para verificar y resolver el problema. Tome la siguiente imagen como ejemplo:
Puede notar que el "modo de bucle" actual está bajo el modo de "lista fija".
A diferencia de la "Lista de variables", la "Lista fija" solo incluirá elementos de acuerdo con la lista fija de XPath que ingrese en el cuadro de texto. Por lo tanto, cuando se trata de elementos dinámicos, o cuando el número de elementos varía en diferentes páginas, debe cambiar el modo de bucle a la "Lista de variables" porque puede detectar automáticamente y hacer coincidir todos los elementos correspondientes a un determinado XPath.
¡Consejos! En realidad, hay 5 modos de bucle en Octoparse: Lista de variables, Elemento único, Lista fija, Lista de URL y Lista de texto. Si desea saber más sobre estos modos de bucle, puede ir a los siguientes artículos: |
Para resolver este problema, también debe modificar XPath. Consulte este tutorial Locate elements with XPath para saber más sobre XPath.
Si no sabe mucho sobre XPath, aún puede generar el XPath observando las similitudes entre el XPath en la "Lista fija".
Tomando la siguiente imagen como ejemplo, todos los XPath en la "Lista fija" comparten la misma etiqueta "H4".
Luego puede ingresar el nuevo XPath "// H4" en el cuadro de texto de la "Lista de variables" para ver si es viable o no. Si se desplaza hacia abajo para cargar nuevo contenido y encuentra nuevos elementos agregados a la lista de elementos de bucle, entonces la nueva XPath que ingrese es viable.
Este método se aplica a la mayoría de los casos simples. Si es difícil, es posible que aún necesite aprender a escribir XPath para resolver el problema o contact us en cualquier momento para obtener ayuda.
¡Consejos! Para mejorar la precisión, se recomienda modificar XPath en Octoparse. Aquí hay algunos tutoriales relacionados que puede necesitar: |
Comentarios
0 comentarios
Inicie sesión para dejar un comentario.