El "Loop Item" es muy importante en Octoparse porque es uno de los pasos más utilizados mientras se construye una tarea de scraping.
Si tiene una tarea que Octoparse solo extrae el primer elemento y sigue produciendo duplicados, es posible que deba revisar el "Loop Item" que crea en la tarea.
Hay principalmente dos razones por las que sucede:
1) Los datos extraido no están en el área seleccionada. (por ejemplo, solo selecciona el título para crear un bucle y, sin embargo, hace clic en los datos fuera del área del título para extraer)
Este error generalmente puede ocurrir cuando necesita extraer datos de la página de la lista.
En este caso, es posible que deba eliminar todo el "Loop Item" y reconstruir otro. Tenga en cuenta que debe seleccionar toda el área como elemento para crear un bucle. (La extracción de datos solo se permite en el área seleccionada). Si no puede seleccionar el área completa directamente, expanda el área haciendo clic en este icono en "Accion Tips" para incluir todos los datos que necesita.
2) Al finalizar un bucro, Octoparse marcará el primer elemento en rojo como se muestra en las capturas de pantalla a continuación para recordarle que comience a extraer datos del primer elemento.
Pero si comienza a extraer datos del segundo elemento u otros elementos sin seguir las indicaciones de Octoparse, Octoparse posible scrape los datos del segundo elemento u otros elementos y producir duplicados. Debe eliminar el paso de "Extract Data" y arrastrar un nuevo paso de "Extract Data" en su bucle siguiendo las instrucciones de Octoparse.
Puede seguir estos dos pasos para verificar el "Loop Item" manualmente.
- Simplemente haga clic en el primer elemento en su "Loop Item" para verificar los datos extraídos como se muestra en la captura de pantalla a continuación.
- Haga clic en el segundo elemento en "Elemento de bucle" para verificar los datos. Si los datos extraídos son siempre los mismos aunque seleccione el segundo elemento, debe seguir las soluciones anteriores para revisar su tarea.
De: http://www.octoparse.es/tutorial-7/only-extract-the-first-item-and-produce-duplicates
Comentarios
0 comentarios
Inicie sesión para dejar un comentario.