¿No le emociona que esté a punto de terminar su primera tarea de scraping? Solo hay una cosa más que debe hacer (o mejor hacer) antes de ejecutar oficialmente su tarea - pruebe su flujo de trabajo paso a paso para asegurarse de que las cosas funcionen como se esperaba. Con una ejecución de prueba, puede verificar si necesita ajustar la configuración de la tarea para obtener datos correctamente.
Para demostrar el proceso, seguiremos usando el sitio de prueba como ejemplo: sites.octoparse.com/?product_cat=e-commerce-category-1).
Test-run workflow Pasos
Los pasos del flujo de trabajo siempre deben leerse de arriba a abajo y de adentro hacia afuera para los pasos anidados.
Entonces, para nuestro ejemplo, debemos probar los pasos en este orden:
- "Go to Web Page" → pruebe si la página web se carga correctamente
- "Pagination" → prueba si el botón Página Siguiente está ubicado correctamente
- "Click to Paginate" → pruebe si la página web se pagina correctamente
- "Loop Item" → prueba si la lista de elementos está completa y es correcta
- "Extract Data" → prueba si los datos están seleccionados y extraídos correctamente
Vale la pena mencionar que no todas las tareas se crean de la misma manera, es posible que tenga una tarea completamente diferente para probar, pero la metodología de prueba generalmente se puede extender a tareas de todo tipo. ¡Empecemos!
1. Haga clic en "Ir a la página web"
Una vez que haga clic en el paso, debería cargar la página web en el navegador incorporado. Si la página web se carga bien, no hay mucho que necesite ajustar; sin embargo, hay algunas cosas que siempre debes tener en cuenta.
1.1 Si la página web se carga con desplazamiento hacia abajo infinitivo → desea seleccionar "Scroll down the page after it is loaded" y completar la configuración adecuada.
1.2 Si la página web tarda más de lo normal en cargarse → es posible que desee aumentar el tiempo de espera de la página.
2. Haga clic en el cuadro "Paginación"
Para que la paginación funcione de manera consistente, hay dos cosas que debemos verificar con seguridad.
- Si el botón/flecha Next Page se está ubicando correctamente.
- Si el proceso de paginación funciona bien en todas las páginas, es decir. necesita paginar correctamente yendo de la página 1 a la página 2, de la página 2 a la página 3, de la página 3 a la página 4, y así sucesivamente.
Después de hacer clic en el cuadro de paginación, vaya al elemento resaltado en la página web y confirme si es el botón correcto de Next Page. Si no tiene el botón Next correcto, es posible que deba arreglarlo manualmente alterando el XPath correspondiente.
3. Haga clic en "Haga clic para Paginar"
Cuando hace clic en "Hacer clic para paginar", literalmente le indica a Octoparse que haga clic en el Next Page button definido en el Paso 2. Si las cosas funcionan bien, debería ir de la página 1 a la página 2. Repita este proceso de dos pasos (haga clic en el cuadro "Paginación" y luego haga clic en "Hacer clic para Paginar") tantas veces como sea necesario para asegurarse de que la paginación funcione correctamente en todas las páginas secuenciales. Si la página web no está paginándose correctamente en ninguna de las páginas, arregle el elemento XPath en el paso 2 y vuelva a probar.
¡Consejos! Echa un vistazo a estas ideas de solución de problemas de paginación: |
4. Haga clic en el cuadro "Elemento de bucle"
Probar el "Loop Item" es esencialmente confirmar si todos los elementos deseados se han seleccionado correctamente.
Una vez que haya hecho clic, vaya a la página web en el navegador incorporado y asegúrese de que todos los elementos que necesita estén resaltados.
O también puede hacer clic en abrir el icono de lista para cargar la lista de elementos y confirmar si la lista está completa.
¡Consejos! Si su lista no está completa después de la prueba, puede consultar las ideas de solución de problemas a continuación: |
5. Haga clic en "Extraer Datos"
Este es el paso final - compruebe si los datos se extraen según sea necesario.
Una vez que haya hecho clic, verifique los datos en la sección de vista previa y confirme si estos son los datos que necesita.
¡Consejos! Si ve algún campo en blanco o si encuentra datos extraviados, puede consultar estas ideas de solución de problemas: |
Realizar una prueba de funcionamiento
Después de haber completado cada paso en el flujo de trabajo de la tarea, es el momento perfecto para realizar una ejecución de prueba en su dispositivo local. Haga clic en "Ejecutar" y seleccione "Ejecutar tarea en su dispositivo".
¡Ahora mira cómo se extraen tus datos en vivo!
¡Consejos! Consulte las preguntas frecuentes a continuación para saber por qué no obtiene los datos que necesita.
|
Comentarios
0 comentarios
Inicie sesión para dejar un comentario.