Todas las colecciones
Octoparse 101
Lección 4: Prueba y Ejecuta la tarea
Lección 4: Prueba y Ejecuta la tarea
Actualizado hace más de una semana

¿No te emociona que estés a punto de terminar tu primera tarea de raspado? Solo hay una cosa más que debes hacer (o mejor hacer) antes de ejecutar tu tarea - prueba tu flujo de trabajo paso a paso para asegurarte de que todo funcione como te esperabas. Con una ejecución de prueba, verás si necesitas ajustar la configuración de tu tarea para que los datos se capturen con precisión.

Para demostrar el proceso, seguiremos usando el sitio de prueba como ejemplo: http://test-sites.octoparse.com/?product_cat=e-commerce-category-1

Pasos del flujo de trabajo de ejecución de prueba

Siempre es bueno recordar que los pasos del flujo de trabajo siempre deben leerse de arriba a abajo y de adentro hacia afuera para los pasos anidados.

Entonces, para nuestro ejemplo, deberíamos probar los pasos en este orden:

  1. "Ir a la página web" → prueba si la página web se carga correctamente

  2. "Paginación" → prueba si el botón Paginación está ubicado correctamente

  3. "Hacer clic para Paginar" → prueba si la página web se pagina correctamente

  4. "Elemento de bucle" → prueba si la lista de elementos está completa y es correcta

  5. "Extraer datos" → prueba si los datos están seleccionados y extraídos correctamente

pasos.png

Es necesario mencionar que no todas las tareas se crean de la misma manera, es posible que tengas una tarea completamente diferente para probar, pero la metodología de prueba generalmente se puede extender a tareas de todo tipo. ¡Empecemos!

1. Hacer clic en "Ir a la página web".

Una vez que hagas clic en el paso, debería cargar la página web en el navegador integrado. Si la página web se carga bien, no hay nada de qué preocuparte; sin embargo, hay algunas cosas a las que siempre debes prestar especial atención.

1.1 Si la página web se carga con un desplazamiento infinitivo hacia abajo → debes seleccionar "Desplazarse hacia abajo en la página después de que se cargue" y completar la configuración adecuada.

ir_a_la_web.gif

1.2 Si la página web tarda más de lo habitual en cargar → es posible que desees aumentar el tiempo de espera de la página. Haz clic en "General" → "Timout" para elegir un tiempo de descanso apropiado.

timeout.png

2. Hacer clic en el cuadro "Paginación".

Para que la paginación funcione de manera consistente, hay dos cosas que debemos verificar:

  • Si el botón / flecha de Paginación se ubica correctamente.

  • Si el proceso de paginación funciona bien en todas las páginas, por ejemplo, necesita paginar correctamente yendo de la página 1 a la página 2, de la página 2 a la página 3, de la página 3 a la página 4, etc.

Después de hacer clic en el cuadro de paginación, vamos ir al elemento resaltado en la página web y confirmamos si es el botón de Paginación correcto. Si no tienes el botón Siguiente correcto, es posible que debas corregirlo manualmente modificando el XPath correspondiente.

paginaci_n.png

3. Hacer clic en "Hacer clic para paginar".

Cuando haces clic en "Hacer clic para paginar", literalmente le estás indicando a Octoparse que haga clic en el botón Página siguiente definido en el Paso 2. Si todo funciona correctamente, debe ir de la página 1 a la página 2. Repita este proceso de dos pasos ( haz clic en el cuadro "Paginación" y luego haz clic en "Hacer clic para paginar") tantas veces como sea necesario para asegurarte de que la paginación funcione correctamente en todas las páginas secuenciales. Si la página web no se pagina correctamente en alguna de las páginas, corrige el elemento XPath en el paso 2 y prueba nuevamente.

clic_paginaci_n.gif

4. Hacer clic en el cuadro "Elemento de bucle".

Probar el "Elemento de bucle" consiste esencialmente en confirmar si todos los elementos deseados se han seleccionado correctamente.

Una vez hecho clic, vayas a la página web en el navegador integrado y asegúrate de que todos los elementos que necesitas estén resaltados.

elemento_de_bucle.gif

Tips!

Si tu lista no está completa después de la prueba, puedes consultar las ideas de solución de problemas a continuación:

5. "Hacer clic en "Extraer datos"

Aquí está el paso final: verifica si los datos se extraen según sea necesario.

Una vez hecho clic, verifica los datos en la sección de vista previa y confirma si estos son los datos que necesitas.

extraer_datos.png

Tips!

Si ves algún campo en blanco o si encuentras datos extraviados, puedes consultar estas ideas de solución de problemas:

Realizar una prueba de funcionamiento

Una vez que hayas pasado por cada paso del flujo de trabajo de la tarea, es el momento perfecto para realizar una ejecución de prueba en tu dispositivo local. Haz clic en "Ejecutar" y selecciona "Ejecutar tarea en el dispositivo".

mceclip0.jpg

¡Ahora observa cómo se extraen tus datos en vivo!

extracci_n.png

Ahora que sabes que tu tarea está funcionando correctamente, ¡es hora de obtener datos de verdad!

>> Lección 5: Obtener datos

¿Ha quedado contestada tu pregunta?