Todas las colecciones
Octoparse 101
Lección 5: Obtener Datos
Lección 5: Obtener Datos
Actualizado hace más de una semana

Ahora que tu primera tarea de raspado está construida y completamente probada. Puedes continuar y ejecutar la tarea para extraer algunos datos reales.

1. Dos formas de obtener datos

Hay dos formas de ejecutar la tarea:

  • Ejecutar en tu dispositivo (también conocido como extracción local)

  • Ejecutar en la nube (también conocido como extracción en la nube)

mceclip0.jpg

Si ejecutas una tarea en tu dispositivo, deberás tener la aplicación Octoparse abierta durante el proceso de extracción. Habrá una ventana de extracción ejecutándose en tu dispositivo, y puedes ver cómo se extraen los datos y esperar a que se complete.

mceclip0.png

Por otro lado, cuando ejecutas una tarea en la nube, la tarea se ejecutará en la plataforma en la nube Octoparse, lo que significa que puedes apagar la aplicación Octoparse o incluso tu computadora y volver por tus datos cuando el trabajo esté terminado. Las tareas que se ejecutan en la nube generalmente se ejecutan de 6 a 20 veces más rápido en comparación con las extracciones locales. Dependiendo de los requisitos de tu proyecto, siempre puedes elegir un plan que se adapte a tus necesidades.

2. Empezar a ejecutar

Una vez que hayas terminado de crear una tarea, puedes hacer clic en el botón "Ejecutar" para iniciar una ejecución.

ejecutar.png

Alternativamente, también puedes acceder a la tarea en el Tablero y usar los botones para ejecutar / detener una tarea.

ejecutar_y_detener.png

3. Verificar tus datos

Ahora que has completado tu carrera, puedes continuar y verificar tus datos.

Ve al Dashboard y busca tu tarea. Coloca el cursor sobre el estado de la tarea y haz clic en él.

datos_en_la_nube.gif

O también puedes verificar tus datos haciendo clic en el ícono "Más" en el Dashboard, selecciona "Ver datos" y luego elige si deseas ver "Datos nube" o "Datos local".

ver_datos.png

4. Exportar tus datos

Si los datos se ven bien, puedes exportarlos directamente haciendo clic en "Exportar datos" en la esquina inferior derecha de la pestaña Vista de datos. Octoparse admite la exportación de datos a archivos Excel, CSV, HTML o una base de datos.

formaos_de_datos.png

Nota:

  • Se puede acceder a los datos extraídos en las ejecuciones en la nube en cualquier dispositivo siempre que inicies sesión en tu cuenta.

  • Los datos de la nube solo se guardan durante 3 meses, después de lo cual se eliminarán de los servidores de la nube. Recuerda exportar los datos antes de que se eliminen.

  • Solo se puede acceder a los datos locales en el dispositivo en el que se ejecutó la extracción local.

  • Si la cantidad de datos supera las 20 000 líneas de datos, se exportarán en múltiples archivos de datos (20 000 líneas por archivo).

  • Los datos locales solo se pueden acceder en el dispositivo en el que se realizó la extracción local.

  • Los datos en la nube de una tarea se almacenan juntos para eliminar duplicados. Si ejecutas la misma tarea por segunda vez, es probable que veas duplicados raspados en la segunda ejecución.

  • Los duplicados en la nube se eliminarán automáticamente.

>>Lección 6: Programar ejecuciones regulares

¿Ha quedado contestada tu pregunta?