Ejecutar la tarea en local (Versión 8.5)
Actualizado hace más de una semana

Como punto destacado de esta actualización 8.5, rediseñamos casi todo en torno a las ejecuciones locales y añadimos muchas características innovadoras. Esto fue acompañado de una interfaz de usuario más efectiva, con un diseño más enfocado. En este artículo, te guiaremos a través de la interfaz para que te familiarices con ella.

Cuando termines de crear una tarea, puedes hacer clic en el botón de ejecución en la esquina superior derecha como lo haces normalmente para ejecutar tu tarea.

Si la tarea incluye un bucle divisible, aparecerá una ventana emergente con la opción de elegir entre el Modo Turbo y el Modo Estándar. Si tu dispositivo local es lo suficientemente potente, se recomienda habilitar el Modo Aceleración de forma predeterminada para las ejecuciones locales en la configuración del panel de control.

Si tu tarea no es divisible, el botón de Modo Turbo estará deshabilitado.

Específicamente, hay tres tipos de modos de bucle divisibles en Octoparse. Revisa tu tarea y comprueba si contiene los tres tipos de bucles a continuación:

  1. Lista de URL.

  2. Lista de texto.

  3. Lista fija.

Si es así, puedes ejecutarla en el Modo Turbo, donde Octoparse divide la tarea en múltiples subtares (máximo 100) según la tarea real. A diferencia de la división de tareas en la nube, Octoparse solo ejecutará tres subtares concurrentes de forma local. Por lo tanto, el Modo Aceleración será aproximadamente 3 veces más rápido que el Modo Estándar para ejecuciones locales de datos. Hemos establecido el valor en 3 y limitamos la cantidad de ejecuciones locales concurrentes en caso de que Octoparse lleve al límite tu dispositivo local.

Nota: Lee este artículo para obtener más consejos y trucos sobre cómo hacer que tu tarea sea divisible.

Ventana de ejecución de datos local

1.Modo Estándar

Inicia cualquier tarea existente en el Modo Estándar y se abrirá una nueva ventana de ejecución de datos local.

standard_mode.jpg
  • Información de la ejecución de la tarea: El área gris superior ahora mostrará el estado de la tarea, el número de datos extraídos, el recuento de duplicados, el tiempo de ejecución, la velocidad promedio, etc.

  • Pausar/Reanudar: Mirando más a la derecha, además de la opción de detener completamente la tarea, hay un botón para pausar/reanudar una tarea de ejecución local. Cuando el sitio web de destino requiere que resuelvas ocasionalmente un CAPTCHA o ingreses alguna información, puedes pausar la tarea, abrir la ventana del navegador para la ejecución local y manejarlo manualmente. Ten en cuenta que Octoparse NO PUEDE reanudar una tarea si cierras el software.

  • Mostrar navegador: Si haces clic en el icono "Mostrar navegador", el área gris superior cambiará a la vista web, donde podrás ver cómo se cargan las páginas web y supervisar el proceso de ejecución de tu tarea.

  • Editar tarea: Haciendo clic en el icono de edición de la tarea, volverás a la interfaz de edición de la tarea.

El área inferior blanca muestra los detalles de la tarea en cuatro pestañas conmutables, que incluyen Tarea, Datos extraídos, Registro e Historial.

  • Resumen: Esta pestaña es una vista general de una ejecución de datos en particular. Muestra la hora de inicio, la hora de finalización, la cantidad de datos excluyendo duplicados, así como los CAPTCHAs resueltos (próximamente) y los proxies (próximamente) utilizados localmente durante la ejecución de datos.

  • Datos extraídos: Esta pestaña lista todos los datos extraídos de esta ejecución de datos en particular.

  • Registro: Esta pestaña lista todos los eventos de registro de una ejecución de datos específica. Puedes listar todos los eventos de registro o filtrar solo los registros de errores. Los registros de errores serán extremadamente útiles para solucionar problemas de tareas. Puedes exportar los registros como un archivo de texto.

log_tab.jpg
  • Historial: Esta pestaña muestra el historial de cada ejecución de datos locales. En la parte inferior derecha, encontrarás una opción para hacer una copia de seguridad automática de tus datos locales en la nube después de que una tarea se haya detenido o completado (disponible para los planes Pro y superiores). También puedes optar por hacer una copia de seguridad/exportar datos para una ejecución de datos específica de forma manual en la columna de Opciones, o hacer una copia de seguridad/exportar todos los datos a la vez.

history.jpg

CONSEJO: Ahora Octoparse admite la copia de seguridad de datos en la nube para las ejecuciones locales. Si estás suscrito a los planes Pro o superiores, ahora puedes configurar Octoparse para hacer una copia de seguridad automática de los datos locales en la nube después de que una tarea se haya detenido o completado. Esto es extremadamente útil si deseas utilizar la API para conectar tus datos locales a una base de datos.

2. Modo Aceleración

Si iniciamos una tarea en el Modo Aceleración, la vista predeterminada de la nueva ventana de ejecución de datos locales será un poco diferente a la del Modo Estándar.

Habrá un icono de acelerar, un indicador de porcentaje de aceleración y un botón de Desactivar el Modo de Impulso a la derecha del estado de la tarea. Si hacemos clic en Desactivar el Modo de Impulso, Octoparse finalizará las tres sub-tareas concurrentes y luego ejecutará las sub-tareas restantes una por una. Ten en cuenta que una vez desactivado, el Modo de Impulso no puede reanudarse para la ejecución actual.

boosting.jpg

El área blanca inferior sigue mostrando los detalles de la tarea en cuatro pestañas conmutables, que incluyen Información general, Datos extraídos, Estado de la sub-tarea e Historial. Las pestañas Información general, Datos extraídos e Historial siguen siendo las mismas que en el Modo Estándar, por lo que las saltaremos y nos centraremos en presentar la pestaña Estado de la Subtarea.

  • Estado de la Subtarea

Esta pestaña se muestra para las tareas que se ejecutan en el Modo de Impulso. Puedes consultar la hora de creación, hora de inicio, hora de finalización, tiempo de ejecución, cantidad de datos y estado de todas las subtareas en un formato de tabla.

Cuando una subtarea se marca como completada, puedes pasar el cursor sobre esa fila de datos y hacer clic en registros para mostrar sus registros de eventos.

subtask_log.jpg
  • Si una subtarea se marca como pausada/en ejecución, puedes pausarla/reanudarla o hacer clic en detalles para ir a la página de detalles. Luego se abrirá una nueva ventana con las pestañas Datos Extraídos y Registros.

details.jpg

Nota: Puedes acceder rápidamente a los detalles de una subtarea en el Modo Boost haciendo clic en el icono Mostrar Navegador. Al hacer clic, aparecerá un menú desplegable que te permitirá elegir entre las subtareas concurrentes.

show_browser.jpg
¿Ha quedado contestada tu pregunta?