Todas las colecciones
Octoparse 101
Lección 0: Conceptos básicos de Octoparse
Lección 0: Conceptos básicos de Octoparse
Actualizado hace más de una semana

¡Hola! ¡Bienvenido a la nueva versión 8.5 de Octoparse! Hay actualizaciones importantes en la nueva versión, por lo que estamos preparando esta nueva serie de aprendizaje para ayudarte a comprender las nuevas capacidades mejoradas para extraer los datos que necesitas.

Después de pasar por todas las lecciones de introducción, comprenderás Octoparse 8.5 a fondo y podrás extraer datos de la mayoría de las páginas web. Tardaría entre 30 y 60 minutos en terminar de leer todas las lecciones.

Comenzamos presentándole la interfaz y las características principales.

1. La interfaz

  • La pagina de inicio

  • El menú de la barra lateral

  • El espacio de trabajo

2. Funciones Principales

  • Usar plantillas de tareas

  • Extracción de datos con el modo avanzado

  • Extracción de nubes

1. La interfaz

Tan pronto como inicies sesión en Octoparse, encontrarás dos secciones principales: la página de inicio y la barra lateral.

interfaz1.jpg

1.1 La página de inicio

Hay una barra de búsqueda en la parte superior de la página donde puedes ingresar las URL de la página web de destino para comenzar a crear una tarea o también puedes ingresar un nombre de plantilla (como Amazon o eBay) para buscar un raspado prediseñado plantilla.

Pantalla_de_inicio.gif
plantillas.gif

También puedes acceder a algunas de las plantillas y tutoriales de scraping más populares en la página de inicio.

1.2 El menú de la barra lateral

El menú de la barra lateral a la izquierda contiene todo lo que necesitas para navegar dentro de Octoparse.

  • + Nuevo: crea / importa una nueva tarea o crea nuevos grupos de tareas.

    men__de_la_barra_lateral4.png
  • Dashboard: Para gestionar todas tus tareas de raspado. Editar, eliminar, cambiar el nombre y organizar todas las tareas en tu cuenta. También puedes ejecutar, detener o programar cualquier tarea cómodamente.

dashboard5.jpg
  • Filtros Rápidos & Tareas Recientes: Utiliza estos atajos para acceder rápidamente a tus tareas.

  • Contactar con nosotros: Haz clic aquí para buscar un tutorial o inicia una conversación rápida con nosotros si tienes alguna pregunta.

contactar_con_nosotros_6.jpg

1.3 El espacio de trabajo

El espacio de trabajo de Octoparse es donde desarrollará tus tareas. Tiene 5 partes principales, cada una de las cuales sirve para tu propósito particular.

Espacio_de_trabajo.png
  • El navegador integrado: Una vez que hayas ingresado la URL de una página web de destino, la página web se cargará en el navegador integrado de Octoparse. puedes navegar por el sitio web en el modo navegar o hacer clic para extraer los datos que necesitas en el modo Seleccionar.

  • Tips: Octoparse utiliza Smart Tips para "hablar" contigo durante el proceso de extracción, para guiarlo a través del proceso de creación de tareas.

  • El flujo de trabajo: A medida que avanza a interactuar con la página web, como abrir una página web y hacer clic en un elemento / botón de la página, todo el proceso se define automáticamente en forma de flujo de trabajo.

  • Configuración: Las opciones de configuración para las acciones en el flujo de trabajo se mostrarán después de seleccionar una acción.

  • Vista previa de datos: para tener una vista previa de los datos seleccionados. También puedes cambiar el nombre de los campos de datos o eliminar los que no son necesarios.

2. Funciones Principales

2.1 Plantillas de Tareas

Las plantillas de tareas son tareas predefinidas para que los usuarios obtengan datos ingresando parámetros simples como URL (s) o palabras clave. Actualmente existen más de 60 plantillas para la mayoría de los sitios web convencionales. No es necesario construir nada y no se requieren competencias técnicas. Simplemente selecciones la plantilla que necesitas, verifica los datos de muestra para ver si obtienes lo que necesitas y extraigas los datos de inmediato.

Plantillas_de_tareas.gif

2.2 Extracción de datos con el modo avanzado

A diferencia de las plantillas de tareas en las que todo ya está preestablecido, el modo avanzado de Octoparse es un modo de raspado potente y altamente flexible que te permite crear una tarea de raspado personalizada según tus requisitos específicos. El modo avanzado es lo suficientemente robusto como para extraer páginas web complicadas, como páginas con JavaScript, AJAX o cualquier sitio web dinámico.

La creación de tu propia tarea de raspado con el modo avanzado no tiene por qué ser complicada e intimidante. Con el nuevo algoritmo de detección automática, Octoparse detecta automáticamente elementos en una página y genera configuraciones de tareas recomendadas, como extraer la lista y pasar a la página siguiente.

crear_flujo_de_trabajo.gif

Además de los datos detectados automáticamente, siempre puedes editar manualmente la configuración de la tarea o crear una tarea desde cero omitiendo el paso de detección automática.

sin_auto_detecci_n.gif

Una vez que estés satisfecho con los datos detectados automáticamente, simplemente guardes la configuración y Octoparse generará el flujo de trabajo de la tarea automáticamente. Puedes agregar pasos adicionales al flujo de trabajo o modificar las acciones manualmente si es necesario.

2.3 Extracción de nubes

Octoparse ofrece una potente plataforma en la nube para que los usuarios premium (estándar y superiores) ejecuten sus tareas las 24 horas del día, los 7 días de la semana. Cuando ejecuta una tarea con "extracción en la nube", se ejecuta en la nube con varios servidores utilizando nuestras IP. Puedes apagar la aplicación o tu computadora mientras se ejecuta la tarea. No es necesario preocuparte por las limitaciones del hardware.

Los datos extraídos se guardarán en la nube y se podrá acceder a ellos en cualquier momento. Las funciones avanzadas como la rotación automática de IP, la programación de tareas, la aceleración de la extracción y la API Octoparse son todas partes del servicio Octoparse Cloud.

¡Buen trabajo por llegar aquí! Ya has dominado los conceptos básicos sobre Octoparse.

Para aprender a crear tu primera tarea de raspado, continúa >>

¿Ha quedado contestada tu pregunta?