¡Hola! ¡Bienvenido a la Octoparse nueva versión 8.1! Hay cambios importantes en la nueva versión, por lo que estamos armando esta nueva serie de aprendizaje para ayudarlo a aprovechar las nuevas capacidades mejoradas para extraer los datos que necesita.
Después de pasar por todas las lecciones de introducción, conocerá Octoparse 8.1 de adentro hacia afuera y podrá extraer datos web de la mayoría de las páginas web. Tomaría alrededor de 30 a 60 minutos terminar de leer todas las lecciones. ¡Que te diviertas!
Comencemos presentando la interfaz y cubriendo las características principales.
- La home pantalla
- El menú de la barra lateral
- El workspace
2. Características Principales
- Usar Plantillas de Tareas
- Scraping de datos con Modo Avanzado
- Cloud Extracción
1. La interfaz
Tan pronto como inicie sesión en Octoparse, encontrará dos secciones principales: la home pantalla de y la barra lateral.
1.1 La Home pantalla
En el centro de home pantalla hay una barra de búsqueda. Puede ingresar las URL(s) de la página web de destino para comenzar a construir una tarea o también puede ingresar un nombre de plantilla (como Amazon o eBay) para buscar una plantilla de scraping preconstruida.
También puede acceder a algunas de las plantillas y tutoriales de scraping más populares en la home pantalla.
1.2 El Menú de la Barra Lateral
El menú de la izquierda barra lateral contiene todo lo que necesita para navegar dentro de Octoparse.
+Botón nuevo: crea/importa una nueva tarea o crea nuevos grupos de tareas.
Dashboard: El único lugar para administrar todas sus tareas de scraping. Edite, elimine, cambie el nombre y organice todas las tareas en su cuenta. También puede ejecutar, detener o programar convenientemente cualquier tarea.
Filtros Rápidos & Tareas Recientes: Utilice estos accesos directos para acceder rápidamente a sus tareas.
1.3 El Workspace
El Octoparse workspace es el lugar donde construirá su tarea. Hay cuatro partes principales con cada parte atendiendo a su propósito particular.
El Navegador Incorporado: Una vez que haya ingresado la URL de una webpage de destino, la página web se cargará en el navegador incorporado de Octoparse. Puede navegar por el website en modo Browse o hacer clic para extraer los datos que necesita en el modo Seleccionar.
El Workflow: A medida que interactúa con la webpage, como abrir una página web y hacer clic en un elemento/botón de página, todo el proceso se define automáticamente en forma de workflow.
Consejos de Acción: Octoparse utiliza consejos inteligentes para "talk" durante el proceso de extracción, para guiarlo a través del proceso de creación de tareas.
Vista previa de datos: Tenga una vista previa de los datos seleccionados. También puede cambiar el nombre de los campos de datos o eliminar los que no son necesarios.
2. Funciones Principales
2.1 Plantillas de Tareas
Las plantillas de tareas son tareas preconstruidas para que los usuarios obtengan datos ingresando parámetros simples como URL(s) o palabras clave. Actualmente hay más de 60 plantillas para los sitios web más populares. No hay necesidad de construir nada y no se requieren conocimientos técnicos. ¡Simplemente seleccione la plantilla que necesita, verifique los datos de muestra para ver si obtiene lo que necesita y extraiga los datos de inmediato!
2.2 Scraping de datos con Modo Avanzado
Contrariamente a las plantillas de tareas donde todo ya está preestablecido, el Modo Avanzado de Octoparse es un modo de scraping altamente flexible y potente que le permite crear una tarea de scraping personalizada según sus requisitos específicos. El modo avanzado es lo suficientemente robusto como para scrape páginas web complicadas, como páginas con JavaScript, AJAX o cualquier sitio web dinámico.
Con el nuevo algoritmo de detección automática, Octoparse detecta automáticamente los elementos en una página y genera la configuración de tareas recomendada, como extraer la lista, ir a la página siguiente o hacer clic en los enlaces de la página de detalles.
Además de los datos detectados automáticamente, siempre puede editar manualmente la configuración de la tarea o crear una tarea desde cero omitiendo el paso de detección automática.
Una vez que esté satisfecho con los datos detectados automáticamente, simplemente guarde la configuración y Octoparse generará el tarea workflow automáticamente. Puede agregar pasos adicionales al workflow o modificar las acciones manualmente si es necesario.
2.3 Cloud extracción
Octoparse ofrece una potente plataforma en la nube para usuarios premium (estándar y superior) para ejecutar sus tareas 24/7. Cuando ejecuta una tarea con "Cloud Extracción", se ejecuta en la nube con varios servidores utilizando nuestras IP. Puede cerrar la aplicación o su computadora mientras se ejecuta la tarea. No hay necesidad de preocuparse por las limitaciones de hardware.
Los datos extraídos se guardarán en la nube y se podrá acceder a ellos en cualquier momento. Las características avanzadas, como la rotación automática de IP, la programación de tareas, la velocidad de extracción y la API de Octoparse, son todas partes del servicio Octoparse Cloud.
¡Buen trabajo para llegar hasta aquí! Ya has entendido lo básico sobre Octoparse.
Para aprender cómo construir su primera tarea de raspado, continúe con >> LLección 1: Extraiga datos con el nuevo algoritmo de detección automática
Comentarios
0 comentarios
Inicie sesión para dejar un comentario.