Todas las colecciones
Glosario
¿Qué es Auto-Detectar?
¿Qué es Auto-Detectar?
Actualizado hace más de una semana

¿Te sientes atrapado en configurar el flujo de trabajo por tu cuenta durante mucho tiempo? ¿Aún no puedes conseguir los datos tú mismo? Aquí está la nueva solución para principiantes: Detectar automáticamente la página web.

La función de detección automática es una de las innovaciones más recientes de la versión 8 de Octoparse. Con la función, los usuarios pueden comenzar fácilmente su trabajo simplemente haciendo clic en un botón. La función ha sido probada con éxito para manejar páginas web de diferentes diseños con listados, tablas, scroll infinito, botones de cargar más, etc. Ahora es el momento de presentar esta función útil y poderosa a nuestros usuarios.

Cómo utilizar la función

1. Ingresar la URL en la página de inicio

Ingresa la URL de ejemplo "https://www.ebay.com/b/Laptops-Netbooks/175672/bn_1648276" en el cuadro de búsqueda en el centro de la pantalla de inicio. Haz clic en "Iniciar" para crear una nueva tarea con el Modo Avanzado.

mceclip0__1_.png

2. Iniciar la detección automática

La detección comenzará después de que hagas clic en "Detectar automáticamente los datos de la página web" y podemos esperar a que se complete.

yyyyy1111.gif

3. Modificar la configuración

  • Eliminar datos no deseados

Haz clic en el icono

mceclip0.png

en la "Vista previa de datos" para eliminar los campos de datos que no quieres.

yyyyy1111111.gif
  • Cambiar el nombre de tus datos

Cambia el nombre de los campos de datos haciendo clic en el icono

mceclip1.png
_____.gif
  • Confirmar la configuración en "Tips"

Habrá opciones como "extraer lista", "paginar", "desplazamiento de página" enumeradas en el panel de "Tips",

  1. Extraer los datos de la lista - Esta opción está seleccionada por defecto para ayudar a scrapear la lista de datos en la página.

  2. Paginar para scrapear más páginas - Localiza un botón "Página siguiente" para ayudar a obtener datos de varias páginas.

  3. Agregar un desplazamiento de página - Esta opción es desplazarse hacia abajo en la página después de cargar.

1.png

Puedes marcar / modificar / desmarcar la selección de la configuración.

a) Comprobar la configuración

Haz clic en "Marcar" en "Paginar para scrapear más páginas" y verás que el botón de paginación se resalta en rojo.

2.gif

b) Modificar la configuración

Haz clic en el botón "Editar" debajo de una opción para modificar la configuración.

3.png

c) Desmarcar la configuración

Si no necesitas la opción, simplemente desmarca la casilla frente a ella

mceclip3.png
4.png
  • Hacer clic en "Crear flujo de trabajo".

Después de confirmar las opciones, puedes elegir "Crear flujo de trabajo" para generar las acciones.

5.png

4. Más acciones de raspado

La detección automática puede ayudar a configurar el flujo de trabajo básico con paginación y extracción de datos. Si quieres hacer clic en cada enlace para obtener más información o hacer clic en el botón "Cargar más", puedes seleccionar las opciones en el panel de Tips para configurar las acciones fácilmente.

7.png

1. Hacer clic en un botón "Cargar más"- Si hay un botón de cargar más en la página web, entonces puedes elegir esta opción, selecciona el botón de carga más en la página y establece tiempos de clic para permitir que el raspador haga clic automáticamente en el botón para cargar más datos para scrapear.

mceclip1__1_.png

2. Hacer clic en los enlaces para scrapear las páginas enlazadas- Si quieres hacer clic en los enlaces detectados y extraer más información de las páginas de detalles, elige esta opción y selecciona un enlace en el que deseas hacer clic.

8.png

Tips:

Para confirmar si los enlaces son aquellos en los que te gustaría hacer clic, haz clic en "Verificar" para que los enlaces se resalten en la página web.

5. Agregar datos faltantes manualmente

A veces, el detector automático pasará por alto algunos campos de datos. Deberás agregar los campos de datos manualmente. Simplemente selecciona la información en la página web y elige "Extraer el texto del elemento"

6.gif

6. Guardar la configuración y comenzar la extracción

Haz clic en el botón Guardar primero para guardar todas las configuraciones que has realizado, luego haz clic en Ejecutar para ejecutar tu tarea en el dispositivo local o en la nube.

mceclip3__1_.png
¿Ha quedado contestada tu pregunta?