1. Comprender el modo de bucle de lista de URL de Octoparse
Cuando sus datos deseados abarcan varias páginas que comparten la misma estructura de página, puede ingresar las URL de estas páginas en Octoparse para configurar un bucle. Octoparse cargará la URL una por una para raspar los datos de cada página.
2. Cantidad máxima de URL permitidas para ingresar
Le sugerimos que agregue no más de 10,000 URL para una tarea. Dependiendo de la longitud de las URL, este número sería ligeramente diferente.
Recibirá un error que indica lo siguiente cuando haya excedido el límite.
3. Inicie una nueva tarea con una lista de URL
- Ingrese su lista de URL
Cuando se agrega más de una línea de URL al cuadro URL de extracción, Octoparse ingresará al modo de bucle Lista de URL de forma predeterminada y creará un Elemento de bucle automáticamente.
- Establecer esperar antes de la ejecución
Para evitar que las URL se carguen de forma incompleta, podemos establecer un tiempo de espera antes de que se ejecute la acción (normalmente, 2 segundos funcionarán).
Opciones avanzadas> Esperar antes de la ejecución
4. Edite la lista de URL que ingrese
Después de ingresar la lista de URL, aún puede modificarlas.
Opciones avanzadas> Lista de URL
De: http://www.octoparse.es/tutorial-7/extract-data-with-a-list-of-urls
Comentarios
0 comentarios
Inicie sesión para dejar un comentario.