Ingresar URLs por lotes
Actualizado hace más de una semana

¿Qué es la entrada de Batch URL?

La función de entrada de Batch URL es importar una gran cantidad de URL en Octoparse. Octoparse admite la importación de URL por lotes / masivos desde archivos locales (texto u hoja de cálculo), desde otra tarea, o incluso genera las URL basadas en un patrón predefinido.

¿Cómo ingresar URL por lotes?

Haz clic en "+ Nuevo" para crear una nueva tarea, selecciona "Modo avanzado" y verás el panel de importación de URL.

panel_de_importaci_n_de_URL..gif

Hay tres formas de importar URL por lotes a cualquier tarea / rastreador (hasta un millón de URL):

Tips!

Una vez que la cantidad de URL importadas / generadas alcance el límite de 1 millón, Octoparse dejaría de importar / generar inmediatamente.

1. Importar URL de un archivo

Puedes importar URL desde cualquiera de los siguientes formatos de archivo,

- CSV

- TXT

- Excel (.xlsx & .xls)

  • Selecciona "Importar desde archivo".

  • Haz clic en "Seleccionar", luego elige el archivo que contiene las URL y luego selecciona la hoja y la columna que contiene las URL.

  • Haz clic en "Guardar" para completar el proceso de importación.

importar_desde_archivo.png

Tips!

Solo se mostrarán las primeras 100 URL con fines de vista previa.

2. Importar URL de otra tarea

Esta característica permite integrar dos tareas sin problemas cuando la extracción de URL debe realizarse por separado con otra tarea. No se necesitan más exportaciones e importaciones manuales de URL.

  • Selecciona "Importar desde tarea".

  • Selecciona la tarea que contiene las URL de destino y, a continuación, especifica el campo de datos adecuado.

  • Haz clic en "Guardar" para completar el proceso de importación.

importar_desde_tarea.gif

Ten en cuenta que la tarea seleccionada (una que contiene las URL necesarias para un mayor rastreo) se denomina tarea principal y la nueva tarea que se configurará con las URL se convierte en tarea secundaria. Dos tareas se asociarán automáticamente y se pueden ejecutar en asociación entre sí.

Tips!

1. Puedes configurar la ejecución de la tarea secundaria de acuerdo con el estado de la tarea principal en la nube. Si configuras una ejecución asociada seleccionando una opción de la configuración de la tarea principal, ambas tareas se ejecutarán en la nube a través del Servicio en la Nube

de Octoparse. La ejecución asociada no está disponible para Extracción Local.

programar.png

2. Cuando se configura una ejecución asociada, la programación de tareas no está disponible para ejecutar la tarea secundaria.

3. La importación desde otra tarea admite la importación de más de 1 millón de URL.

3. Generar URL por lotes según un patrón predefinido.

Con la función "Generar por lotes", puedes generar fácilmente una gran cantidad de URL siguiendo patrones específicos modificando varios parámetros de una URL determinada.

  • Selecciona "Generar lote".

  • Ingresa una URL como base para la generación de lotes.

  • Resalta el parámetro de URL seleccionado y haz clic en "Agregar parámetro".

  • Selecciona entre las cuatro opciones de Tipo de parámetro para definir el patrón que necesitas y haz clic en "Guardar URL" para guardar la lista.

generar_lotes.gif

Cuatro opciones de tipo de parámetro

- Tipo 1: Número

Puedes ingresar el número inicial, elegir aumentar (+) o disminuir (-) un número cada vez e ingresar Repetir o un valor final. Por ejemplo, si deseas generar URL para diferentes páginas, es posible que debas configurar el parámetro del número de página de 1 a 100. Debes ingresar el número inicial como 1, cada vez + 1 y Repetir 100 veces. El valor final se completará automáticamente como 100.

tipo_1.png

- Tipo 2: Letra

Puedes ingresar la letra inicial y la letra final.

tipo_2.png

- Tipo 3: Tiempo

tipo_3.png

- Tipo 4: Personalizar lista

Puedes ingresar tu propia lista, como una lista de palabras clave de búsqueda o números de productos.

tipo_4.png

Tips!

Puedes configurar varios parámetros para generar URL. Por ejemplo, si la URL base es www.XXX.com/[parameter1]/[parameter2]

Parameter1={A, B}, Parameter2={1, 2}

La lista de URL final sería como:

¿Ha quedado contestada tu pregunta?