Sin embargo, es probable que las URLs cambien después de abrirse (por ejemplo, algunos parámetros de URL pueden cambiar) o que se redirijan a otra URL totalmente diferente. ¡Ahora la nueva característica de agregar URLs originales en Octoparse 8.5 resuelve perfectamente este dilema! Veamos cómo usar esta función.
¿Cuál es la URL original que Octoparse agrega como un campo?
Para esta función, Octoparse agrega la URL original que ingresaste a Octoparse para iniciar la tarea.
- URL única. Si inicias la tarea con una sola URL, obtendrás la URL que ingresas en la acción Ir a la página web
- Lista de URLs en el elemento de bucle. Si estás extrayendo datos de una lista de URLs, obtendrás la lista de URLs que ingresas en el Bucle de URLs usando Agregar URL original
Cómo agregar la URL original?
Tomamos este enlace como ejemplo: https://www.yachtall.com/en/fwd/go-to-builder?id=75&js=1
Abre este enlace en tu navegador y notarás que la URL se redirige a otra: https://en.azimutyachts.com/
1. Ingresa URL (s) en Octoparse para comenzar una tarea
2. Ve a la sección de Vista Previa de Datos
-
Haz clic en el botón
Agregar Campo Personalizado, y luego elige Agregar URL Original
- Obtendrás las URLs originales que ingresas
Verás un campo llamado URL_Original creado como campo y su valor es https://www.yachtall.com/en/fwd/go-to-builder?id=75&js=1 no https://en.azimutyachts.com/
Si necesitas ayuda con la configuración de tareas o la recopilación de datos, ¡envía un ticket a nuestro equipo de soporte y nos pondremos en contacto contigo pronto!
Comentarios
0 comentarios
Inicie sesión para dejar un comentario.