Hay dos situaciones en las que es posible que debas configurar proxies de IP en Octoparse. Una es cuando el internet de tu universidad o empresa restringe algunas solicitudes externas, lo que te impide iniciar sesión en Octoparse. La otra es cuando tu sitio web de destino es muy sensible al web scraping y toma medidas anti-raspado como el bloqueo de IP para detener cualquier posible actividad de raspado.
Te guiaremos sobre cómo configurar los proxies para resolver los problemas mencionados anteriormente en este tutorial:
1. Utilizar un proxy para cambiar la dirección IP para iniciar sesión en Octoparse
Si no puedes iniciar sesión en Octoparse debido a las restricciones de red, puedes configurar un proxy en la interfaz de inicio de sesión.
- Haz clic en
en la parte superior derecha
- Ingresa la información del proxy en el cuadro requerido
- Haz clic en "Probar" para comprobar si la conexión al proxy funciona
- Haz clic en "Confirmar" para guardar
2. Utilizar proxies externos para la rotación para evitar ser bloqueados
* Solo las ejecuciones locales pueden usar los proxies de IP que configures. Las ejecuciones en la nube no utilizarán los proxies.
- Abre la tarea en la que deseas configurar proxies
- Haz clic en
en la parte superior izquierda
- Marca "Usar proxy de IP" e ingresa la información del proxy en la "Configuración"
Octoparse solo admite proxies HTTP. Separa la dirección IP del servidor proxy y el número de puerto con dos puntos. por ejemplo: 58.22.214.29:2318.
- Haz clic en "Aceptar" y "Guardar" para guardar los cambios.
Comentarios
0 comentarios
Inicie sesión para dejar un comentario.