Resolver Captcha & hCaptcha & ReCaptcha V2
Actualizado hace más de una semana

CAPTCHA es una técnica anti-scraping muy común aplicada por muchos sitios web en diferentes formas.

Para ayudar a mejorar la eficiencia del scraping, Octoprase puede manejar los tres tipos de Captcha automáticamente: hCaptcha, ReCaptcha V2, e ImageCaptcha.

hCaptcha y ReCaptcha V2 pueden ser resueltos de manera similar, mientras que es más complicado configurar una resolución para tratar con ImageCaptcha.

Sigue este tutorial y podrás tener una comprensión básica de cada Captcha y manejarlos con Octoparse.


1. ¿Qué son hCaptcha, ReCaptcha V2 & V3?

  • hCaptcha normalmente combina:

- un botón I am human(soy humano) con el logotipo de hCaptcha

mceclip0.png

- y preguntas sencillas (en imágenes) que son fáciles para los humanos y difíciles para las máquinas:

mceclip1.png
  • ReCaptcha V2

La mayoría de los ReCaptcha V2 suelen tener un botón I'm not a robot(No soy robot); sin embargo, a veces, pueden contener preguntas sencillas similares a las de hCaptcha.

mceclip2.png
  • ReCaptcha V3

Parecido a V3, pero no tiene la caja de verificación


2. Cómo resolver hCaptcha y ReCaptcha V2 & V3

  • Haz clic en el flujo de trabajo

    mceclip3.png

  • Selecciona Resolver CAPTCHA

mceclip0.jpg
  • Haz clic en el recuadro Resolver CAPTCHA

  • Selecciona hCaptcha/ReCaptcha V2 como tipo de CAPTCHA

mceclip1.jpg

  • Haz clic en Aplicar para guardar la configuración

mceclip3.jpg

Nota:

hCaptcha y ReCaptcha no se resolverán automáticamente hasta una ejecución. Por lo tanto, es necesario activar el modo de navegar y resolverlo manualmente para proceder al crear la tarea/el flujo.

mceclip4.jpg

Octoparse sólo admite la resolución de estos tipos de captcha que incluyen un botón Enviar (o un botón de búsqueda/inicio de sesión). Para los que no tienen un botón Enviar, Resolver captcha no funcionará.


3. ¿Qué es ImageCaptcha?

ImageCaptcha es la forma original de verificar a los humanos. Puede utilizar palabras o frases conocidas o combinaciones aleatorias de dígitos y letras. Algunos ImageCaptchas también incluyen variaciones en las mayúsculas.

mceclip4.png

4. Cómo resolver ImageCaptcha

Para seguir el tutorial y resolver ImageCaptcha, podemos utilizar la siguiente URL:
https://democaptcha.com/demo-form-eng/image.html

a). Selecciona el Cuadro de Entrada y el Cuadro de Imagen para el Captcha

  • Haz clic en el Cuadro de Entrada para el Captcha

  • Selecciona Resolver Captcha en Tips

  • Haz clic en el Cuadro de imagen

  • Haz clic en el botón Iniciar sesión/Enviar/Confirmar para continuar (a veces pueden ser otros botones como "Enviar" en este caso concreto)

  • Haz clic en Confirmar en el Panel de Sugerencias

b). Configura un fallo de resolución de Captcha

Ahora, necesitamos entrenar a Octoparse para que resuelva el Captcha estableciendo un fallo de resolución.

  • Haz clic en el mensaje de error (en este caso - Se han detectado algunos errores en tu formulario: Código de verificación inválido)

  • Haz clic en Confirmar error en el panel de consejos

c). Configura un éxito en la resolución del Captcha

  • Haz clic en Configurar con éxito la resolución de CAPTCHA para pasar por el último paso

mceclip8.jpg
  • Ingresa el texto que aparece en el cuadro de imagen

  • Haz clic en Enviar respuesta CAPTCHA y completa la configuración

mceclip9.jpg

El captcha de imagen ha sido resuelto. El paso Resolver CAPTCHA se añadirá al flujo de trabajo y también podrá modificar la configuración bajo el flujo de trabajo.

mceclip10.jpg

Nota:

  • hCaptcha/ReCaptcha V2/ReCaptcha V3 pueden ser detectados automáticamente, por lo que no es necesario configurar XPath para localizarlos. Los CAPTCHA de imagen no pueden ser detectados sin XPath. Es necesario prestar atención al XPath en la configuración.

  • El costo es de $1/1 mil CAPTCHA. Un intento de resolver un CAPTCHA se cuenta como un crédito CAPTCHA. Así que resolver un CAPTCHA con éxito puede costar varios créditos CAPTCHA. Puede hacer clic en Recargar créditos para recargar. Los créditos CAPTCHA no se pueden reembolsar. Hemos enviado algunos créditos a los usuarios del plan Estándar/Profesional para que los prueben. Puedes probarlo antes de pagar los créditos.

  • Una vez agotados los créditos, la tarea no resolverá los captchas. Por lo tanto, antes de ejecutar la tarea, asegúrese de que hay suficientes créditos en su cuenta.

¿Ha quedado contestada tu pregunta?