DEV Community

Cover image for Quebra de CAPTCHA utilizando IA: Comparando ChatGPT e Google Gemini
Roniere da silva marques
Roniere da silva marques

Posted on

Quebra de CAPTCHA utilizando IA: Comparando ChatGPT e Google Gemini

Neste artigo, vamos explorar como utilizar a inteligência artificial (IA) para quebrar CAPTCHA, utilizando duas ferramentas principais: o Google Gemini AI e o ChatGPT. Além disso, utilizaremos o Studio, uma opção avançada para desenvolvedores, com funcionalidades específicas para testar essa tarefa. Nosso objetivo é verificar qual dessas IAs se sai melhor em reconhecer e quebrar CAPTCHA, que, em sua forma básica, é uma imagem contendo letras e números.

Testando diferentes tipos de CAPTCHA

Para o experimento, decidimos trabalhar com CAPTCHAs simples, compostos por letras e números. Poderíamos expandir os testes para outros tipos de CAPTCHA, mas, inicialmente, focaremos nesse formato mais comum. Nosso primeiro teste será com o CAPTCHA usado no boletim escolar da SEDUC (Secretaria da Educação), onde precisamos digitar um código para acessar as informações.

Primeiros passos com o ChatGPT

Comecei o teste com o ChatGPT, porém encontrei dificuldades técnicas relacionadas à minha conta. Ao que tudo indica, o problema era a falta de tokens suficientes, o que me impediu de fazer o upload da imagem. Resolvi o problema entrando em outra conta, e finalmente consegui prosseguir.

Testando o CAPTCHA com o Google Gemini

Enquanto resolvia os problemas com o ChatGPT, decidi testar o mesmo CAPTCHA no Google Gemini. Após enviar a imagem, o Gemini tentou reconhecer o código, mas errou algumas letras. O CAPTCHA correto era "2VUS", mas a IA do Google confundiu o "V" com um "L", gerando um resultado incorreto.

Voltando ao ChatGPT

Com os problemas de conta resolvidos, pude testar o CAPTCHA no ChatGPT. Após enviar a imagem, ele processou corretamente o código, acertando o CAPTCHA. Isso demonstra que, ao menos nesse caso específico, o ChatGPT conseguiu quebrar o CAPTCHA com sucesso, enquanto o Google Gemini não foi tão eficiente.

Testando um CAPTCHA gerado

Em seguida, usei um gerador de CAPTCHAs numéricos, um formato que é geralmente mais simples. Neste caso, o Google Gemini se saiu melhor, conseguindo reconhecer os números sem problemas. A principal diferença aqui é que os CAPTCHAs numéricos têm menos complexidade visual, facilitando o reconhecimento.

Dificuldades com CAPTCHAs com espaços

Outro tipo de CAPTCHA que testei foi um com letras e espaços em branco entre elas. Esse formato apresentou maior dificuldade para o Google Gemini, que se confundiu com os espaços, comprometendo a leitura correta do código. Mesmo com várias tentativas, o resultado não foi satisfatório. Já o ChatGPT mostrou-se mais eficiente, ainda que os CAPTCHAs mais complexos exijam prompts mais específicos para melhorar o reconhecimento.

Conclusão

Nos testes realizados, o ChatGPT mostrou-se mais eficiente em quebrar CAPTCHAs que envolvem letras e imagens mais complexas, enquanto o Google Gemini se destacou no reconhecimento de CAPTCHAs numéricos, que apresentam menor complexidade visual. Embora ambos tenham pontos fortes e fracos, o ChatGPT parece lidar melhor com a complexidade de CAPTCHAs mistos, enquanto o Google Gemini pode ser mais eficiente em tarefas mais simples, como CAPTCHAs puramente numéricos.

Isso mostra que o desempenho dessas IAs pode variar dependendo do tipo de CAPTCHA utilizado, e que é possível utilizar automações e bots para facilitar a raspagem de informações em plataformas geradoras de contas como Roblox, Nintendo, Twitter, entre outros, conforme os testes realizados demonstraram.

Top comments (0)