DEV Community

Mário Queiroz
Mário Queiroz

Posted on • Updated on

Tentativa de quebrar CAPTCHA usando Python - Mais um experimento de fim de semana

E nesses finais de semana sem muito o que fazer e sem poder sair de casa, nada melhor do que testar os conhecimentos em algumas coisas aleatórias. Dessa vez a ideia foi tentar quebrar alguns CAPTCHAS que me tiraram do sério em consultas rotineiras que precisava fazer no trabalho. Coisa pouca: só algumas centenas (claro que o que pôde ser automatizado, foi).

Como há alguns meses atrás eu já havia feito algumas coisas utilizando processamento de imagem (bem superficialmente), achei que seria legal tentar ver o que de bom poderia sair ao tentar resgatar o que aprendi na época. E o resultado até que foi legal para uma madrugada.

Até agora cerca de 80 linhas de código (ainda não refatorado) e que já produzem um resultado aproximado:

Como dá pra ver no vídeo, em quase todas as tentativas apenas uma letra da imagem não é reconhecida corretamente. Ainda estou fazendo diversos testes e adaptando o algoritmo pra tentar corrigir isso. Quando o código estiver mais organizado, pretendo compartilhar com vocês no GitHub.

As ferramentas que estou utilizando são: Python, Pillow, Tesseract e Matplotlib.

Não espero com esse projeto atingir 100% de sucesso no reconhecimento dos caracteres. Quero apenas ter a base desse conhecimento para, quem sabe, aplicar em outras demandas.

Se alguém aí já tentou a mesma coisa parecida e teve algum resultado interessante, só comentar aí que a gente vai trocando ideias.

Até o próximo post!

Top comments (0)