DEV Community

Cover image for AI Agents, Comandos de Voz e uma nova forma de criar software
Ricardo Mello
Ricardo Mello

Posted on

AI Agents, Comandos de Voz e uma nova forma de criar software

A forma que a gente trabalha há muito tempo não me parece a ideal. Eu posso até não ter achado a forma ideal ainda, mas eu continuo nessa procura. Eu realmente acho que depois de a tecnologia evoluir tanto, a gente não precisa mais trabalhar como datilógrafos do século passado.

Se você parar pra observar o quanto o nosso modelo de trabalho evoluiu nos últimos anos comparado às tecnologias que a gente desenvolve, você vai notar um gap muito grande. A gente desenvolveu aplicações distribuídas, blockchain, inteligência artificial, visão computacional, e muitas outras coisas absurdamente incríveis, ao mesmo tempo que nós continuamos fazendo isso sentados (alguns de pé) escrevendo em uma tela branca – pode me zoar, eu não uso dark mode.

Os softwares de reconhecimento de voz eram horríveis sim, mas o Ditado do Mac não é mais aquela coisa primitiva que rodava em um Symbian. E se você não conhece o Symbian, me avisa pra eu parar de usar exemplos velhos.

Eu imagino que essas ferramentas só vão melhorar ao longo do tempo, e sinceramente eu não quero ficar parado no tempo fazendo coisas como eu fazia lá em 2010. Te convido a fazer o mesmo.

Tenho testado algumas formas diferentes de trabalhar nesses últimos anos. Isso inclui inteligência artificial, comandos de voz, e até o amado/odiado vibe coding. Quero compartilhar dois pontos que estão mudando a minha forma de trabalhar, e talvez mude a sua também.

1. AI Agents

A menos que você esteja vivendo em uma caverna, você já deve ter ouvido falar de AI Agents. Resumindo de uma forma bem rasa, um AI agent é um ChatGPT turbinado que executa tarefas de forma autônoma direto na sua IDE. Ele cria features, altera arquivos e roda comandos com um único prompt, o que te permite realizar mudanças significativas em segundos.

AI Agents são o presente, e eu recomendo fortemente que façam parte do seu workflow. Dependendo da linguagem você pode querer usar uma IDE com o AI Agent e outra que você se sentir mais confortável pra programar, mas vale muito a pena. O ganho de produtividade é absurdo, e do momento que você cria o seu próprio framework com o Cursor Rules ou similar, o Agent começa a gerar um código bem parecido com o que você escreveria.

Pensando em time, você também consegue adicionar essas regras ao repositório, e outras pessoas do time usando AI Agents terão resultados parecidos. Você também pode pedir uma revisão de código pro seu Agent baseado nas regras antes de submeter pra revisão do time.

A lista de prós é extensa, e vale o teste. Minha lista de AI Agents favoritos tem: Cursor, GitHub Copilot e WindSurf. O Claude Code é muito bom, mas ele roda no terminal e não na IDE.

P.S.: Se alguém usa a AI da JetBrains, defende ela aqui porque eu não curti muito.

2. Ditado e comandos de voz

Algo relativamente antigo, genérico e que funciona em várias aplicações diferentes é o Ditado. A proposta é bem simples: você consegue escrever falando. Isso serve pra mandar mensagens, pedir pra inteligência artificial criar alguma coisa, ou pedir pra Siri tocar uma música. Isso vai te fazer pensar duas vezes antes de mandar aquele áudio que poderia ser uma mensagem.

Eu não sou um heavy user da Siri, tenho conhecimento muito básico de assistentes, e mantenho o "Hey Siri" desativado porque eu ainda sou meio bolado com um celular ou computador me ouvindo o tempo todo, mas tenho mudado minha cabeça quanto isso porque eu acho algo inevitável.

"Ah mas o ChatGPT tem modo voz". Concordo totalmente, mas o modo de voz do ChatGPT não vai abrir o seu WhatsApp e mandar uma mensagem (ainda), ou escrever algo dentro da sua IDE. Se você aliar o ditado do mac ou do Windows a uma IDE com AI Agent, você vai simplesmente abrir uma classe de entity, e dizer em voz alta "create a repository for this entity". Voilà. O AI Agent vai começar criar.

Eu não sei dizer a qualidade dos prompts em português, mas no teste que eu fiz funcionou perfeitamente. Até porque os modelos usados são o Claude, GPT, Gemini, e outros grandes que a gente já usa no dia a dia.

Aqui vão os links sobre como habilitar o modo de ditado: macOS e Windows.

Conclusão

Falar com uma AI, ver ela programando e só revisar o resultado me faz sentir o Homem de Ferro falando com o Jarvis. Eu acho algo incrível e que só tem a melhorar no futuro.

A maioria dessas ferramentas possuem um período de testes gratuito, então vale muito a pena fazer um teste. Te garanto que você vai curtir um bocado. Dica: O Claude é meu modelo favorito mesmo no GitHub Copilot, mas embora eu tenha usado o Copilot desde os betas, hoje eu tô no time do Cursor.

Ainda me vejo escrevendo prompts muito mais pelo costume do que pela facilidade. Mudar a forma de trabalhar depois de mais de uma década é complicado. E se você tem LER, que são aquelas lesões por esforço repetitivo, isso vai te ajudar um bocado a digitar menos e aliviar elas também – mas não esqueça da fisioterapia.

Top comments (0)