Vinicius Cardoso Garcia

Posted on Dec 29, 2025 • Edited on Jan 27

IA na Engenharia de Software: Revolução Inevitável ou Hype Bem Embalado?

#ai #programming #career #softwareengineering

Nos últimos anos, ferramentas como GitHub Copilot, Amazon CodeWhisperer e assistentes baseados em Large Language Models (LLMs) deixaram de ser curiosidades de laboratório para se tornarem companheiras diárias de milhões de desenvolvedores. Em 2025, mais de 15 milhões de pessoas já utilizam o Copilot e mais de 50 mil organizações o incorporaram em seus pipelines de desenvolvimento, incluindo grande parte das empresas Fortune 100 [1, 2]. Paralelamente, a Stack Overflow Developer Survey 2024 revelou que cerca de 76% dos desenvolvedores já usaram ou planejaram usar ferramentas de IA em seu processo de desenvolvimento, embora apenas uma fração confie plenamente na precisão dessas ferramentas [3].

Esse contraste entre adoção massiva e confiança limitada sintetiza o dilema central desta disciplina: a IA está, de fato, transformando a Engenharia de Software, mas de forma desigual, com ganhos visíveis e riscos ainda mal compreendidos. Este tema inaugural parte de uma premissa simples e provocativa: para a próxima geração de engenheiros de software, trabalhar sem IA será tão estranho quanto programar hoje sem controle de versão. Ao mesmo tempo, nada garante que essa transição será linear ou benigna, nem que todos os perfis profissionais serão igualmente valorizados nesse novo cenário.

O objetivo deste texto é oferecer uma visão holística do impacto da IA no ciclo de vida de desenvolvimento de software (SDLC), introduzir os conceitos fundamentais de IA, Machine Learning, Deep Learning e LLMs, discutir seus papéis concretos na prática industrial, e preparar o terreno para a Metodologia Sinfonia, que guiará o projeto final da disciplina. A expectativa é que você termine a leitura não com respostas prontas, mas com boas perguntas, e uma base conceitual sólida para debatê-las em aula.

1. Do SDLC Clássico ao SDLC Assistido por IA

O ciclo de vida tradicional do desenvolvimento de software organiza o trabalho em etapas como requisitos, projeto, implementação, testes, implantação e manutenção. Em modelos ágeis, essas fases se tornam ciclos curtos, mas os tipos de atividade permanecem. Por décadas, a automação concentrou-se em tarefas como controle de versão, integração contínua e testes automatizados. A diferença da onda atual é que a IA não apenas automatiza tarefas repetitivas; ela passa a propor soluções, escrever código, revisar artefatos e tomar decisões com menor intervenção humana.

Pesquisas recentes sobre "AI4SE" (AI for Software Engineering) mostram que as aplicações de IA cobrem hoje uma gama ampla de tarefas: previsão de defeitos, priorização de issues, geração e reparo de código, síntese de documentação e até apoio à elicitação de requisitos a partir de linguagem natural [4, 5]. Modelos de aprendizado supervisionado vêm sendo usados há mais de uma década para prever módulos com maior probabilidade de falha, com melhorias significativas de precisão quando combinados com técnicas modernas de ML. No estágio de testes, técnicas de aprendizado por reforço têm sido exploradas para gerar suítes de teste que maximizem cobertura e revelem falhas sutis.

Na prática industrial, LLMs ampliam esse espectro ao funcionar como "companheiros de pair programming" capazes de gerar código, explicar APIs e sugerir refatorações em tempo real. Ferramentas como Copilot e CodeWhisperer já são usadas para acelerar a escrita de código boilerplate, criar testes unitários e até propor correções de vulnerabilidades de segurança. Em organizações como Accenture e Infosys, estudos internos relatam ganhos de produtividade variando de 25% a 50% em determinados perfis e tarefas, especialmente entre desenvolvedores juniores e em atividades repetitivas [1, 6].

Contudo, pesquisas empíricas indicam que LLMs podem gerar código funcional porém vulnerável, com taxas de insegurança entre 10% e 40% dos trechos produzidos, dependendo do tipo de vulnerabilidade e do modelo avaliado [7]. Isso evidencia a necessidade de manter o engenheiro humano no centro do processo, como curador crítico das sugestões da máquina. O SDLC assistido por IA, portanto, não substitui o ciclo clássico, mas o sobrepõe com uma camada inteligente que permeia cada fase — da elicitação de requisitos à manutenção de sistemas legados.

2. Conceitos Fundamentais: IA, ML, Deep Learning e LLMs

Para navegar criticamente nesse novo cenário, é importante compreender os pilares técnicos da IA moderna. Em termos amplos, Inteligência Artificial define sistemas capazes de executar tarefas que, se realizadas por humanos, seriam consideradas inteligentes, desde classificação de imagens até planejamento de rotas [8]. Dentro desse guarda-chuva, o Machine Learning (ML) foca em algoritmos que aprendem padrões a partir de dados, em vez de serem explicitamente programados para cada regra.

No aprendizado supervisionado, o modelo recebe exemplos de entrada com rótulos (por exemplo, módulos de código marcados como "defeituosos" ou "não defeituosos") e aprende a prever esses rótulos para novos dados. Essa abordagem é amplamente usada em previsão de defeitos, classificação de issues e identificação de trechos de código vulneráveis. Já o aprendizado não supervisionado trabalha sem rótulos explícitos, buscando agrupar elementos semelhantes ou descobrir estruturas ocultas, aplicável, por exemplo, à clusterização de requisitos similares ou agrupamento de logs de execução para detectar anomalias. O aprendizado por reforço envolve um agente que interage com um ambiente recebendo recompensas ou punições; em ES, tem sido explorado em tarefas como geração de testes que maximizem cobertura ou agentes de refatoração que buscam melhorar métricas de qualidade [8].

A partir de 2012, avanços em Deep Learning, redes neurais profundas com múltiplas camadas, revolucionaram áreas como visão computacional e processamento de linguagem natural. O ponto de inflexão para texto foi a introdução da arquitetura Transformer em 2017, que substituiu estruturas recorrentes (RNNs, LSTMs) por mecanismos de atenção auto-regressiva capazes de processar sequências em paralelo. Diferente de RNNs, que percorrem o texto token a token, Transformers usam múltiplas "cabeças de atenção" que aprendem a focar em diferentes partes da entrada simultaneamente, capturando dependências de longo alcance de forma mais eficiente.

Large Language Models (LLMs) como GPT, Claude, Gemini e modelos open source (Code Llama, DeepSeek, Qwen, StarCoder) são redes com dezenas ou centenas de bilhões de parâmetros, treinadas em corpora massivos de texto e código. Surveys recentes mostram que, quando adaptados a tarefas de código, esses modelos alcançam desempenho competitivo em benchmarks como HumanEval, MBPP e BigCodeBench, incluindo geração de funções completas, síntese de testes e correção de bugs [4, 5]. Esses fundamentos técnicos servem a um propósito pedagógico: permitir que você enxergue as ferramentas não como caixas-pretas mágicas, mas como sistemas estatísticos com capacidades, vieses e limites bem definidos.

3. LLMs na Prática: Produtividade, Limites e Riscos

Talvez o aspecto mais tangível da IA na Engenharia de Software hoje seja o uso de assistentes de código no dia a dia de desenvolvimento. Um estudo conduzido pelo GitHub com desenvolvedores da Accenture relata que o uso do Copilot levou a aumentos de velocidade de até 55% em tarefas específicas, além de melhorias na satisfação dos desenvolvedores e na taxa de merge de pull requests [1]. Avaliações da AWS com CodeWhisperer apontam que participantes usando a ferramenta foram, em média, 57% mais rápidos para completar desafios de programação, com maior probabilidade de concluir as tarefas com sucesso [9]. Esses ganhos são particularmente marcantes em tarefas repetitivas, como escrever boilerplate, consultas a APIs conhecidas ou testes simples.

Entretanto, esses números positivos convivem com resultados mais ambíguos em estudos acadêmicos rigorosos. Pesquisas sobre geração de código seguro com LLMs mostram que, em cenários de programação de segurança crítica, entre 9,8% e 42,1% dos trechos gerados pelos modelos contêm vulnerabilidades, mesmo quando o código compila e passa em testes básicos [7]. Outras avaliações indicam que benchmarks populares podem superestimar a competência dos modelos devido a vazamentos de dados de treinamento — o modelo "lembra" soluções vistas no treinamento em vez de demonstrar entendimento genuíno do problema [10]. Além disso, estudos qualitativos destacam problemas de "alucinação" de APIs inexistentes, geração de soluções que parecem plausíveis mas violam requisitos não funcionais, e tendência a reforçar práticas de código duvidosas presentes em dados históricos.

A Stack Overflow Developer Survey 2024 mostrou uma tensão interessante: embora 76% dos respondentes usem ou pretendam usar ferramentas de IA, apenas cerca de 40-45% dizem confiar na precisão das respostas para tarefas mais complexas [3]. Discussões em comunidades técnicas apontam que o principal valor dessas ferramentas está na aceleração de tarefas simples e na aprendizagem de novas bibliotecas, enquanto sua utilidade decai em problemas mais arquiteturais ou de domínio profundo. A IA parece excelente em escrever "o código que você teria escrito de qualquer jeito", mas ainda é muito menos confiável para decidir "qual código deveria existir" em sistemas complexos.

Há também uma dimensão ética e jurídica que não pode ser ignorada. Trabalhos recentes sobre ética de programação com GenAI discutem riscos de violação de direitos autorais em código gerado, falta de transparência sobre dados de treinamento e propagação de vieses presentes em código histórico [11, 12]. Em contextos regulados (financeiro, saúde, setor público), a adoção pode exigir políticas explícitas de rastreabilidade, revisões humanas formais e mecanismos de mitigação de risco. Quem é responsável por um bug crítico introduzido por código gerado por IA? Como documentar o uso da ferramenta para fins de auditoria?

4. Transformação de Papéis: Substituição, Augmentation e o Futuro da Profissão

Em paralelo ao avanço técnico, cresce o debate sobre o futuro da profissão de desenvolvedor. Previsões mais alarmistas sugerem que até 2040 máquinas poderiam escrever a maior parte do código necessário. Declarações de CEOs de grandes empresas de tecnologia, mencionando pausas em contratações ou a possibilidade de IA "fazer o trabalho de um engenheiro nível médio", alimentam essa narrativa de substituição.

Por outro lado, dados recentes indicam que, em vez de reduzir o número de desenvolvedores, a IA tem aumentado a demanda por habilidades de software, ao permitir que equipes façam mais em menos tempo e expandam o escopo de produtos digitais [9]. Desenvolvedores que usam intensamente ferramentas de IA relatam maior produtividade e, em muitos casos, mais satisfação com o trabalho, desde que mantenham autonomia e senso de autoria. A visão emergente é a de "AI teammates" ou "SE 3.0": sistemas autônomos ou semi-autônomos que colaboram com humanos em tarefas de desenvolvimento, mas sob supervisão de engenheiros que assumem papéis de orquestração, curadoria e governança [13].

O que isso significa para estudantes entrando na área agora? Primeiro, tarefas de nível mais operacional como, pr exemplo, escrever código boilerplate, traduzir entre linguagens, implementar padrões triviais, tendem a ser progressivamente automatizadas. Segundo, competências que ganham importância incluem: formulação de problemas e prompts de alta qualidade; capacidade de avaliar criticamente sugestões da IA; entendimento profundo de domínios de negócio; e habilidades de engenharia de sistemas, não apenas de código. Há um deslocamento da ênfase exclusiva em "saber programar" para "saber projetar sistemas sociotécnicos" que integram humanos, IA, processos e restrições regulatórias.

5. Metodologia Sinfonia: Orquestrando Humanos e IA no Projeto Final

A Metodologia Sinfonia será o framework do projeto final desta disciplina, funcionando como "fio condutor" que integra conceitos de IA, práticas de Engenharia de Software e reflexão crítica [14]. A Sinfonia enxerga o desenvolvimento de software como uma orquestra: diversos "naipes" (requisitos, arquitetura, implementação, testes, operação) atuam em harmonia, e a IA é introduzida não como solista substituto, mas como instrumentos adicionais que ampliam as possibilidades expressivas da equipe. A questão central deixa de ser "quanto da pipeline podemos automatizar?" e passa a ser "como desenhar interações humano-IA que maximizem valor e minimizem risco?".

A metodologia estrutura o projeto em ciclos onde cada etapa do SDLC é analisada sob três perspectivas: (a) quais tarefas podem ser assistidas por IA; (b) quais riscos técnicos, éticos e organizacionais essa assistência traz; e (c) quais mecanismos de controle, auditoria e aprendizado contínuo serão adotados. Outro elemento central é a transparência: cada decisão de uso de IA deve ser documentada, incluindo o racional, as ferramentas escolhidas, as limitações conhecidas e o impacto observado. A metodologia enfatiza a natureza iterativa do aprendizado: erros por confiar demais (ou de menos) em IA são analisados explicitamente, alimentando ajustes nas práticas do time.

A Sinfonia também articula quatro pilares de viabilidade que todo projeto deve satisfazer: ser Desejável (gera valor real para usuários?), Viável (faz sentido economicamente?), Factível (temos capacidade técnica?) e Defensável (é ético, seguro e compliance?). Esta visão holística reconhece que soluções tecnicamente brilhantes podem falhar se negligenciarem dimensões humanas, econômicas ou éticas [14].

6. Navegando Entre Promessas e Realidades

À medida que iniciamos esta jornada pela Engenharia de Software Assistida por IA, é importantíssimo manter uma postura de ceticismo informado ou, como diria Ariano Suassuna, ser um realista esperançoso. Os ganhos de produtividade são reais e documentados, mas também o são os riscos e limitações. A IA não elimina a necessidade de expertise humana em engenharia de software; ela a transforma e, em muitos aspectos, a intensifica. Desenvolvedores que dominam estas ferramentas precisam simultaneamente compreender suas limitações e saber quando confiar, e quando questionar, suas sugestões.

O "vale da morte" dos projetos de IA, mencionado na literatura [14, 15], não surge por falta de talento técnico, mas frequentemente pela ausência de metodologias que harmonizem as diferentes disciplinas envolvidas. A lacuna entre a estratégia (o que queremos construir?) e a execução (como construímos de forma confiável?) permanece um desafio central. Frameworks de inovação são excelentes para exploração inicial; metodologias ágeis oferecem ritmo disciplinado para entrega; mas a ponte entre estes mundos, especialmente no contexto probabilístico da IA, ainda está sendo construída.

A prática atual sugere um quadro menos hollywoodiano e mais nuançado: LLMs são poderosos aceleradores, especialmente em tarefas granulares e repetitivas, mas trazem riscos de segurança, qualidade e responsabilidade que exigem novos processos, métricas e competências humanas. Uma questão central para o debate: esses riscos são "apenas" questões de maturidade tecnológica ou revelam limites estruturais de modelos puramente estatísticos para substituir o raciocínio de engenheiros experientes?

Referências

[1] GitHub (2024). "Research: Quantifying GitHub Copilot's impact in the enterprise with Accenture."

Link: https://github.blog/news-insights/research/research-quantifying-github-copilots-impact-in-the-enterprise-with-accenture/
Por que ler: Dados concretos de produtividade, satisfação e ROI com Copilot em grande empresa de consultoria.

[2] Tenet (2025). "GitHub Copilot Usage Data Statistics."

Link: https://www.wearetenet.com/blog/github-copilot-usage-data-statistics
Por que ler: Dados atualizados de adoção, produtividade e ROI do Copilot em 2025.

[3] Stack Overflow (2024). "2024 Developer Survey – AI section."

Link: https://survey.stackoverflow.co/2024/ai
Por que ler: Como desenvolvedores usam e percebem ferramentas de IA, incluindo níveis de confiança.

[4] Hou, X. et al. (2023-2025). "Large Language Models for Software Engineering: A Systematic Literature Review."

Link: https://arxiv.org/abs/2308.10620
Por que ler: Visão abrangente de quase 400 estudos sobre usos, limitações e tendências de LLMs em ES.

[5] Jiang, J. et al. (2024). "A Survey on Large Language Models for Code Generation."

Link: https://arxiv.org/abs/2406.00515
Por que ler: Estado da arte em LLMs para geração de código, incluindo benchmarks, desafios éticos e impactos práticos.

[6] Deniz, B. et al. (2023). "Unleashing Developer Productivity with Generative AI." McKinsey Digital.

Link: https://www.mckinsey.com/capabilities/mckinsey-digital/our-insights/unleashing-developer-productivity-with-generative-ai
Por que ler: Dados quantitativos sobre impacto de IA generativa na produtividade de desenvolvedores.

[7] Yan, H. et al. (2025). "Guiding AI to Fix Its Own Flaws: An Empirical Study on LLM-Driven Secure Code Generation."

Link: https://arxiv.org/abs/2506.23034
Por que ler: Dados quantitativos sobre como LLMs frequentemente geram código vulnerável e técnicas de mitigação.

[8] Russell, S. & Norvig, P. (2020). Artificial Intelligence: A Modern Approach (4ª ed.). Pearson.

Por que ler: O livro-texto definitivo em IA. Capítulos 1 e 19-21 oferecem excelente contextualização histórica e conceitual sobre aprendizado de máquina.

[9] Dohmke, T. (2023). "The Economic Impact of the AI-Powered Developer Lifecycle and Lessons from GitHub Copilot." GitHub Blog.

Link: https://github.blog/news-insights/research/the-economic-impact-of-the-ai-powered-developer-lifecycle-and-lessons-from-github-copilot/
Por que ler: Perspectiva do GitHub sobre adoção do Copilot, incluindo taxas de aceitação de sugestões e impacto econômico.

[10] Harding, W. & Kloster, M. (2024). "Coding on Copilot: 2023 Data Shows Downward Pressure on Code Quality." GitClear.

Link: https://www.gitclear.com/coding_on_copilot_data_shows_ais_downward_pressure_on_code_quality
Por que ler: Contrapontos críticos às narrativas otimistas, com análise de métricas de qualidade de código. Essencial para visão balanceada.

[11] UNESCO (2024). "Recommendation on the Ethics of Artificial Intelligence."

Link: https://www.unesco.org/en/artificial-intelligence/recommendation-ethics
Por que ler: Princípios e diretrizes éticas para adoção de IA em contextos sensíveis.

[12] Khojah, R. et al. (2024). "Ethics of Software Programming with Generative AI."

Link: https://arxiv.org/abs/2408.10554
Por que ler: Dilemas éticos específicos de uso de GenAI para gerar código, incluindo propriedade intelectual e responsabilidade.

[13] Hassan, A. et al. (2024-2025). "The Rise of AI Teammates in Software Engineering (SE 3.0)."

Link: https://arxiv.org/abs/2507.15003
Por que ler: Introduz o conceito de "AI teammates" e discute empiricamente a colaboração humano-IA em projetos reais.

[14] Garcia, V. & Medeiros, W. (2025). Sinfonia: Metodologia para Desenvolvimento de Produtos de IA. TDS Books.

Link: https://github.com/assertlab/sinfonia & https://a.co/d/23ouD46
Por que ler: Framework metodológico que estruturará o projeto final da disciplina. Capítulos 1-2 são leitura obrigatória.

[15] Meira, S. (2024). "The Impact of Artificial Intelligence on Software Engineering: A Holistic Perspective." TDS Books.