É e sempre foi um o grande mito de que a IA viria para baratear drasticamente a operação de tecnologia está colidindo com dados brutais. Em gigantes como a Nvidia, o custo de computação para sustentar modelos de IA já superou o custo com a folha de pagamento.
Não estamos falando de economizar centavos, estamos falando de um investimento de risco que, para muitas empresas, ainda não "se paga".
O Caso Uber: O Canário na Mina de Carvão
Em abril de 2026, o CTO da Uber admitiu que o orçamento anual para IA foi consumido em apenas quatro meses. Sim, isso mesmo: 4 MESES! Essa é a nova moda no Vale do Silício, a de extinguir tokens e exigir o máximo dos LLMs e agentes, a moda do Tokenmaxxing.
Motivo? O sucesso do Claude Code. A ferramenta é tão eficiente para as equipes de desenvolvedores que o uso escalou sem controle, provando que, sem governança, a IA é um buraco negro financeiro.
A Bolha da Eficiência e os Custos Ocultos
Embora a promessa seja de automação total, a realidade é que apenas 18% a 25% dos projetos de IA conseguem superar o custo de capital. O desenvolvimento, a integração e, principalmente, a manutenção e o custo de tokens criam uma barreira de entrada pesada.
As Big Techs (Alphabet, Meta, Microsoft e Amazon) planejam investir US$ 725 bilhões este ano, um aumento de 92%. Mas a pergunta permanece: até quando esse nível de gasto é sustentável? Será que US$ 725 BI com tokens de IA compensa mesmo?
Observe alguns pontos críticos:
70% de código commitado no GitHub já é gerado por IA. Alguns repositórios vivem com altas taxas de automação. Relatos indicam casos extremos onde cerca de 70% do código foi commitado via agentes de IA, como o Claude Code, evidenciando uma mudança drástica na produtividade e no processo de desenvolvimento. O uso livre e indiscriminado (sem filtro) de agentes de IA para código pode levar ao esgotamento rápido de orçamentos de tokens, exigindo monitoramento financeiro próximo.
US$ 145 bi projeção de gastos da Meta Platforms com infraestrutura em 2026. Este aumento é voltado para a expansão massiva de data centers e a compra de componentes para inteligência artificial, impulsionado por custos mais altos de memória. A CFO da Meta, Susan Li, admitiu que a empresa subestimou a necessidade de capacidade computacional, justificando o aumento no ritmo de investimentos. A projeção de 2026 representa quase o dobro dos US$ 72,2 bilhões gastos em 2025.
O anúncio causou queda nas ações da empresa (NASDAQ: META), com investidores preocupados com o impacto da queima de caixa no retorno de longo prazo. Em contrapartida, a empresa indicou que deve realizar demissões para priorizar o orçamento (já postei anteriormente sobre a falácia da reestruturação aqui). 92% de aumento nos investimentos de IA pelas Big Techs este ano.
Relatórios baseados nos balanços do primeiro trimestre de 2026 indicam um aumento massivo, com algumas estimativas apontando um salto de cerca de 92% no capex (despesas de capital) combinado em relação ao ano anterior. Este montante (o aumento de 92%) representa quase o dobro dos 410 bilhões gastos em 2025, evidenciando uma corrida feroz pela dominância na tecnologia e novamente, a falácia da reestruturação.
O custo mensal de API de inteligência artificial (LLMs) por engenheiro é de US$ 2.000 em alguns cenários. Esse valor alto geralmente não se refere ao uso casual, mas a cenários específicos de "IA-first" e automação pesada. Engenheiros usam agentes que escrevem, testam e refatoram código autonomamente. Esses sistemas consomem muitos tokens devido a loops de raciocínio e reavaliação constante. Modelos com contexto longo (como Gemini Pro 2.5 ou GPT-4.1) são usados para enviar repositórios inteiros de código a cada requisição, resultando em altos custos de entrada.
Onde está o erro?
IA é ferramenta, não é a solução final. Precisamos entender que a IA é uma ferramenta extraordinária, mas ela não substitui a estratégia, a governança e o discernimento humano. O "grande roll-back" acontece quando as empresas percebem que:
-- IA sem FinOps é prejuízo: Adotar IA sem alertas de billing e limites de consumo é o mesmo erro cometido na migração para a cloud há uma década.
-- Vibe Coding vs. ROI Real: Não adianta os engenheiros se sentirem rápidos se o custo dessa velocidade for maior que o lucro gerado.
-- Dívida Técnica Agêntica: Código gerado por IA sem revisão humana robusta é uma bomba relógio de manutenção.
O pé no chão será o novo diferencial
O momento não é de abandonar a IA, mas de usá-la com maturidade. O mercado está filtrando quem usa a tecnologia para "parecer inovador" de quem a usa para ser verdadeiramente eficiente.
O "grande roll-back" é, na verdade, uma correção de rota: a IA não vai se sustentar baseada apenas em hype. Ela precisa provar seu valor econômico no mundo real.
Top comments (0)