Georgii Motrenko

Posted on Mar 25

Como substituí o departamento financeiro por uma cadeia de agentes de IA

#ai #automation #fintech #portuguese

Tenho uma regra simples: se uma tarefa se repete mais de duas vezes, é hora de delegar. Antes, eu delegava para pessoas. Agora, para agentes de IA que trabalham diretamente com bancos de dados, planilhas e gerenciadores de tarefas.

Em três meses, construí um sistema de 17 skills de IA que assumiram toda a geração de relatórios financeiros de uma plataforma B2B com mais de 200 parceiros. Sem uma única linha de código tradicional.

Contexto: uma plataforma B2B e a rotina financeira

Trabalho como PO em uma plataforma B2B na interseção entre seguros e finanças. Agregamos produtos financeiros para parceiros: bancos, instituições de crédito, marketplaces. Cada parceiro quer ver seu próprio funil - solicitações, conversões, desembolsos, comissões.

Com mais de 200 parceiros ativos, a geração de relatórios vira uma esteira:

Relatórios diários - toda manhã o parceiro espera os números do dia anterior
Conciliações mensais - centenas de linhas de operações detalhadas por fornecedores, com diferentes percentuais de divisão de receita
Solicitações pontuais - "me mostra a conversão desse produto nas últimas duas semanas"
Documentos jurídicos - geração de contratos-padrão para novos parceiros

2 a 3 horas por dia, duas pessoas. Um caso clássico para delegação - mas não havia para quem delegar. Então surgiu uma ferramenta capaz de trabalhar sozinha com SQL, APIs e planilhas.

Não é um agente - é uma cadeia de agentes

Uma distinção importante: não se trata de "um bot inteligente que faz tudo". É um sistema de agentes especializados, cada um resolvendo uma tarefa específica. Na terminologia do Claude Code, cada agente é uma skill (slash-command) com lógica claramente definida.

Os agentes estão conectados por uma infraestrutura compartilhada:

MCP server para o banco de dados (MS SQL, somente leitura) - o agente constrói consultas SQL e recupera dados
Google Sheets API - criação de planilhas, escrita de dados, formatação, fórmulas
Google Drive - armazenamento de arquivos, upload de exportações de fornecedores
Gerenciador de tarefas - sincronização com tarefas da equipe
GitLab API - análise de produtividade da equipe de desenvolvimento

Um agente gera relatórios financeiros. Outro executa conciliações mensais. Um terceiro coleta estatísticas da equipe de desenvolvimento. Um quarto transcreve gravações de reuniões e produz relatórios estruturados. Eles não se conhecem entre si, mas operam dentro de um único ecossistema.

Como funciona a skill mais usada: o relatório financeiro

O gestor digita um único comando - o nome do parceiro e um intervalo de datas. 40 segundos depois, um relatório completo aparece no Google Sheets. Veja o que acontece nesses 40 segundos:

1. Resolução da contraparte
O agente mantém um mapeamento de apelidos legíveis para identificadores internos. Não é preciso lembrar UUIDs - um nome curto é suficiente.

2. Consulta ao banco de dados
Uma consulta SQL é gerada, construindo o funil de um produto financeiro: solicitações -> transições -> desembolsos -> comissões. A consulta considera os status corretos das operações - isso por si só já é uma história à parte, porque a documentação do banco de dados nem sempre corresponde aos valores reais dos enums.

3. Agregação
Os dados são agrupados por dia, as taxas de conversão entre etapas são calculadas, os totais de comissão são somados. Parceiros diferentes têm condições diferentes de divisão de receita - o agente lida com isso.

4. Escrita e formatação
Uma planilha é criada ou atualizada: cabeçalhos, dados, linhas de resumo, formatos numéricos, largura das colunas. A formatação é aplicada estritamente após a escrita dos dados - se você fizer ambos simultaneamente, a API às vezes aplica estilos em células vazias (os dados ainda não chegaram).

5. Autoverificação
O agente relê o que escreveu e compara com os dados de origem. Isso não é paranoia - a Google Sheets API realmente descarta linhas durante escritas em lote. Sem verificação, erros são inevitáveis.

Conciliações mensais: quando um agente não é suficiente

O relatório diário é uma tarefa relativamente simples. A conciliação mensal é um nível completamente diferente.

O tráfego de um único parceiro pode passar por 3 a 4 fornecedores. Cada um tem seu próprio formato de exportação, suas próprias regras de correspondência de operações, suas próprias taxas de comissão. É preciso:

Baixar os arquivos dos fornecedores do armazenamento em nuvem
Conciliar cada operação com os dados do nosso banco
Calcular comissões com diferentes divisões para diferentes parceiros
Gerar uma planilha resumo com fórmulas
Tudo em um único documento, com abas separadas para cada contraparte

Antes, isso levava um dia inteiro de trabalho. Agora - um comando com dois parâmetros e 3 a 5 minutos de espera.

O que mais o sistema cobre

Em três meses, os agentes se expandiram muito além dos relatórios:

Skill	Tarefa	Tempo
Relatório Financeiro	Funil de um único parceiro	40 seg
Resumo Diário	Relatório de todos os parceiros ativos	2-3 min
Conciliação Mensal	Conciliação com fornecedores e fórmulas	3-5 min
Gerador de Contratos	Contrato-padrão para novo parceiro	1-2 min
Gestão de Equipe	Gerenciamento da equipe de produto	interativo
GitLab Analytics	Comparação de atividade de devs em 17 repos	2-3 min
Relatório de Reunião	Transcrição de reunião (600+ segmentos) -> relatório estruturado	3-5 min
Recrutamento	Busca de candidatos por parâmetros	interativo

17 skills, 9 MCP servers (SQL, Google Sheets, Drive, Calendar, Gmail, GitLab, Tracker, Telegram, GitHub). Nenhuma linha de Python, Go ou TypeScript. Toda a lógica vive em arquivos markdown com instruções para o agente.

Por que Claude Code, e não LangChain

Testei diversas abordagens:

ChatGPT + Zapier - primitivo demais, sem acesso direto ao banco de dados
LangChain/LangGraph - exige um desenvolvedor, ciclos longos de iteração
API customizada + GPT-4 - funciona, mas cada mudança = rebuild e redeploy

Claude Code venceu por uma única razão: ciclo de feedback de 30 segundos. Escreve a instrução -> testa -> corrige -> funciona. Sem deployment, sem CI/CD, sem Docker. Os MCP servers dão ao agente acesso direto à infraestrutura, e as skills são apenas arquivos de texto contendo lógica de negócio.

Arquitetura:

Claude Code - runtime, o cérebro
MCP servers - ponte para sistemas externos (banco de dados, Google, GitLab, Tracker)
Skills - arquivos markdown com instruções (lógica de negócio)
Google Sheets/Drive - camada de apresentação para os usuários

Armadilhas que vale a pena conhecer

A Google Sheets API não é atômica. Escreva 100 linhas - pode ser que encontre apenas 97 na planilha. A regra: sempre releia e verifique após cada escrita. Sem isso, bugs vão aparecer regularmente e silenciosamente.

A documentação do banco de dados mente. O MCP server para SQL retorna um glossário com descrições das tabelas. Mas os valores reais dos enums podem não corresponder à documentação. Perdemos um dia inteiro até começarmos a fazer join direto nas tabelas de referência, em vez de confiar no glossário.

Formatação é uma etapa separada. Se você escreve dados e aplica estilos simultaneamente, a API pode formatar células vazias (os dados ainda não chegaram). Primeiro os dados -> verificação -> depois o visual.

O contexto não é infinito. Ao processar grandes volumes (200+ linhas), o agente pode perder seu contexto inicial. A solução: o agente mantém um log de cada etapa e periodicamente o relê. Parece estranho, mas funciona - essencialmente, o agente cria sua própria "memória externa".

Merge commits inflam as estatísticas. Ao analisar produtividade via GitLab API, descobrimos que tanto commits de feature quanto merge commits são contados separadamente. E código autogerado (migrações de ORM) pode inflar as estatísticas em 20.000+ linhas. Sem filtragem, os números não fazem sentido.

Os apelidos das pessoas não batem entre sistemas. O mesmo desenvolvedor pode aparecer com nomes diferentes no GitLab, no gerenciador de tarefas e no e-mail corporativo. O agente mantém um mapeamento de apelidos - sem ele, relatórios de uma equipe de 11 pessoas simplesmente não fecham.

Os números

Métrica	Antes	Depois
Relatórios diários	2-3 horas/dia	5-10 minutos
Conciliação mensal	8 horas	5 minutos
Geração de contratos	2-3 horas	2 minutos
Erros em relatórios	3-5/mês	0 (verificação)
Pessoas na rotina financeira	2	0 (o PO resolve)

~60 horas-pessoa economizadas por mês. Custo do Claude Code - US$ 200/mês no plano Max.

Três coisas que aprendi

Agentes de IA são ferramenta de gestor, não de desenvolvedor. Um PO que entende o processo constrói automação funcional mais rápido do que uma equipe passando pelo ciclo clássico de especificação -> sprint -> review -> deploy. Porque não há tradução de "linguagem de negócio" para "código" e vice-versa.

MCP servers são o que transforma um chatbot em um operador. Sem acesso a bancos de dados e APIs, um agente só consegue gerar texto. Com MCP, ele se torna um participante pleno do fluxo de trabalho - operando os mesmos sistemas que um funcionário humano usaria.

Verificação importa mais do que geração. 80% do esforço foi dedicado não aos prompts, mas ao sistema de verificação. Cada etapa é checada: os dados foram escritos? As fórmulas batem? A formatação está correta? Um agente que não verifica seu próprio trabalho é um agente que eventualmente vai falhar silenciosamente.

Se você é um gestor que gasta horas em rotina de dados - comece com uma skill. Automatize o relatório mais doloroso. Quando você vir uma tarefa de três horas concluída em um minuto - as outras 16 skills vão surgir naturalmente.

Sobre o autor: Georgii Motrenko - PO / Head of Product Growth em uma plataforma B2B de InsurTech/FinTech. Construindo cadeias de agentes de IA para automatizar operações financeiras e de produto.

Me siga: