Tenho uma regra simples: se uma tarefa se repete mais de duas vezes, é hora de delegar. Antes, eu delegava para pessoas. Agora, para agentes de IA que trabalham diretamente com bancos de dados, planilhas e gerenciadores de tarefas.
Em três meses, construí um sistema de 17 skills de IA que assumiram toda a geração de relatórios financeiros de uma plataforma B2B com mais de 200 parceiros. Sem uma única linha de código tradicional.
Contexto: uma plataforma B2B e a rotina financeira
Trabalho como PO em uma plataforma B2B na interseção entre seguros e finanças. Agregamos produtos financeiros para parceiros: bancos, instituições de crédito, marketplaces. Cada parceiro quer ver seu próprio funil - solicitações, conversões, desembolsos, comissões.
Com mais de 200 parceiros ativos, a geração de relatórios vira uma esteira:
- Relatórios diários - toda manhã o parceiro espera os números do dia anterior
- Conciliações mensais - centenas de linhas de operações detalhadas por fornecedores, com diferentes percentuais de divisão de receita
- Solicitações pontuais - "me mostra a conversão desse produto nas últimas duas semanas"
- Documentos jurídicos - geração de contratos-padrão para novos parceiros
2 a 3 horas por dia, duas pessoas. Um caso clássico para delegação - mas não havia para quem delegar. Então surgiu uma ferramenta capaz de trabalhar sozinha com SQL, APIs e planilhas.
Não é um agente - é uma cadeia de agentes
Uma distinção importante: não se trata de "um bot inteligente que faz tudo". É um sistema de agentes especializados, cada um resolvendo uma tarefa específica. Na terminologia do Claude Code, cada agente é uma skill (slash-command) com lógica claramente definida.
Os agentes estão conectados por uma infraestrutura compartilhada:
- MCP server para o banco de dados (MS SQL, somente leitura) - o agente constrói consultas SQL e recupera dados
- Google Sheets API - criação de planilhas, escrita de dados, formatação, fórmulas
- Google Drive - armazenamento de arquivos, upload de exportações de fornecedores
- Gerenciador de tarefas - sincronização com tarefas da equipe
- GitLab API - análise de produtividade da equipe de desenvolvimento
Um agente gera relatórios financeiros. Outro executa conciliações mensais. Um terceiro coleta estatísticas da equipe de desenvolvimento. Um quarto transcreve gravações de reuniões e produz relatórios estruturados. Eles não se conhecem entre si, mas operam dentro de um único ecossistema.
Como funciona a skill mais usada: o relatório financeiro
O gestor digita um único comando - o nome do parceiro e um intervalo de datas. 40 segundos depois, um relatório completo aparece no Google Sheets. Veja o que acontece nesses 40 segundos:
1. Resolução da contraparte
O agente mantém um mapeamento de apelidos legíveis para identificadores internos. Não é preciso lembrar UUIDs - um nome curto é suficiente.
2. Consulta ao banco de dados
Uma consulta SQL é gerada, construindo o funil de um produto financeiro: solicitações -> transições -> desembolsos -> comissões. A consulta considera os status corretos das operações - isso por si só já é uma história à parte, porque a documentação do banco de dados nem sempre corresponde aos valores reais dos enums.
3. Agregação
Os dados são agrupados por dia, as taxas de conversão entre etapas são calculadas, os totais de comissão são somados. Parceiros diferentes têm condições diferentes de divisão de receita - o agente lida com isso.
4. Escrita e formatação
Uma planilha é criada ou atualizada: cabeçalhos, dados, linhas de resumo, formatos numéricos, largura das colunas. A formatação é aplicada estritamente após a escrita dos dados - se você fizer ambos simultaneamente, a API às vezes aplica estilos em células vazias (os dados ainda não chegaram).
5. Autoverificação
O agente relê o que escreveu e compara com os dados de origem. Isso não é paranoia - a Google Sheets API realmente descarta linhas durante escritas em lote. Sem verificação, erros são inevitáveis.
Conciliações mensais: quando um agente não é suficiente
O relatório diário é uma tarefa relativamente simples. A conciliação mensal é um nível completamente diferente.
O tráfego de um único parceiro pode passar por 3 a 4 fornecedores. Cada um tem seu próprio formato de exportação, suas próprias regras de correspondência de operações, suas próprias taxas de comissão. É preciso:
- Baixar os arquivos dos fornecedores do armazenamento em nuvem
- Conciliar cada operação com os dados do nosso banco
- Calcular comissões com diferentes divisões para diferentes parceiros
- Gerar uma planilha resumo com fórmulas
- Tudo em um único documento, com abas separadas para cada contraparte
Antes, isso levava um dia inteiro de trabalho. Agora - um comando com dois parâmetros e 3 a 5 minutos de espera.
O que mais o sistema cobre
Em três meses, os agentes se expandiram muito além dos relatórios:
| Skill | Tarefa | Tempo |
|---|---|---|
| Relatório Financeiro | Funil de um único parceiro | 40 seg |
| Resumo Diário | Relatório de todos os parceiros ativos | 2-3 min |
| Conciliação Mensal | Conciliação com fornecedores e fórmulas | 3-5 min |
| Gerador de Contratos | Contrato-padrão para novo parceiro | 1-2 min |
| Gestão de Equipe | Gerenciamento da equipe de produto | interativo |
| GitLab Analytics | Comparação de atividade de devs em 17 repos | 2-3 min |
| Relatório de Reunião | Transcrição de reunião (600+ segmentos) -> relatório estruturado | 3-5 min |
| Recrutamento | Busca de candidatos por parâmetros | interativo |
17 skills, 9 MCP servers (SQL, Google Sheets, Drive, Calendar, Gmail, GitLab, Tracker, Telegram, GitHub). Nenhuma linha de Python, Go ou TypeScript. Toda a lógica vive em arquivos markdown com instruções para o agente.
Por que Claude Code, e não LangChain
Testei diversas abordagens:
- ChatGPT + Zapier - primitivo demais, sem acesso direto ao banco de dados
- LangChain/LangGraph - exige um desenvolvedor, ciclos longos de iteração
- API customizada + GPT-4 - funciona, mas cada mudança = rebuild e redeploy
Claude Code venceu por uma única razão: ciclo de feedback de 30 segundos. Escreve a instrução -> testa -> corrige -> funciona. Sem deployment, sem CI/CD, sem Docker. Os MCP servers dão ao agente acesso direto à infraestrutura, e as skills são apenas arquivos de texto contendo lógica de negócio.
Arquitetura:
- Claude Code - runtime, o cérebro
- MCP servers - ponte para sistemas externos (banco de dados, Google, GitLab, Tracker)
- Skills - arquivos markdown com instruções (lógica de negócio)
- Google Sheets/Drive - camada de apresentação para os usuários
Armadilhas que vale a pena conhecer
A Google Sheets API não é atômica. Escreva 100 linhas - pode ser que encontre apenas 97 na planilha. A regra: sempre releia e verifique após cada escrita. Sem isso, bugs vão aparecer regularmente e silenciosamente.
A documentação do banco de dados mente. O MCP server para SQL retorna um glossário com descrições das tabelas. Mas os valores reais dos enums podem não corresponder à documentação. Perdemos um dia inteiro até começarmos a fazer join direto nas tabelas de referência, em vez de confiar no glossário.
Formatação é uma etapa separada. Se você escreve dados e aplica estilos simultaneamente, a API pode formatar células vazias (os dados ainda não chegaram). Primeiro os dados -> verificação -> depois o visual.
O contexto não é infinito. Ao processar grandes volumes (200+ linhas), o agente pode perder seu contexto inicial. A solução: o agente mantém um log de cada etapa e periodicamente o relê. Parece estranho, mas funciona - essencialmente, o agente cria sua própria "memória externa".
Merge commits inflam as estatísticas. Ao analisar produtividade via GitLab API, descobrimos que tanto commits de feature quanto merge commits são contados separadamente. E código autogerado (migrações de ORM) pode inflar as estatísticas em 20.000+ linhas. Sem filtragem, os números não fazem sentido.
Os apelidos das pessoas não batem entre sistemas. O mesmo desenvolvedor pode aparecer com nomes diferentes no GitLab, no gerenciador de tarefas e no e-mail corporativo. O agente mantém um mapeamento de apelidos - sem ele, relatórios de uma equipe de 11 pessoas simplesmente não fecham.
Os números
| Métrica | Antes | Depois |
|---|---|---|
| Relatórios diários | 2-3 horas/dia | 5-10 minutos |
| Conciliação mensal | 8 horas | 5 minutos |
| Geração de contratos | 2-3 horas | 2 minutos |
| Erros em relatórios | 3-5/mês | 0 (verificação) |
| Pessoas na rotina financeira | 2 | 0 (o PO resolve) |
~60 horas-pessoa economizadas por mês. Custo do Claude Code - US$ 200/mês no plano Max.
Três coisas que aprendi
Agentes de IA são ferramenta de gestor, não de desenvolvedor. Um PO que entende o processo constrói automação funcional mais rápido do que uma equipe passando pelo ciclo clássico de especificação -> sprint -> review -> deploy. Porque não há tradução de "linguagem de negócio" para "código" e vice-versa.
MCP servers são o que transforma um chatbot em um operador. Sem acesso a bancos de dados e APIs, um agente só consegue gerar texto. Com MCP, ele se torna um participante pleno do fluxo de trabalho - operando os mesmos sistemas que um funcionário humano usaria.
Verificação importa mais do que geração. 80% do esforço foi dedicado não aos prompts, mas ao sistema de verificação. Cada etapa é checada: os dados foram escritos? As fórmulas batem? A formatação está correta? Um agente que não verifica seu próprio trabalho é um agente que eventualmente vai falhar silenciosamente.
Se você é um gestor que gasta horas em rotina de dados - comece com uma skill. Automatize o relatório mais doloroso. Quando você vir uma tarefa de três horas concluída em um minuto - as outras 16 skills vão surgir naturalmente.
Sobre o autor: Georgii Motrenko - PO / Head of Product Growth em uma plataforma B2B de InsurTech/FinTech. Construindo cadeias de agentes de IA para automatizar operações financeiras e de produto.
Me siga:
Top comments (0)