Cases
O trabalho fala por si só.
Resultados reais de empresas SaaS reais. Decisões de arquitetura, detalhes de implementação e resultados mensuráveis.
AI Copilot
Empresa de developer tools Série B reduziu tickets de suporte em 38% com um copilot de AI integrado ao produto.
Empresa
Série B, 3.200 usuários
Investimento
$25,000
Retorno
7,3 semanas
O problema
O produto tinha 60+ funcionalidades e uma curva de aprendizado que frustrava novos usuários. A conclusão do onboarding estava em 34%. O suporte lidava com 1.800 tickets/mês — 40% eram perguntas básicas do tipo "como faço X?" com respostas já na documentação.
O CTO estimou um prazo de 4 meses para construir algo internamente. O conselho queria resultados antes da próxima revisão trimestral em 7 semanas.
O que construímos
Ingestão de 340 artigos de documentação. Pipeline de retrieval híbrido usando pgvector. Definição dos 25 cenários de ação mais comuns como schemas de function-calling.
Agente com tool-use usando Claude 3.5 Sonnet. Respostas alimentadas por RAG mais execução de ações via REST API. Diálogos de confirmação para ações destrutivas.
Injeção de contexto do usuário — o copilot sabe a página atual, plano, cargo e atividade recente. Respostas em streaming e componente React embarcável.
Hardening de produção. Cadeia de fallback: Claude → GPT-4o → resposta em cache. Controle de custos por tier de usuário. Dashboards no Datadog. Suíte de avaliação com 120 casos.
A arquitetura
User query → Context enrichment (page, role, history)
→ Hybrid retrieval (pgvector + BM25)
→ Re-ranking (top 5 chunks)
→ Claude 3.5 Sonnet (tool-use agent)
→ Action execution or answer generation
→ Streaming response to frontend
Fallback: Claude timeout (5s) → GPT-4o → cached response
Cost: 4,096 token budget per conversation
Monitor: Every interaction logged with latency, tokens, costResultados (90 dias após o lançamento)
Tickets de suporte/mês
-38%
Conclusão do onboarding
+50% relativo
Funcionalidades usadas/usuário
+75%
Custo de suporte/mês
-$10,260/mês
Taxa de resolução do copilot
Automatizado
Tempo médio de resposta
Instantâneo
“O copilot agora é nossa funcionalidade mais usada. Prospects enterprise perguntam especificamente sobre ele nas demos. Passou de uma jogada de redução de custos de suporte para uma vantagem competitiva.”
— CTO
Engenharia de Confiabilidade
Plataforma fintech reduziu custos de API de AI em 63% e eliminou incidentes de produção.
Empresa
Série A, 1.100 usuários
Investimento
$18,000
Retorno
12 dias
O problema
A funcionalidade de categorização de transações com AI estava sangrando dinheiro: a fatura de API cresceu de $2,400/mês para $8,700/mês em 4 meses. 3 incidentes de produção em 6 semanas. Zero observabilidade. Usuários reportando transações mal categorizadas sem nenhuma forma de medir a precisão em escala.
O que fizemos
Instrumentamos cada caminho de chamada de AI. Descobrimos: 47% das chamadas de API eram redundantes, a latência p95 era de 12s (timeout era 10s), e 23% das respostas tinham falhas de parsing sendo engolidas silenciosamente.
Implementamos processamento idempotente, mudamos para modo JSON estruturado, adicionamos circuit breakers com degradação graciosa.
Construímos cache semântico (34% de hit rate no primeiro dia). Otimizamos prompts — 41% de redução de tokens. Implementamos estratégia de modelos por camada: consultas simples para GPT-4o-mini, complexas para Claude.
Construímos suíte de avaliação com 200 casos em 15 categorias. Monitoramento contínuo de precisão amostrando 5% diariamente. Alertas para custo, latência, drift de precisão e picos de erros.
Resultados (60 dias após o engajamento)
Custo mensal de API
-63%
Incidentes de produção
-100%
Latência p95
-81%
Falhas de parsing
-99%
Precisão
Agora mensurável
Observabilidade
12 alertas
“Achávamos que tínhamos uma funcionalidade de AI. O que realmente tínhamos era uma bomba-relógio. Agora temos um sistema de produção — com o monitoramento para provar.”
— CTO
Document AI
Marketplace B2B automatizou 70% do processamento de documentos de fornecedores.
Empresa
Série B, 800 fornecedores
Investimento
$28,000
Retorno
8 semanas
O problema
Cada novo fornecedor enviava documentos de compliance — licenças, certificados de seguro, formulários fiscais. Dois FTEs processavam 600 documentos/mês em 15-25 minutos cada. Base de fornecedores crescendo 8% mês a mês. Soluções anteriores de OCR falhavam em documentos digitalizados e ainda exigiam interpretação humana.
O que construímos
Pipeline de ingestão para PDFs, imagens e documentos digitalizados. AWS Textract para OCR. Claude multimodal para classificação de documentos — 97% de precisão em 12 tipos de documentos.
Schemas de extração estruturada por tipo de documento. Scoring de confiança por campo. Aceite automático acima de 0.9, flag de 0.7-0.9 para revisão rápida, manual abaixo de 0.7.
Interface de revisão humana no loop: documento lado a lado com dados extraídos. Aprovação em um clique. Correções retroalimentam o ajuste de prompts. Integração com banco de dados de gestão de fornecedores.
Pipeline de processamento em batch (baseado em SQS). Detecção e redação de PII. Dashboard de monitoramento. Processamento de 500 documentos históricos para validação e ajuste de prompts.
Resultados (90 dias após o lançamento)
Processamento automático
Automatizado
Tempo de processamento/doc
-92%
Horas de operação/mês
-72%
Custo por documento
-86%
Precisão da extração
Após revisão
Onboarding de fornecedor
Instantâneo
“Estávamos prestes a contratar uma terceira pessoa para revisão de documentos. Em vez disso, automatizamos 70% do trabalho e movemos uma de nossas melhores pessoas para um cargo gerador de receita.”
— VP de Operações
Seu projeto pode ser o próximo.
Todo engajamento começa com uma avaliação técnica de 30 minutos. Vamos analisar sua arquitetura, entender o problema e dizer exatamente o que construiríamos, quanto tempo levaria e quanto custaria.
Não é necessário NDA para a conversa inicial. Já trabalhamos sob sigilo rigoroso e assinamos o seu se avançarmos.