StoAI

Cases

O trabalho fala por si só.

Resultados reais de empresas SaaS reais. Decisões de arquitetura, detalhes de implementação e resultados mensuráveis.

AI Copilot

Empresa de developer tools Série B reduziu tickets de suporte em 38% com um copilot de AI integrado ao produto.

Empresa

Série B, 3.200 usuários

Investimento

$25,000

Retorno

7,3 semanas

O problema

O produto tinha 60+ funcionalidades e uma curva de aprendizado que frustrava novos usuários. A conclusão do onboarding estava em 34%. O suporte lidava com 1.800 tickets/mês — 40% eram perguntas básicas do tipo "como faço X?" com respostas já na documentação.

O CTO estimou um prazo de 4 meses para construir algo internamente. O conselho queria resultados antes da próxima revisão trimestral em 7 semanas.

O que construímos

W1

Ingestão de 340 artigos de documentação. Pipeline de retrieval híbrido usando pgvector. Definição dos 25 cenários de ação mais comuns como schemas de function-calling.

W2

Agente com tool-use usando Claude 3.5 Sonnet. Respostas alimentadas por RAG mais execução de ações via REST API. Diálogos de confirmação para ações destrutivas.

W3

Injeção de contexto do usuário — o copilot sabe a página atual, plano, cargo e atividade recente. Respostas em streaming e componente React embarcável.

W4

Hardening de produção. Cadeia de fallback: Claude → GPT-4o → resposta em cache. Controle de custos por tier de usuário. Dashboards no Datadog. Suíte de avaliação com 120 casos.

A arquitetura

User query → Context enrichment (page, role, history)
           → Hybrid retrieval (pgvector + BM25)
           → Re-ranking (top 5 chunks)
           → Claude 3.5 Sonnet (tool-use agent)
           → Action execution or answer generation
           → Streaming response to frontend

Fallback:  Claude timeout (5s) → GPT-4o → cached response
Cost:      4,096 token budget per conversation
Monitor:   Every interaction logged with latency, tokens, cost

Resultados (90 dias após o lançamento)

Tickets de suporte/mês

1.8001.116

-38%

Conclusão do onboarding

34%51%

+50% relativo

Funcionalidades usadas/usuário

814

+75%

Custo de suporte/mês

$27,000$16,740

-$10,260/mês

Taxa de resolução do copilot

73%

Automatizado

Tempo médio de resposta

4,2 horas1,8 segundos

Instantâneo

O copilot agora é nossa funcionalidade mais usada. Prospects enterprise perguntam especificamente sobre ele nas demos. Passou de uma jogada de redução de custos de suporte para uma vantagem competitiva.

— CTO

Engenharia de Confiabilidade

Plataforma fintech reduziu custos de API de AI em 63% e eliminou incidentes de produção.

Empresa

Série A, 1.100 usuários

Investimento

$18,000

Retorno

12 dias

O problema

A funcionalidade de categorização de transações com AI estava sangrando dinheiro: a fatura de API cresceu de $2,400/mês para $8,700/mês em 4 meses. 3 incidentes de produção em 6 semanas. Zero observabilidade. Usuários reportando transações mal categorizadas sem nenhuma forma de medir a precisão em escala.

O que fizemos

W1

Instrumentamos cada caminho de chamada de AI. Descobrimos: 47% das chamadas de API eram redundantes, a latência p95 era de 12s (timeout era 10s), e 23% das respostas tinham falhas de parsing sendo engolidas silenciosamente.

W2

Implementamos processamento idempotente, mudamos para modo JSON estruturado, adicionamos circuit breakers com degradação graciosa.

W3

Construímos cache semântico (34% de hit rate no primeiro dia). Otimizamos prompts — 41% de redução de tokens. Implementamos estratégia de modelos por camada: consultas simples para GPT-4o-mini, complexas para Claude.

W4

Construímos suíte de avaliação com 200 casos em 15 categorias. Monitoramento contínuo de precisão amostrando 5% diariamente. Alertas para custo, latência, drift de precisão e picos de erros.

Resultados (60 dias após o engajamento)

Custo mensal de API

$8,700$3,200

-63%

Incidentes de produção

3 em 6 semanas0 em 8 semanas

-100%

Latência p95

12,1s2,3s

-81%

Falhas de parsing

23%0,3%

-99%

Precisão

Desconhecida94,2%

Agora mensurável

Observabilidade

0 dashboards4 dashboards

12 alertas

Achávamos que tínhamos uma funcionalidade de AI. O que realmente tínhamos era uma bomba-relógio. Agora temos um sistema de produção — com o monitoramento para provar.

— CTO

Document AI

Marketplace B2B automatizou 70% do processamento de documentos de fornecedores.

Empresa

Série B, 800 fornecedores

Investimento

$28,000

Retorno

8 semanas

O problema

Cada novo fornecedor enviava documentos de compliance — licenças, certificados de seguro, formulários fiscais. Dois FTEs processavam 600 documentos/mês em 15-25 minutos cada. Base de fornecedores crescendo 8% mês a mês. Soluções anteriores de OCR falhavam em documentos digitalizados e ainda exigiam interpretação humana.

O que construímos

W1

Pipeline de ingestão para PDFs, imagens e documentos digitalizados. AWS Textract para OCR. Claude multimodal para classificação de documentos — 97% de precisão em 12 tipos de documentos.

W2

Schemas de extração estruturada por tipo de documento. Scoring de confiança por campo. Aceite automático acima de 0.9, flag de 0.7-0.9 para revisão rápida, manual abaixo de 0.7.

W3

Interface de revisão humana no loop: documento lado a lado com dados extraídos. Aprovação em um clique. Correções retroalimentam o ajuste de prompts. Integração com banco de dados de gestão de fornecedores.

W4-5

Pipeline de processamento em batch (baseado em SQS). Detecção e redação de PII. Dashboard de monitoramento. Processamento de 500 documentos históricos para validação e ajuste de prompts.

Resultados (90 dias após o lançamento)

Processamento automático

0%70%

Automatizado

Tempo de processamento/doc

20 min45 seg

-92%

Horas de operação/mês

200 hrs55 hrs

-72%

Custo por documento

$12,50$1,80

-86%

Precisão da extração

96% (humano)99,1%

Após revisão

Onboarding de fornecedor

3-5 diasNo mesmo dia

Instantâneo

Estávamos prestes a contratar uma terceira pessoa para revisão de documentos. Em vez disso, automatizamos 70% do trabalho e movemos uma de nossas melhores pessoas para um cargo gerador de receita.

— VP de Operações

Seu projeto pode ser o próximo.

Todo engajamento começa com uma avaliação técnica de 30 minutos. Vamos analisar sua arquitetura, entender o problema e dizer exatamente o que construiríamos, quanto tempo levaria e quanto custaria.

Não é necessário NDA para a conversa inicial. Já trabalhamos sob sigilo rigoroso e assinamos o seu se avançarmos.