StoAI

Casos de Estudio

El trabajo habla por sí solo.

Resultados reales de empresas SaaS reales. Decisiones de arquitectura, detalles de implementación y resultados medibles.

AI Copilot

Empresa de developer tools Serie B redujo tickets de soporte un 38% con un copilot de AI integrado en el producto.

Empresa

Serie B, 3,200 usuarios

Inversión

$25,000

Retorno

7.3 semanas

El problema

Su producto tenía 60+ funcionalidades y una curva de aprendizaje que frustraba a los nuevos usuarios. La finalización del onboarding estaba en 34%. Soporte manejaba 1,800 tickets/mes — el 40% eran preguntas básicas de "¿cómo hago X?" con respuestas que ya estaban en la documentación.

El CTO estimaba un cronograma de 4 meses para construir algo internamente. El directorio quería resultados antes de la próxima revisión trimestral en 7 semanas.

Qué construimos

W1

Ingestamos 340 artículos de documentación. Construimos un pipeline de recuperación híbrido usando pgvector. Definimos las 25 acciones más comunes de usuarios como schemas de function-calling.

W2

Construimos un agente con tool-use usando Claude 3.5 Sonnet. Respuestas potenciadas por RAG más ejecución de acciones vía su REST API. Diálogos de confirmación para acciones destructivas.

W3

Agregamos inyección de contexto de usuario — el copilot conoce la página actual, nivel de plan, rol y actividad reciente. Construimos respuestas en streaming y un componente React embebible.

W4

Endurecimiento para producción. Cadena de fallback: Claude → GPT-4o → respuesta en caché. Controles de costo por nivel de usuario. Dashboards en Datadog. Suite de evaluación con 120 casos.

La arquitectura

User query → Context enrichment (page, role, history)
           → Hybrid retrieval (pgvector + BM25)
           → Re-ranking (top 5 chunks)
           → Claude 3.5 Sonnet (tool-use agent)
           → Action execution or answer generation
           → Streaming response to frontend

Fallback:  Claude timeout (5s) → GPT-4o → cached response
Cost:      4,096 token budget per conversation
Monitor:   Every interaction logged with latency, tokens, cost

Resultados (90 días post-lanzamiento)

Tickets de soporte/mes

1,8001,116

-38%

Finalización de onboarding

34%51%

+50% relativo

Funcionalidades usadas/usuario

814

+75%

Costo de soporte/mes

$27,000$16,740

-$10,260/mes

Tasa de resolución del copilot

73%

Automatizado

Tiempo promedio de respuesta

4.2 horas1.8 segundos

Instantáneo

El copilot es ahora nuestra funcionalidad más utilizada. Los prospectos enterprise preguntan específicamente por él en los demos. Pasó de ser una jugada de reducción de costos de soporte a una ventaja competitiva.

— CTO

Ingeniería de Confiabilidad

Plataforma fintech redujo costos de API de AI un 63% y eliminó incidentes en producción.

Empresa

Serie A, 1,100 usuarios

Inversión

$18,000

Retorno

12 días

El problema

Su funcionalidad de categorización de transacciones con AI estaba desangrando dinero: la factura de API creció de $2,400/mes a $8,700/mes en 4 meses. 3 incidentes en producción en 6 semanas. Cero observabilidad. Usuarios reportando transacciones mal categorizadas sin forma de medir la precisión a escala.

Qué hicimos

W1

Instrumentamos cada ruta de llamada a AI. Hallazgos: 47% de las llamadas a API eran redundantes, la latencia p95 era de 12s (el timeout era de 10s), y el 23% de las respuestas tenían errores de parsing que se tragaban silenciosamente.

W2

Implementamos procesamiento idempotente, cambiamos a modo JSON estructurado, agregamos circuit breakers con degradación elegante.

W3

Construimos caché semántico (34% de hit rate desde el primer día). Optimizamos prompts — 41% de reducción en tokens. Implementamos estrategia de modelos por nivel: consultas simples a GPT-4o-mini, complejas a Claude.

W4

Construimos suite de evaluación con 200 casos en 15 categorías. Monitoreo continuo de precisión muestreando 5% diario. Alertas para costo, latencia, desviación de precisión y picos de errores.

Resultados (60 días post-proyecto)

Costo mensual de API

$8,700$3,200

-63%

Incidentes en producción

3 en 6 semanas0 en 8 semanas

-100%

Latencia p95

12.1s2.3s

-81%

Errores de parsing

23%0.3%

-99%

Precisión

Desconocida94.2%

Ahora medible

Observabilidad

0 dashboards4 dashboards

12 alertas

Pensábamos que teníamos una funcionalidad de AI. Lo que realmente teníamos era una bomba de tiempo. Ahora tenemos un sistema de producción — con el monitoreo para demostrarlo.

— CTO

Document AI

Marketplace B2B automatizó el 70% del procesamiento de documentos de proveedores.

Empresa

Serie B, 800 proveedores

Inversión

$28,000

Retorno

8 semanas

El problema

Cada nuevo proveedor enviaba documentos de cumplimiento — licencias, certificados de seguro, formularios fiscales. Dos FTEs procesaban 600 documentos/mes a 15-25 minutos cada uno. La cantidad de proveedores crecía 8% mes a mes. Soluciones previas de OCR fallaban con documentos escaneados y aún requerían interpretación humana.

Qué construimos

W1

Pipeline de ingesta para PDFs, imágenes y documentos escaneados. AWS Textract para OCR. Claude multimodal para clasificación de documentos — 97% de precisión en 12 tipos de documentos.

W2

Esquemas de extracción estructurada por tipo de documento. Puntuación de confianza por campo. Auto-aceptar arriba de 0.9, marcar 0.7-0.9 para revisión rápida, manual debajo de 0.7.

W3

UI de revisión humana: documento lado a lado con datos extraídos. Aprobación con un clic. Las correcciones retroalimentan el ajuste de prompts. Integración con la base de datos de gestión de proveedores.

W4-5

Pipeline de procesamiento por lotes (basado en SQS). Detección y redacción de PII. Dashboard de monitoreo. Procesamos 500 documentos históricos para validación y ajuste de prompts.

Resultados (90 días post-lanzamiento)

Auto-procesados

0%70%

Automatizado

Tiempo de procesamiento/doc

20 min45 seg

-92%

Horas de operación/mes

200 hrs55 hrs

-72%

Costo por documento

$12.50$1.80

-86%

Precisión de extracción

96% (humano)99.1%

Tras revisión

Onboarding de proveedores

3-5 díasMismo día

Instantáneo

Estábamos a punto de contratar una tercera persona para revisión de documentos. En su lugar, automatizamos el 70% del trabajo y movimos a una de nuestras mejores personas a un rol generador de ingresos.

— VP de Operaciones

Tu proyecto podría ser el siguiente.

Cada proyecto comienza con una evaluación técnica de 30 minutos. Revisaremos tu arquitectura, entenderemos el problema y te diremos exactamente qué construiríamos, cuánto tomaría y cuánto costaría.

No se requiere NDA para la conversación inicial. Hemos trabajado bajo estricta confidencialidad y firmaremos el tuyo si avanzamos.