Lección 16 de 17
Evaluar y Mejorar Prompts Sistemáticamente
Framework de Evaluación
Criterios de Evaluación
- Relevancia: ¿Responde lo que pediste?
- Precisión: ¿Es correcta la información?
- Completitud: ¿Cubre todos los aspectos?
- Formato: ¿Sigue estructura pedida?
- Tono: ¿Apropiado para audiencia?
- Eficiencia: ¿Usaste tokens mínimos necesarios?
Método de Testing
1. Crea 5 variaciones del mismo prompt 2. Ejecuta cada una 3 veces (15 outputs totales) 3. Califica cada output (1-10) en criterios arriba 4. Identifica variación con mejor promedio 5. Usa esa como base, refina, repite
Técnicas de Mejora
Añadir Especificidad
❌ "Analiza estos datos" ✅ "Analiza estos datos de ventas Q1. Identifica top 3 productos, growth rate mensual, y tendencias preocupantes. Formato tabla."
Añadir Ejemplos
Versión 1 (Zero-Shot): Score 6/10 → Añadir 2 ejemplos (Few-Shot): Score 9/10
Añadir Chain-of-Thought
Versión 1: "Resuelve X" → Versión 2: "Resuelve X pensando paso a paso" Mejora: +30% precisión en problemas complejos
Refinar Formato
Versión 1: Formato libre → Versión 2: "Usa esta estructura: 1. Summary 2. Details 3. Recommendations" Mejora: +50% usabilidad
A/B Testing de Prompts
Prompt A: [versión 1] Prompt B: [versión 2] Test con 10 inputs variados Metricas: - Tiempo respuesta - Calidad (1-10) - Necesidad de corrección - Preferencia usuario Ganador: [el que score mejor en mayoría]
Señales de Que Debes Mejorar
- Necesitas múltiples intentos para resultado OK
- Respuestas inconsistentes
- Formato no sigue lo pedido
- Demasiado genérico o específico
- Alucinaciones frecuentes
- Tono inadecuado
Mejora sistemática > intuición. Mide, experimenta, itera. Un prompt refinado 10 veces supera dramáticamente el primer intento.