GPT-5.4 mini y nano: cómo bajamos el coste por consulta en presupuestaIA
Publicado el 17 de marzo de 2026 · 7 min de lectura
| Tier | Describir partida | Generar familias | Razonar anomalía | Tope/mes |
|---|---|---|---|---|
| Trial | gpt-5-4-nano | gpt-5-4-mini | — | 50 llamadas |
| Contratado Básico | claude-sonnet-4-6 | claude-sonnet-4-6 | gpt-5-4-mini | 2.500 |
| Contratado Pro | claude-opus-4-6 | claude-sonnet-4-6 | gemini-3-1-pro | 10.000 |
| Enterprise | claude-opus-4-6 | claude-opus-4-6 | gemini-3-1-pro-deep-think | ilimitado |
Hoy 17 de marzo OpenAI ha publicado GPT-5.4 mini y nano. Es la pieza que faltaba para cerrar la familia 5.4 y bajar coste por consulta en cargas masivas. Te cuento cómo cae cada modelo en el matriz Tier × Endpoint que tenemos en presupuestaIA y por qué la combinación Trial/Contratado funciona mejor cuando dejas que la IA escale con el cliente.
Qué traen GPT-5.4 mini y nano
Son las versiones reducidas del flagship lanzado el 5 de marzo. Mini mantiene la mayor parte de la capacidad de razonamiento del 5.4 grande a una fracción del coste (estimamos ~5×) y con latencia significativamente menor. Nano es el sub-modelo: tareas cortas, clasificación, extracción, sin razonamiento complejo. Coste estimado ~20× menor que el flagship.
Para un ERP con cientos de llamadas IA al día por cliente, esta gradiente importa. No hace falta usar el cañón para una pregunta de un solo paso.
Cómo segmentamos modelos por tier
La regla mental que aplicamos es simple: el tier del cliente debe coincidir con el "nivel de capacidad IA" que paga. Pero la asignación no es de proveedor, es de modelo concreto por endpoint. Así:
- Trial: GPT-5.4 nano + mini. Calidad decente para evaluar el producto, coste ínfimo para nosotros, 50 llamadas/mes por sesión.
- Contratado Básico: Claude Sonnet 4.6 en los endpoints de redacción + GPT-5.4 mini para razonamiento. 2.500 llamadas/mes.
- Contratado Pro: Claude Opus 4.6 en describir-presupuesto + Sonnet en generar-familias + Gemini 3.1 Pro en razonar-anomalía. 10.000 llamadas.
- Enterprise: Opus en todo lo redactado + Gemini 3.1 Pro Deep Think en lo razonado. Ilimitado.
Lo que esto implica en la edge function
El endpoint funcional describir-partida no tiene un modelo. Tiene una función resolveModel(empresa_id, endpoint) que consulta la tabla empresa_tier y devuelve el slug del modelo a invocar. Cambiar la asignación Tier × Modelo desde superadmin se propaga en caliente, sin redeploy.
Esto permite cosas concretas como: si un cliente Básico se queja de calidad, le subimos a Sonnet sin tocar código. Si Anthropic sube precios, cambiamos Pro a Gemini en describir-presupuesto sin afectar el resto.
Próximo episodio
El viernes 20 marcha vuelve Gemini con Flash-Lite 3.1: el modelo barato que va a estar detrás de toda la planificación de redes sociales en el submódulo CRM Redes. Spoiler: en redes, la creatividad la pone Claude y la programación la pone Flash-Lite.
Tu plan, tu IA
Cada tier viene con su modelo y su tope
Trial gratis para probar. Básico/Pro/Enterprise con modelos progresivamente más capaces. La matriz está en superadmin.
Acceder a la app →