GPT-5.4 mini y nano: coste por consulta y planes Trial/Contratado

Tier	Describir partida	Generar familias	Razonar anomalía	Tope/mes
Trial	gpt-5-4-nano	gpt-5-4-mini	—	50 llamadas
Contratado Básico	claude-sonnet-4-6	claude-sonnet-4-6	gpt-5-4-mini	2.500
Contratado Pro	claude-opus-4-6	claude-sonnet-4-6	gemini-3-1-pro	10.000
Enterprise	claude-opus-4-6	claude-opus-4-6	gemini-3-1-pro-deep-think	ilimitado

Hoy 17 de marzo OpenAI ha publicado GPT-5.4 mini y nano. Es la pieza que faltaba para cerrar la familia 5.4 y bajar coste por consulta en cargas masivas. Te cuento cómo cae cada modelo en el matriz Tier × Endpoint que tenemos en presupuestaIA y por qué la combinación Trial/Contratado funciona mejor cuando dejas que la IA escale con el cliente.

Qué traen GPT-5.4 mini y nano

Son las versiones reducidas del flagship lanzado el 5 de marzo. Mini mantiene la mayor parte de la capacidad de razonamiento del 5.4 grande a una fracción del coste (estimamos ~5×) y con latencia significativamente menor. Nano es el sub-modelo: tareas cortas, clasificación, extracción, sin razonamiento complejo. Coste estimado ~20× menor que el flagship.

Para un ERP con cientos de llamadas IA al día por cliente, esta gradiente importa. No hace falta usar el cañón para una pregunta de un solo paso.

Cómo segmentamos modelos por tier

La regla mental que aplicamos es simple: el tier del cliente debe coincidir con el "nivel de capacidad IA" que paga. Pero la asignación no es de proveedor, es de modelo concreto por endpoint. Así:

Trial: GPT-5.4 nano + mini. Calidad decente para evaluar el producto, coste ínfimo para nosotros, 50 llamadas/mes por sesión.
Contratado Básico: Claude Sonnet 4.6 en los endpoints de redacción + GPT-5.4 mini para razonamiento. 2.500 llamadas/mes.
Contratado Pro: Claude Opus 4.6 en describir-presupuesto + Sonnet en generar-familias + Gemini 3.1 Pro en razonar-anomalía. 10.000 llamadas.
Enterprise: Opus en todo lo redactado + Gemini 3.1 Pro Deep Think en lo razonado. Ilimitado.

Lo que esto implica en la edge function

El endpoint funcional describir-partida no tiene un modelo. Tiene una función resolveModel(empresa_id, endpoint) que consulta la tabla empresa_tier y devuelve el slug del modelo a invocar. Cambiar la asignación Tier × Modelo desde superadmin se propaga en caliente, sin redeploy.

Esto permite cosas concretas como: si un cliente Básico se queja de calidad, le subimos a Sonnet sin tocar código. Si Anthropic sube precios, cambiamos Pro a Gemini en describir-presupuesto sin afectar el resto.

Próximo episodio

El viernes 20 marcha vuelve Gemini con Flash-Lite 3.1: el modelo barato que va a estar detrás de toda la planificación de redes sociales en el submódulo CRM Redes. Spoiler: en redes, la creatividad la pone Claude y la programación la pone Flash-Lite.

GPT-5.4 mini y nano: cómo bajamos el coste por consulta en presupuestaIA

Qué traen GPT-5.4 mini y nano

Cómo segmentamos modelos por tier

Lo que esto implica en la edge function

Próximo episodio

Cada tier viene con su modelo y su tope

También te puede interesar