Novedades IAOpenAI

GPT-5.4 mini y nano: cómo bajamos el coste por consulta en presupuestaIA

Publicado el 17 de marzo de 2026 · 7 min de lectura

superadmin/empresas · Tier vs modelo
TierDescribir partidaGenerar familiasRazonar anomalíaTope/mes
Trialgpt-5-4-nanogpt-5-4-mini50 llamadas
Contratado Básicoclaude-sonnet-4-6claude-sonnet-4-6gpt-5-4-mini2.500
Contratado Proclaude-opus-4-6claude-sonnet-4-6gemini-3-1-pro10.000
Enterpriseclaude-opus-4-6claude-opus-4-6gemini-3-1-pro-deep-thinkilimitado
› matriz tier × endpoint × modelo · configurable desde superadmin
Matriz de modelos por tier de cliente, editable sin tocar código.

Hoy 17 de marzo OpenAI ha publicado GPT-5.4 mini y nano. Es la pieza que faltaba para cerrar la familia 5.4 y bajar coste por consulta en cargas masivas. Te cuento cómo cae cada modelo en el matriz Tier × Endpoint que tenemos en presupuestaIA y por qué la combinación Trial/Contratado funciona mejor cuando dejas que la IA escale con el cliente.

Qué traen GPT-5.4 mini y nano

Son las versiones reducidas del flagship lanzado el 5 de marzo. Mini mantiene la mayor parte de la capacidad de razonamiento del 5.4 grande a una fracción del coste (estimamos ~5×) y con latencia significativamente menor. Nano es el sub-modelo: tareas cortas, clasificación, extracción, sin razonamiento complejo. Coste estimado ~20× menor que el flagship.

Para un ERP con cientos de llamadas IA al día por cliente, esta gradiente importa. No hace falta usar el cañón para una pregunta de un solo paso.

Cómo segmentamos modelos por tier

La regla mental que aplicamos es simple: el tier del cliente debe coincidir con el "nivel de capacidad IA" que paga. Pero la asignación no es de proveedor, es de modelo concreto por endpoint. Así:

  • Trial: GPT-5.4 nano + mini. Calidad decente para evaluar el producto, coste ínfimo para nosotros, 50 llamadas/mes por sesión.
  • Contratado Básico: Claude Sonnet 4.6 en los endpoints de redacción + GPT-5.4 mini para razonamiento. 2.500 llamadas/mes.
  • Contratado Pro: Claude Opus 4.6 en describir-presupuesto + Sonnet en generar-familias + Gemini 3.1 Pro en razonar-anomalía. 10.000 llamadas.
  • Enterprise: Opus en todo lo redactado + Gemini 3.1 Pro Deep Think en lo razonado. Ilimitado.

Lo que esto implica en la edge function

El endpoint funcional describir-partida no tiene un modelo. Tiene una función resolveModel(empresa_id, endpoint) que consulta la tabla empresa_tier y devuelve el slug del modelo a invocar. Cambiar la asignación Tier × Modelo desde superadmin se propaga en caliente, sin redeploy.

Esto permite cosas concretas como: si un cliente Básico se queja de calidad, le subimos a Sonnet sin tocar código. Si Anthropic sube precios, cambiamos Pro a Gemini en describir-presupuesto sin afectar el resto.

Próximo episodio

El viernes 20 marcha vuelve Gemini con Flash-Lite 3.1: el modelo barato que va a estar detrás de toda la planificación de redes sociales en el submódulo CRM Redes. Spoiler: en redes, la creatividad la pone Claude y la programación la pone Flash-Lite.

Tu plan, tu IA

Cada tier viene con su modelo y su tope

Trial gratis para probar. Básico/Pro/Enterprise con modelos progresivamente más capaces. La matriz está en superadmin.

Acceder a la app →