Novedades IAGemini

Gemini 3 Deep Think actualizado: 48,4% en Humanity's Last Exam y qué implica

Publicado el 26 de mayo de 2026 · 7 min de lectura

app · Switcher multi-acceso
CARLOS RUIZ · ENCARGADO DE OBRA
T
App Trabajador
parte hoy · ruta · check-in
E
App Empresa
2 obras supervisadas · operarios a cargo
Un solo login · dos perfiles · cambio en 1 click
› RLS distinto por perfil · contexto de la app activa · F1
Switcher multi-acceso para encargados: un login, dos perfiles.

Esta semana Google ha publicado el mayor upgrade de Gemini 3 Deep Think hasta la fecha: 48,4% en Humanity's Last Exam y 84,6% en ARC-AGI-2. Números absurdos hace 18 meses; hoy ya no sorprenden tanto. Lo importante es por qué importa para un ERP: razonamiento profundo barato significa nuevos casos posibles. Hoy hablamos del nuestro favorito: multi-acceso para encargados.

Qué dicen los nuevos benchmarks

Humanity's Last Exam es un benchmark diseñado por expertos académicos con preguntas que requieren razonamiento de doctorado. Que un modelo supere el 48% es noticia técnica seria. ARC-AGI-2 es la versión actualizada del benchmark de razonamiento abstracto de Chollet. 84,6% es muy cerca del techo humano.

Lo curioso: Gemini 3 Deep Think no es el modelo más rápido ni el más barato. Es el especialista en razonamiento profundo. Y como ya pasó con Claude 4.7 adaptive thinking, los modelos están aprendiendo a decidir cuándo desplegar ese músculo.

Dónde lo aplicamos en presupuestaIA

En el Cuadro de Mandos IA, el endpoint razonar-anomalia migra a Deep Think actualizado. Es el endpoint que se activa cuando un presupuesto tiene cifras raras, una certificación no cuadra, o el avance real diverge del planificado. Ahí Deep Think gana margen claro: explica el porqué con cadena de razonamiento legible para el usuario.

Multi-acceso para encargados con switcher F1

Cambio de tercio: la noticia interna del día. Llevábamos tiempo con un problema feo de UX. Los encargados de obra son a la vez trabajadores en campo (App Trabajador) y supervisores con vista de empresa (App Empresa). Hasta ahora les obligábamos a tener dos sesiones, dos logins, dos pestañas.

Con el switcher F1 que sale hoy:

  • Un login: el encargado entra con su email habitual.
  • Dos perfiles: detecta automáticamente que tiene rol Trabajador y rol Encargado.
  • Cambio en un click: switcher arriba a la derecha — ahora veo lo mío como operario; ahora veo todo lo que superviso.
  • Contexto preservado: si vuelvo a la app activa anterior, vuelvo justo donde estaba.
  • Seguridad correcta: el RLS aplica el rol activo, no el "más alto que tienes". Permite a la empresa controlar qué ve el encargado en cada momento.

Lo que no es y conviene aclarar

No es impersonate. No es "haz como si fueras otro". Es que un mismo usuario tiene dos perfiles legítimos en la organización y los conmuta. Los logs registran qué perfil estaba activo en cada acción. Esto importa para auditoría — quien firma un parte como Trabajador firma como Trabajador, no como Encargado.

Próximo episodio

El viernes 29 mayo cerramos mayo con un artículo de arquitectura: las tres apps cara al usuario (Cliente, Trabajador, Empresa) y cómo unifican las seis rutas/portales que teníamos sueltos. Y la noticia: Anthropic publica safety/acceptable-use updates mensuales.

Multi-acceso para encargados

Un login, dos perfiles, cero confusión

El encargado conmuta entre App Trabajador y App Empresa sin reloguearse. RLS aplica el rol activo.

Acceder a la app →