GPT-5.5: 88,7% en SWE-bench y por qué importa cuando construyes módulos de seguridad
Publicado el 28 de abril de 2026 · 8 min de lectura
Volvemos a GPT-5.5. El viernes mencioné los benchmarks; hoy entro a ver qué significan en producto. El 88,7% en SWE-bench Verified es el dato que más nos importa: mide capacidad de razonar sobre código complejo, normativa estructurada y planificación. Lo aplicamos directo al lanzamiento de hoy: módulo Seguridad F0+F1 con RIPCI, seguridad privada y motor calendario+rutas.
Qué dice SWE-bench Verified de los modelos
SWE-bench Verified es una versión limpia de SWE-bench: tareas de programación reales extraídas de issues de GitHub. La versión Verified filtra tareas mal especificadas. El 88,7% de GPT-5.5 es récord absoluto y está ~5 puntos por encima de Claude Opus 4.7 y Gemini 3.1 Pro.
Para los que construimos software con IA, eso se traduce en una cosa: GPT-5.5 entiende mejor la estructura de un sistema con muchas reglas y dependencias cruzadas. Y eso es exactamente lo que es la normativa de seguridad: un sistema de muchas reglas con dependencias.
Módulo Seguridad F0+F1: dos mundos en uno
El módulo Seguridad cubre dos verticales hermanos que comparten infraestructura:
- RIPCI (Reglamento de Instalaciones de Protección Contra Incendios): empresas de extintores, BIE, hidrantes, sirenas, detección de humos. Calendarios de mantenimiento trimestral, semestral, anual.
- Seguridad privada: empresas de vigilancia con servicio físico, alarmas conectadas, CRA. Carnets habilitantes, contratos con propiedades, cuadrantes (aunque cuadrantes complejos viven en el módulo Vigilancia, hermano que sale en mayo).
Motor calendario+rutas: la pieza no obvia
La parte que más trabajo nos ha dado es el motor de calendario y rutas. Para una empresa con 200 clientes y mil equipos repartidos por una provincia, planificar la semana es un puzzle. Hay que respetar:
- Vencimientos legales de cada equipo según RIPCI (3, 6, 12 meses).
- Horarios de apertura del cliente (no entras a un colegio a las 8 cuando hay clase).
- Carnet y especialidad del técnico (no todos saben de detección automática).
- Distancia geográfica para minimizar km.
- Contratos: hay clientes con mantenimiento preferente que requieren franja semanal fija.
Aquí es donde GPT-5.5 brilla. La planificación semanal sale por la combinación de un solver determinista (variantes de routing) y GPT-5.5 que explica decisiones y resuelve conflictos cuando el solver no encuentra solución limpia.
Cómo se nota en el día a día
Para una empresa RIPCI mediana de 8 técnicos: antes la planificación semanal de rutas le llevaba al jefe de operaciones unas 3-4 horas cada lunes. Con el motor automático le lleva 20 minutos, que dedica a revisar y aprobar.
Próximo episodio
El viernes 1 de mayo abrimos mayo con el roadmap del mes: cinco lanzamientos en 30 días — Vigilancia, ObraBase, CRM, CRM Redes y Distribución. El plan editorial más denso del año.
🚀 Módulo Seguridad F0+F1
Para empresas RIPCI y seguridad privada
Calendario de mantenimientos, rutas optimizadas, carnets al día y dossier RIPCI por cliente.
Pedir demo →