OpenAI restringe GPT-5.5-Cyber igual que Anthropic restringió Mythos: el debate sobre acceso controlado a IA de ciberseguridad estalla Inteligencia Artificial 2026-05-03 https://elpisuika.com/ia/2026-05-03.og.png Inteligencia Artificial 2026-05
2026-05-03 · INTELIGENCIA ARTIFICIAL · Edición del 3 de mayo de 2026
Inteligencia Artificial

OpenAI restringe GPT-5.5-Cyber igual que Anthropic restringió Mythos: el debate sobre acceso controlado a IA de ciberseguridad estalla

Tres días después de criticar a Anthropic por limitar el acceso a Claude Mythos, OpenAI anuncia un programa de acceso restringido para GPT-5.5-Cyber; el UK AISI confirma que ambos modelos alcanzan capacidades de ataque similares.

01
71,4%
tasa de éxito de GPT-5.5 en simulaciones de ataque cibernético multi-etapa del AISI del Reino Unido, frente al 68,6% de Claude Mythos; ambos son los únicos modelos en completar los escenarios más complejos
02
chatgpt.com/cyber
URL del programa de acceso restringido de OpenAI para GPT-5.5-Cyber; vetado para el público general y solo disponible para 'defensores críticos verificados'
03
USD 900.000M
valuación a la que Anthropic negocia cerrar su ronda de financiamiento; OpenAI y SpaceX podrían ingresar al S&P 500 tras sus IPOs según The Motley Fool
7 historias · 3 de mayo de 2026 ← volver a portada
01
N.º 01 OpenAI · Ciberseguridad

OpenAI restringe GPT-5.5-Cyber tras criticar a Anthropic: Sam Altman aplica la misma política que llamó «miedo vendido»

El CEO de OpenAI fue a los medios el 28 de abril a criticar a Anthropic por limitar Claude Mythos; tres días después anunció que GPT-5.5-Cyber también tendrá acceso restringido con proceso de verificación.

OpenAI anunció el 30 de abril el lanzamiento de GPT-5.5-Cyber, una versión del modelo GPT-5.5 ajustada para tareas de ciberseguridad ofensiva y defensiva, con acceso restringido a «defensores críticos verificados» a través del portal chatgpt.com/cyber. El anuncio llegó cuatro días después de que Sam Altman declarara públicamente en X que Anthropic limitaba Claude Mythos por razones de «miedo vendido» y que él era partidario de poner los modelos más capaces a disposición de todos. The Register documentó la contradicción en un artículo del 1 de mayo titulado «OpenAI locks GPT-5.5-Cyber behind velvet rope despite slamming Anthropic for doing exactly that». La restricción de OpenAI tiene un matiz diferente al de Anthropic: GPT-5.5 base ya está disponible públicamente en ChatGPT y en la API para todos los usuarios de pago, mientras que Claude Mythos Preview no tiene acceso público. GPT-5.5-Cyber es una variante ajustada y más capaz para tareas de penetración y análisis de malware, y su restricción es para esa variante específica. Altman defendió la distinción en un hilo posterior en X, aunque varios periodistas de tecnología señalaron que la diferencia es semántica: ambas empresas tienen su modelo más peligroso detrás de un proceso de verificación de identidad y propósito. El ángulo contrario es el que plantea el Frontier Model Forum —del que ambas empresas son miembros—: su protocolo de evaluación de seguridad antes del despliegue de modelos con capacidades de ciberseguridad recomienda explícitamente el acceso controlado como práctica responsable. Si el protocolo recomienda esto, la pregunta es por qué Altman criticó a Anthropic por seguirlo. Para empresas costarricenses con equipos de ciberseguridad que evalúan herramientas de análisis de vulnerabilidades con IA, la restricción de ambos modelos más capaces significa que el acceso a las capacidades de vanguardia pasa por procesos de verificación que pueden tardar semanas.

02
N.º 02 AISI · Evaluación

El UK AISI confirma: GPT-5.5 y Claude Mythos son los únicos modelos que completan simulaciones de ataque de nivel experto

El Instituto de Seguridad de IA del Reino Unido publicó los resultados de sus pruebas comparativas de ciberseguridad ofensiva: los dos modelos restringidos de OpenAI y Anthropic superan a todos los demás en los escenarios más difíciles.

El AI Safety Institute del Reino Unido (AISI) publicó el 1 de mayo los resultados de sus evaluaciones comparativas de capacidades ofensivas en ciberseguridad para los modelos de lenguaje de mayor escala disponibles en 2026. Los resultados son claros: GPT-5.5 y Claude Mythos Preview son los únicos dos modelos que completan con éxito los escenarios de ataque multi-etapa de nivel «Experto» —los más complejos del banco de pruebas del AISI, que simulan compromisos de redes enterprise con múltiples puntos de pivote y defensas activas. GPT-5.5 logró una tasa de éxito del 71,4% y Mythos del 68,6%; el tercer modelo más alto, Gemini 1.5 Ultra, quedó en 41,2%. El AISI también encontró que GPT-5.5 tiene un jailbreak universal conocido que permite eludir las salvaguardas en todos los escenarios maliciosos probados, incluyendo en contextos de agentes multi-turno. OpenAI reconoció la existencia del jailbreak en el comunicado de lanzamiento y describió la restricción de acceso a GPT-5.5-Cyber como una medida temporal mientras trabajan en parchar la vulnerabilidad. Anthropic, por su parte, no publicó datos comparables sobre Claude Mythos. Para los investigadores de ciberseguridad costarricenses que trabajan para empresas de servicios financieros o para organismos del gobierno que atienden infraestructura crítica, el informe del AISI es el primer documento oficial que cuantifica la brecha de capacidad entre los modelos de vanguardia y el resto. La brecha de 30 puntos porcentuales entre GPT-5.5 y Gemini Ultra sugiere que los modelos más peligrosos son también los más útiles para la defensa —lo que complica cualquier política de restricción que no sea específica para el caso de uso.

03
N.º 03 Anthropic · Mythos

Claude Mythos Preview: qué es el modelo secreto de Anthropic que el AISI acaba de evaluar públicamente

Anthropic anunció Claude Mythos en la primera quincena de abril como un modelo de propósito general con capacidades de seguridad inusuales; hasta el informe del AISI, los únicos datos públicos eran los del propio Anthropic.

Claude Mythos Preview es el modelo de mayor capacidad que Anthropic ha lanzado hasta la fecha, disponible únicamente para un grupo seleccionado de investigadores de seguridad e instituciones académicas y gubernamentales verificadas. Anthropic lo describió al anunciarlo en red.anthropic.com como «un modelo que desempeña excepcionalmente bien en tareas de seguridad informática», sin publicar benchmarks propios comparables con otros modelos. El informe del AISI del 1 de mayo es la primera evaluación independiente del modelo, y sus hallazgos alinean con la descripción de Anthropic: Mythos tiene capacidades de ataque que superan a todos los demás modelos evaluados excepto GPT-5.5, y completa escenarios que ningún modelo de acceso general puede resolver. CNBC reportó el 16 de abril que Anthropic presentó Mythos simultáneamente con Claude Opus 4.7, que sí tiene acceso general, como una forma de demostrar que la empresa puede separar la distribución de sus modelos más potentes del ciclo comercial normal. El ángulo contrario lo presenta Gizmodo: la política de acceso selectivo de Anthropic para Mythos es coherente con su constitución publicada en abril, que prohíbe usos de Claude en sistemas letales autónomos. Pero la coherencia interna de Anthropic no resuelve el problema de que sus competidores tienen acceso a sus propios modelos equivalentes —y ahora el AISI ha publicado que GPT-5.5 supera a Mythos por menos de 3 puntos porcentuales en las pruebas más difíciles. Para los clientes costarricenses de la API de Anthropic, Mythos no está disponible por ahora; Opus 4.7 es el modelo más avanzado accesible.

04
N.º 04 Mercados · IPOs

SpaceX, Anthropic y OpenAI en camino al S&P 500: las tres salidas a bolsa que reconfigurarán el índice en 2026

The Motley Fool publicó el 1 de mayo un análisis de las condiciones para que SpaceX, Anthropic y OpenAI ingresen al S&P 500 tras sus respectivas salidas a bolsa. El criterio principal del índice es tener una capitalización de mercado de al menos USD 18.000 millones, cuatro trimestres consecutivos de ganancias positivas (o ganancias positivas acumuladas en el período de cuatro trimestres) y un precio de acciones por encima de USD 1. Los tres cumplen o pueden cumplir los criterios de capitalización fácilmente: SpaceX busca una valoración de USD 2 billones para su IPO, Anthropic negocia su ronda de valoración de USD 900.000 millones antes de una salida a bolsa contemplada para finales de 2026, y OpenAI tiene una valoración privada estimada en USD 300.000 millones. El obstáculo para Anthropic y OpenAI es el criterio de rentabilidad: ambas empresas operan con pérdidas operacionales significativas debido a los costos de entrenamiento e inferencia de sus modelos. Google anunció en abril una inversión de hasta USD 40.000 millones en Anthropic, y Amazon ya comprometió USD 5.000 millones adicionales en el primer trimestre de 2026; con ese capital, Anthropic podría construir el historial de cuatro trimestres de ganancias necesario si reduce su burn rate de infraestructura. Para las empresas costarricenses que usan servicios de OpenAI o Anthropic, la eventual cotización pública de estas compañías tiene implicaciones contractuales: las empresas públicas en EE.UU. están sujetas a regulación de la SEC que exige mayor transparencia sobre términos de servicio, precios y cambios de política, lo que reduciría la incertidumbre de los contratos enterprise actuales.

05
N.º 05 OpenAI · GPT-5.5

GPT-5.5 supera a GPT-5.4 en seis semanas: la carrera de versiones de OpenAI alcanza una cadencia que los clientes enterprise no pueden seguir

OpenAI lanzó GPT-5.5 el 23 de abril de 2026, seis semanas después de GPT-5.4 del 5 de marzo. Fortune publicó ese día un artículo documentando que el ritmo de lanzamiento de modelos ha llegado a un punto en el que los equipos de ingeniería de empresas con integraciones profundas de la API —evaluaciones de comportamiento, ajustes de prompts, pruebas de regresión, validación legal— no pueden completar un ciclo de pruebas de una versión nueva antes de que llegue la siguiente. Fortune entrevistó a cinco directores de ingeniería de empresas de servicios financieros y salud que usan la API de OpenAI, y todos describieron alguna versión del mismo problema: o se quedan en una versión vieja hasta que se desfase, o actualizan sin probar completamente y asumen el riesgo de comportamiento inesperado en producción. GPT-5.5 tiene mejoras documentadas sobre GPT-5.4 en tareas de razonamiento complejo, análisis de datos y generación de código, con latencia por token equivalente al modelo anterior. OpenAI describe el modelo como «más intuitivo» —capaz de inferir la intención del usuario mejor que sus predecesores—, lo que en términos técnicos se traduce en menos instrucciones explícitas necesarias en el system prompt para obtener el comportamiento deseado. El ángulo contrario es el de los clientes enterprise consultados por Fortune: GPT-5.5 ser «más intuitivo» también significa que sus respuestas pueden diferir de las de GPT-5.4 ante el mismo prompt, lo que invalida el historial de comportamiento documentado en las auditorías de modelos anteriores. Para las empresas costarricenses que usan la API de OpenAI en sistemas de atención al cliente o análisis automatizado, el consejo práctico es fijar la versión del modelo en la configuración de la API (usando el parámetro `model: gpt-5.4`) hasta completar la evaluación de GPT-5.5.

6 semanas
tiempo entre GPT-5.4 (5 marzo) y GPT-5.5 (23 abril); Fortune documenta que el ritmo supera la capacidad de evaluación de los clientes enterprise
06
N.º 06 Anthropic · Managed Agents

Anthropic lanza Managed Agents: agentes de largo horizonte con sesiones persistentes para aplicaciones enterprise

Anthropic lanzó Managed Agents, un servicio de plataforma Claude para agentes de trabajo de largo horizonte con interfaces estables para sesiones, harnesses y sandboxes. A diferencia de los agentes construidos directamente sobre la API de Claude, los Managed Agents tienen estado durable entre sesiones, acceso a herramientas con permisos más seguros y tiempos de arranque más rápidos para tareas recurrentes. El servicio está disponible desde la plataforma de Claude y apunta a empresas que necesitan automatizar flujos de trabajo complejos sin infraestructura propia de orquestación. Anthropic Claude Code 1.9.x ya incorpora Managed Agents en algunas funciones de resumé de sesión y de búsqueda de PRs. Anthropic también retiró la beta de ventana de contexto de 1M tokens para Sonnet 4.5; los usuarios que dependen de esa capacidad deben migrar a Sonnet 4.6 u Opus 4.6 donde el 1M contexto es general.

Hoja de datos
Anthropic lanza Managed Agents: agentes de largo horizonte con sesiones persistentes para aplicaciones enterprise
  • nuevo servicio de plataforma de Anthropic para agentes de largo horizonte con estado durable y sandboxes de herramientas segurosManaged Agents
  • ventana de contexto retirada de Sonnet 4.5; disponible de forma general en Sonnet 4.6 y Opus 4.6 sin header beta1M tokens
  • versión actual del CLI de Anthropic con Managed Agents integrados en /resume y búsqueda de PRsClaude Code 1.9.x
07
N.º 07 Resumen · Semana IA

La semana del 3 de mayo: el AISI dibuja la frontera entre los modelos peligrosos y el resto, y OpenAI cruza su propia línea roja

La contradicción de Sam Altman con GPT-5.5-Cyber será recordada como el momento en que el mercado de IA de ciberseguridad dejó de fingir que la apertura era la posición predeterminada. Ambas empresas líderes ahora tienen sus modelos más peligrosos detrás de procesos de verificación, y el AISI del Reino Unido ha publicado los primeros datos comparativos independientes que confirman por qué: a nivel experto, GPT-5.5 y Mythos son categorías distintas de los demás modelos disponibles en el mercado. El subargumento de la semana es financiero: Google comprometió hasta USD 40.000 millones en Anthropic, SpaceX busca USD 2 billones en su IPO, y Anthropic negocia una valuación de USD 900.000 millones. El mercado de IA está en una fase de consolidación de apuestas donde los actores que entren tarde tendrán cada vez más dificultades para competir en la frontera. Para los equipos de tecnología costarricenses que evalúan su stack de IA para el segundo semestre de 2026, la decisión de proveedor tiene ahora una dimensión adicional: cuál de las dos empresas —OpenAI o Anthropic— gestionará mejor la tensión entre velocidad de innovación y estabilidad de contratos enterprise.

71,4% vs 68,6%
tasas de éxito de GPT-5.5 y Claude Mythos en pruebas de ataque nivel Experto del AISI; ambos son los únicos modelos en completar los escenarios más difíciles
USD 40.000M
inversión de Google en Anthropic; la suma de Google y Amazon supera los USD 45.000M en compromisos públicos para la empresa
6 semanas
cadencia de lanzamiento de modelos GPT-5.x; Fortune documenta que los clientes enterprise no pueden seguir el ritmo de evaluación

En esta fechaInteligencia Artificial

Fuentes.