Anthropic publica su modelo más capaz en ingeniería de software con nuevas herramientas de control agentic; OpenAI responde con un modelo especializado en ciberseguridad defensiva de acceso vetado.
Anthropic lanza su modelo más capaz hasta la fecha con mejoras de 13% en codificación, presupuestos de token para loops agenticos y el primer soporte de imágenes en alta resolución de la familia Claude.
Anthropic publicó Claude Opus 4.7 el 16 de abril de 2026 como disponibilidad general en todos los productos de Claude, la API, Amazon Bedrock, Google Cloud Vertex AI y Microsoft Foundry. El modelo introduce tres capacidades nuevas que no tenía Opus 4.6: task budgets (presupuestos de token que orientan al modelo sobre cuánto esfuerzo dedicar a un loop agentico completo), un nuevo nivel de razonamiento xhigh entre high y max, y soporte de imágenes en resolución máxima de 2.576px / 3,75 megapíxeles. En el benchmark interno de codificación de Anthropic (93 tareas), Opus 4.7 mejoró en un 13% sobre Opus 4.6, incluyendo cuatro tareas que ningún modelo anterior de Anthropic podía resolver. El modelo usa un nuevo tokenizador que puede consumir entre 1x y 1,35x más tokens al procesar texto que sus predecesores. El precio permanece igual que Opus 4.6: USD 5 por millón de tokens de entrada y USD 25 por millón de tokens de salida. Anthropid admitió en el comunicado de lanzamiento —reportado por Axios— que Opus 4.7 sigue siendo menos capaz que el no publicado modelo «Mythos», cuyas capacidades de descubrimiento autónomo de zero-days generaron debate dentro de la empresa sobre si publicarlo. Esto introduce la tensión más relevante del lanzamiento: ¿cuándo una IA es demasiado capaz para lanzarse sin restricciones? Para el mercado costarricense, Opus 4.7 está disponible desde hoy vía API de Anthropic sin restricciones geográficas; los equipos de desarrollo de software en empresas de la Zona Franca de Coyol y La Lima que usan Claude Code tienen acceso inmediato.
Sam Altman anunció el 30 de abril que el modelo especializado en ciberseguridad se distribuirá a través del programa Trusted Access for Cyber; no estará disponible al público general.
OpenAI comenzó el despliegue de GPT-5.5-Cyber el 30 de abril de 2026, un modelo frontier de ciberseguridad que solo estará disponible para usuarios aprobados a través del programa Trusted Access for Cyber. Según el anuncio de Sam Altman y la documentación técnica publicada en openai.com, el modelo está diseñado para uso defensivo: identificación de vulnerabilidades, análisis de amenazas y soporte en respuesta a incidentes en infraestructura crítica. La restricción de acceso responde a los riesgos de uso dual: GPT-5.5-Cyber tiene capacidades suficientes para automatizar partes del flujo ofensivo de hacking, lo que lo hace peligroso en manos no verificadas. OpenAI implementó un proceso de vetting que incluye verificación institucional y revisión de casos de uso. El modelo no está disponible en la API pública ni en ChatGPT Plus. El movimiento de OpenAI se produjo días después de que Anthropic anunciara que el modelo no publicado «Mythos» fue capaz de descubrir zero-days autónomamente en los principales sistemas operativos y navegadores, según CNBC. La carrera entre los dos laboratorios por la supremacía en ciberseguridad ofensiva y defensiva tiene implicaciones directas para equipos de seguridad en Costa Rica: el CCTIR del MICITT y el CERT de la CCSS son elegibles para solicitar acceso al programa de OpenAI.
Con GPT-5.5 ya en la API desde el 24 de abril, OpenAI consolida su apuesta por agentes que ejecutan computadoras y flujos completos de trabajo sin supervisión constante.
GPT-5.5, lanzado por OpenAI el 23 de abril y disponible en la API desde el 24, representa el primer modelo de uso general de la empresa con capacidades nativas de uso de computadora a nivel state-of-the-art: puede operar interfaces gráficas, navegar la web y ejecutar flujos de trabajo complejos en múltiples aplicaciones simultáneamente. TechCrunch lo describe como el modelo que más acerca a OpenAI a su visión de un «super app» de IA. El resumen semanal de IA publicado el 29 de abril en blog.greeden.me documenta que GPT-5.5 coincide en el lanzamiento con la expansión de Codex —la herramienta de codificación agentica de OpenAI— y que ambos productos apuntan al mismo segmento: profesionales que quieren delegar tareas completas, no solo obtener respuestas. Esto pone directamente a GPT-5.5 en competencia con Claude Code de Anthropic y con Gemini para el control de flujos de trabajo empresariales. El ángulo contrario: varios desarrolladores en la comunidad HackerNews señalaron esta semana que las capacidades de uso de computadora de GPT-5.5 todavía fallan con frecuencia en flujos con más de cuatro pasos dependientes, y que la tasa de error en entornos reales supera lo que los benchmarks de laboratorio sugieren. La crítica más directa proviene de investigadores del AI Safety Institute del Reino Unido, que publicaron que las evaluaciones de capacidades de agentes deben ser obligatorias antes del lanzamiento comercial. Para desarrolladores costarricenses, ambas herramientas —GPT-5.5 y Opus 4.7— están disponibles en la API sin restricciones regionales.
El primer trimestre de 2026 registró una concentración de capital hacia la industria de IA sin precedentes. Según el análisis de Kersai, cuatro de los cinco mayores rounds de venture capital de la historia cerraron en el período: OpenAI levantó USD 122.000 millones, Anthropic USD 30.000 millones, xAI de Elon Musk USD 20.000 millones y Waymo USD 16.000 millones. El total de los cuatro rounds supera los USD 188.000 millones, lo que convierte al Q1 2026 en el trimestre de mayor capitalización de riesgo en cualquier industria de la historia según MIT Technology Review. La paradoja que señalan varios analistas del MIT: más del 80% de ese capital irá a infraestructura de computación (chips, centros de datos, cables submarinos), no a investigación de nuevos algoritmos. El progreso en modelos podría estar desacelerándose en el margen —las mejoras de GPT-5.5 sobre GPT-5.4 son menores que las de GPT-5 sobre GPT-4— mientras que la inversión sigue creciendo exponencialmente. Para Costa Rica, la relevancia es que Intel en Belén y las empresas de servicios cloud en la Zona Franca son parte de la cadena de valor de esa infraestructura, con potencial de atracción de inversión adicional si el gobierno de Fernández mantiene los incentivos del régimen de zonas francas.
El 79% de las organizaciones globales ya adoptó agentes de IA en alguna forma de producción al cierre del primer trimestre de 2026, y se proyecta que el 40% de las aplicaciones empresariales tendrán agentes embebidos para finales de año, según datos de Kersai. Este es el dato que más rápido cambió en los últimos doce meses: en Q1 2025, la adopción de agentes era del 31%. La velocidad de adopción crea un vacío en gobernanza. Harvard anunció el 28 de abril que su Facultad de Artes y Ciencias migra de ChatGPT Edu a Claude de Anthropic para el año académico 2026-2027, documentado por el Harvard Crimson. El argumento central de la decisión fue el nivel de control que Anthropic ofrece sobre el comportamiento del modelo en entornos educativos. Otras universidades de EE.UU. están evaluando decisiones similares. El ángulo contrario que no debe perderse de vista: el mismo informe de MIT Technology Review que documenta la penetración de los agentes incluye datos de fallos de alineación en producción. El 34% de las organizaciones que ya usan agentes reportaron al menos un incidente de «comportamiento fuera de spec» —el agente hizo algo correcto según sus instrucciones pero incorrecto según el espíritu del objetivo— en los últimos 90 días. Esto sugiere que la velocidad de adopción supera el ritmo de desarrollo de mejores prácticas de evaluación y auditoría.
La semana del 24 al 30 de abril de 2026 entrega dos modelos frontier —Claude Opus 4.7 de Anthropic y GPT-5.5-Cyber de OpenAI— a la par de los datos más impactantes sobre adopción empresarial y captación de capital en la historia de la industria. El patrón que emerge: los laboratorios de IA pueden construir modelos que descubren zero-days autónomamente (Mythos), pero eligen no publicarlos porque los riesgos de uso dual los obligan a inventar restricciones que aún no tienen marco legal. Para Costa Rica, la semana confirma que el acceso a modelos frontier es universal y sin restricciones geográficas, pero el marco regulatorio para su uso empresarial sigue siendo el de cada empresa individualmente. El MICITT no tiene aún una política de IA publicada para el sector privado; la nueva administración Fernández tiene la oportunidad de establecer ese marco en sus primeros cien días.