Claude Mythos: los números que Anthropic no esperaba publicar – Riesgo Digital

ExclusivaMythos encontró un bug de 27 años en OpenBSD que las herramientas automáticas nunca detectaron Dato83,1% en CyberGym: supera a todos los humanos salvo los expertos más cualificados 72% de tasa de éxito generando exploits funcionales desde cero · Glasswing: 12 organizaciones con acceso restringido NuevoAISI confirma: Mythos resuelve el 73% de los CTF de nivel experto de forma autónoma Anthropic compromete 100M$ en créditos y 4M$ en donaciones a seguridad open source ExclusivaMythos encontró un bug de 27 años en OpenBSD que las herramientas automáticas nunca detectaron Dato83,1% en CyberGym: supera a todos los humanos salvo los expertos más cualificados 72% de tasa de éxito generando exploits funcionales desde cero · Glasswing: 12 organizaciones con acceso restringido NuevoAISI confirma: Mythos resuelve el 73% de los CTF de nivel experto de forma autónoma Anthropic compromete 100M$ en créditos y 4M$ en donaciones a seguridad open source

⬡ Análisis técnico · 29 de abril de 2026 · ↩ Continuación de Project Glasswing

Claude Mythos:
los números
que nadie esperaba

Un bug de 27 años sin detectar. Miles de zero-days en cada sistema operativo y navegador del planeta. Un exploit de cuatro vulnerabilidades encadenadas que un equipo humano habría tardado semanas en construir. Esto es lo que la IA de Anthropic hizo en tres semanas.

Por Riesgo Digital · 7 min de lectura · Investigación activa

83,1%CyberGym — supera a todos salvo los expertos top

27 añosBug más antiguo encontrado (OpenBSD, TCP SACK)

73%Éxito en CTF de nivel experto según AISI

MilesZero-days críticos en 3 semanas de análisis

Análisis · Inteligencia Artificial · Ciberseguridad · Anthropic

Este artículo es la segunda parte de nuestra cobertura sobre Project Glasswing, la iniciativa de Anthropic para usar IA en la defensa del software crítico. Si no has leído el primero, te recomendamos empezar por ahí para entender el contexto.

Cuando Anthropic anunció Project Glasswing el 7 de abril, la pregunta era inevitable: ¿de verdad es tan potente, o es marketing de laboratorio? Tres semanas después, los datos técnicos publicados por el equipo de Red Team de Anthropic y validados de forma independiente por el AI Security Institute del Reino Unido (AISI) responden esa pregunta con una claridad incómoda.

Claude Mythos Preview no es una mejora incremental. Es un salto de categoría. Y los números lo demuestran caso a caso.

Los hallazgos que cambian el debate

Anthropic puso a Mythos a analizar los sistemas más auditados y revisados del mundo: todos los grandes sistemas operativos, todos los navegadores principales, componentes de infraestructura crítica. El método era simple y brutal: «Encuentra vulnerabilidades en este programa.» Sin pistas. Sin contexto adicional. Solo código y autonomía.

Lo que encontró en tres semanas no debería ser posible a esa velocidad:

OpenBSD · TCP SACK

27 años sin detectar

Una vulnerabilidad en la pila de red que permitía tumbar remotamente cualquier equipo con una conexión especialmente diseñada. Las herramientas de fuzzing tradicionales la habían probado millones de veces sin encontrarla. Mythos la localizó razonando sobre la lógica del código.

FFmpeg

16 años sin detectar

Un fallo en la biblioteca de vídeo más usada del mundo. Los sistemas automatizados la habían escaneado cinco millones de veces sin resultado. Mythos no buscaba patrones conocidos: buscaba lógica rota.

CVE

FreeBSD NFS · RCE

CVE-2026-4747

Una vulnerabilidad de ejecución remota de código en el sistema de archivos en red de FreeBSD. Mythos no solo la encontró: escribió de forma autónoma un exploit funcional para explotarla.

×4

Kernel Linux · Escalada

4 vulnerabilidades encadenadas

Mythos identificó y encadenó cuatro vulnerabilidades del kernel de Linux para lograr una escalada completa de privilegios: de usuario normal a root. Un ataque así habría requerido semanas de trabajo de un equipo especializado.

El caso del exploit de navegador: Mythos construyó de forma autónoma un exploit para navegadores web que encadenaba cuatro vulnerabilidades distintas, incluyendo un JIT heap spray capaz de evadir tanto el sandbox del renderer como el del sistema operativo. Nicholas Carlini, investigador senior de Anthropic, describió lo ocurrido con una frase: encontró más fallos de seguridad en las últimas semanas de pruebas que en todo el resto de su carrera combinada.

Los benchmarks que saturó y los que no

El AISI evaluó a Mythos de forma independiente y sus conclusiones son reveladoras. Los benchmarks de ciberseguridad existentes ya no sirven para medir a este modelo: los ha saturado.

Benchmark	Mythos Preview	Claude Opus 4.6	Diferencia
CyberGym (vulnerabilidades)	83,1%	66,6%	+16,5 pp
SWE-bench Verified	93,9%	80,8%	+13,1 pp
CTF experto (AISI)	73%	~45%	+28 pp
Exploits funcionales (zero-day)	>72%	bajo	Salto generacional
USAMO (razonamiento matemático)	97,6%	~60%	+37 pp

El dato más importante no está en la tabla: en el 89% de los 198 informes de vulnerabilidades revisados manualmente por contratistas de seguridad expertos, estos concordaron exactamente con la severidad que Mythos había asignado. El modelo no solo encuentra los fallos — los clasifica con la precisión de un experto senior.

Por qué no está disponible para nadie más

La decisión de Anthropic de no lanzar Mythos al público general es, en el contexto de la industria, inusual. Los laboratorios suelen correr para publicar. Aquí ocurrió lo contrario: construyeron un modelo que demostrablemente supera a casi todos los humanos en la búsqueda de vulnerabilidades, y decidieron no ponerlo al alcance de nadie sin verificación.

La razón es tan sencilla como incómoda: la misma capacidad que permite encontrar y parchear vulnerabilidades permite encontrarlas y explotarlas. No hay interruptor que separe ambos usos. La única palanca disponible es el control de acceso.

«No planeamos hacer Mythos Preview disponible de forma general debido a sus capacidades de ciberseguridad»

— Anthropic, comunicado oficial · 7 de abril de 2026

La coalición y el modelo de gobernanza

Project Glasswing opera con tres niveles de acceso, cada uno con requisitos de verificación distintos:

12 socios fundadores con acceso directo: Apple, Amazon (AWS), Google, Microsoft, Cisco, CrowdStrike, NVIDIA, JPMorganChase, Palo Alto Networks, la Linux Foundation y otros. Acceso a Mythos Preview para auditoría defensiva de sus sistemas críticos.
40 organizaciones adicionales en despliegue supervisado: acceso a través de las plataformas cloud de los socios (Vertex AI, Amazon Bedrock, Microsoft Foundry) bajo controles reforzados: cifrado gestionado por el cliente, aislamiento de red VPC, logs de auditoría obligatorios.
Cyber Verification Program: ruta de solicitud para profesionales de seguridad verificados. Activo en claude.com/form/cyber-use-case. Requiere validación de identidad profesional y casos de uso estrictamente defensivos.

El compromiso económico: Anthropic ha asignado 100 millones de dólares en créditos de uso y 4 millones de dólares en donaciones directas a organizaciones de seguridad de código abierto. Cada 90 días publicará un informe con los detalles de las vulnerabilidades corregidas y los aprendizajes del proceso. El primero está previsto para julio de 2026.

Lo que esto significa para los próximos 18 meses

La pregunta que nadie puede evitar es cuánto tiempo dura esta ventana de ventaja. Anthropic calcula que capacidades similares a las de Mythos estarán «ampliamente disponibles» en un plazo de 18 meses — presumiblemente en manos de actores que no tendrán ningún incentivo para usarlas de forma responsable.

El patrón ya ha empezado. Claude Opus 4.7, lanzado el 16 de abril de 2026, es el primer modelo post-Glasswing de Anthropic e incorpora salvaguardas de ciberseguridad en tiempo real. La arquitectura que Mythos puso a prueba empieza a filtrarse, de forma controlada, hacia los modelos de uso general.

La advertencia que nadie quiere ignorar: CrowdStrike detectó un 89% de aumento en ataques de actores usando IA en el último año. El EU AI Act entra en su siguiente fase el 2 de agosto de 2026, con obligaciones de auditoría y penalizaciones de hasta el 3% de ingresos globales. La gobernanza ya no es una opción. Es una obligación legal.

La consecuencia más profunda de Mythos no es la lista de bugs encontrados. Es que ha demostrado que la detección de vulnerabilidades puede ser abundante, rápida y barata. Lo que deja de ser el diferenciador es encontrar el fallo. Lo que pasa a serlo es la velocidad de respuesta, la arquitectura de parcheo y la capacidad institucional de actuar antes de que otros también lo encuentren.

Hace dos décadas, encontrar una vulnerabilidad crítica en el kernel de Linux requería meses de trabajo de los mejores expertos del planeta. Mythos lo hace en minutos. La carrera no ha terminado. Acaba de cambiar de velocidad.

#ClaudeMythos #ProjectGlasswing #Anthropic #Ciberseguridad #ZeroDay #RiesgoDigital #IA #SeguridadDigital #OpenBSD #Vulnerabilidades

Más artículos

Project Glasswing: la IA que quiere blindar el software crítico

18 de abril de 2026

Tu jefe en pantalla no es tu jefe: la estafa deepfake de 21M€

24 de abril de 2026

El apagón de España no fue un ciberataque. Pero nos enseñó que estábamos indefensos

22 de abril de 2026

Riesgo Digital

Claude Mythos:
los números
que nadie esperaba

Los hallazgos que cambian el debate

Los benchmarks que saturó y los que no

Por qué no está disponible para nadie más

La coalición y el modelo de gobernanza

Lo que esto significa para los próximos 18 meses

More posts

El Ataque a Canvas

Claude Mytos

Mythos y el Riesgo para Bancos y Gobiernos

Ciberataques en España en 2025

Claude Mythos:los númerosque nadie esperaba

Los hallazgos que cambian el debate

Los benchmarks que saturó y los que no

Por qué no está disponible para nadie más

La coalición y el modelo de gobernanza

Lo que esto significa para los próximos 18 meses

More posts

El Ataque a Canvas

Claude Mytos

Mythos y el Riesgo para Bancos y Gobiernos

Ciberataques en España en 2025

Claude Mythos:
los números
que nadie esperaba