Un ingeniero de Anthropic le pide a un modelo de IA que busque vulnerabilidades en un software. Se va a dormir. A la mañana siguiente se despierta con un exploit completo, funcional, listo para ejecutar.
Eso es Claude Mythos Preview. Y Anthropic decidió que vos no lo podés tocar.
¿Qué es Mythos?
El lunes 7 de abril, Anthropic anunció su modelo más avanzado hasta la fecha. No es una actualización de Claude. Es otra cosa.
Es el modelo con mejores benchmarks jamás publicado. Punto.
Pero lo que lo hace realmente distinto no son los puntajes. Es lo que hace con ellos.
El modelo que hackea solo
Mythos Preview encontró vulnerabilidades zero-day — bugs que nadie sabía que existían — en todos los sistemas operativos principales y todos los navegadores web principales. Algunas de esas vulnerabilidades tenían 10, 20 y hasta 27 años sin ser detectadas. Un bug en OpenBSD, un sistema operativo famoso justamente por su seguridad, estuvo ahí desde 1999.
En un caso, Mythos encadenó 4 vulnerabilidades de un navegador web, escribió un exploit que escapó del sandbox del renderer Y del sistema operativo, y tomó control total de la máquina. Solo.
El modelo anterior de Anthropic, Opus 4.6, tenía un éxito cercano a 0% en desarrollo autónomo de exploits. Mythos lo hizo 181 veces en el mismo test. De 0 a 181. Eso no es una mejora incremental. Es un salto de categoría.
"Ingenieros de Anthropic sin formación formal en seguridad le pidieron a Mythos que busque vulnerabilidades de ejecución remota de código overnight, y amanecieron con un exploit completo y funcional." — Anthropic Frontier Red Team
Y acá viene lo más loco: nadie le entrenó eso. Las capacidades de hacking emergieron solas, como consecuencia de ser mejor en código y razonamiento. El mismo modelo que es mejor arreglando bugs es, automáticamente, mejor explotándolos.
¿Y por qué no lo lanzan?
Porque saben que si lo liberan, cualquier persona sin conocimiento de seguridad podría pedirle "encontrame una forma de entrar a este sistema" y amanecer con la llave en la mano.
En lugar de un lanzamiento público, Anthropic creó Project Glasswing — un programa donde solo 50 empresas tienen acceso al modelo para usarlo defensivamente. ¿Quiénes? Apple, Google, Microsoft, Nvidia, Amazon, CrowdStrike, Palo Alto Networks. Los titanes.
Anthropic puso hasta USD 100 millones en créditos de uso para estos partners. La idea: que los defensores tengan ventaja antes de que modelos con capacidades similares lleguen al mercado abierto.
"Los peligros de equivocarnos son obvios, pero si lo hacemos bien, hay una oportunidad real de crear un internet fundamentalmente más seguro." — Dario Amodei, CEO de Anthropic
El nombre del proyecto — Glasswing — viene de una mariposa con alas transparentes. Una metáfora: las vulnerabilidades de software son relativamente invisibles, como esas alas. El trabajo de Mythos es hacerlas visibles antes de que alguien las explote.
El debate que nadie quiere tener
Hay una tensión enorme en lo que hizo Anthropic. Por un lado, construyeron una empresa sobre la narrativa de seguridad y responsabilidad. Son los que se fueron de OpenAI porque no les gustaba cómo manejaban los riesgos.
Por otro lado, acaban de crear un modelo que puede hackear cualquier sistema operativo del planeta. Y en vez de no construirlo, lo construyeron, lo limitaron a 50 empresas, y lo presentaron como un acto de responsabilidad.
La realidad es que Anthropic eligió un camino intermedio: ni liberar el modelo al público, ni guardárselo en secreto. Lo puso en manos de los defensores más grandes del mundo y dijo "arreglen todo lo que puedan antes de que llegue algo parecido al mercado abierto."
¿Es suficiente? No sabemos. Pero es más de lo que cualquier otra empresa ha hecho con un modelo de este nivel.
¿Y a nosotros qué nos cambia?
Varias cosas.
Primero: el modelo más potente del mundo existe y no es público. La brecha entre lo que pueden hacer las big tech y lo que podemos hacer el resto se está agrandando. Soberanía de datos no es solo un slogan — es urgencia.
Segundo: si un modelo de IA puede encontrar vulnerabilidades en cualquier software, ¿qué pasa con los sistemas que usamos todos los días en Argentina? Bancos, apps gubernamentales, infraestructura crítica. ¿Alguien los está auditando con estas herramientas? Spoiler: no.
Tercero: esto confirma lo que venimos diciendo. La IA no es una herramienta más. Es un multiplicador de capacidades. Y el que la tenga primero — sea para defender o para atacar — tiene ventaja absoluta.
Anthropic creó un arma y decidió no venderla. Por ahora. La pregunta es cuánto tiempo dura ese "por ahora."