-
Fable 5 redirige consultas de ciberseguridad, biología y química a Claude Opus 4.8.
-
Mythos 5, sin restricciones, opera solo bajo Project Glasswing con el gobierno de EE. UU.
Anthropic lanzó el 9 de junio de 2026 Claude Fable 5, el primer modelo de la clase Mythos disponible para uso general. Según la compañía, el modelo supera en capacidad a todos los que ha puesto a disposición pública hasta la fecha, con rendimiento de frontera en ingeniería de software, investigación científica y trabajo de conocimiento complejo. Sin embargo, la firma lo lanzó con mecanismos de seguridad que bloquean consultas en ciberseguridad, biología, química y destilación de modelos, redirigiendo esas respuestas a Claude Opus 4.8.
La razón del bloqueo remite directamente a lo que Anthropic documentó en las semanas previas al lanzamiento. A través de Project Glasswing, el programa restringido con el que Anthropic distribuyó Mythos Preview desde abril, la compañía y sus aproximadamente 50 socios encontraron más de 10.000 vulnerabilidades de severidad alta o crítica en lo que Anthropic describe como el software de mayor importancia sistémica a nivel global.
Entre los participantes figuran Cloudflare, Mozilla, Microsoft, Oracle y Palo Alto Networks, además de bancos e instituciones de infraestructura crítica.
Cloudflare identificó 2.000 errores en sus sistemas de ruta crítica —400 de ellos de severidad alta o crítica— con una tasa de falsos positivos que el equipo de la empresa consideró mejor que la de los auditores humanos. Mozilla, por su parte, encontró y corrigió 271 vulnerabilidades en Firefox 150, más de diez veces las que detectó en Firefox 148 con Claude Opus 4.6. El Instituto de Seguridad de IA del Reino Unido señaló que Mythos Preview fue el primer modelo en resolver sus dos simulaciones de ciberataques de principio a fin de forma autónoma.
Ese mismo poder ofensivo es el que Anthropic decidió restringir en Fable 5. Sin salvaguardas, las capacidades del modelo en áreas como ciberseguridad podrían ser utilizadas de forma indebida para causar daños graves, señala la empresa en su anuncio. La compañía advierte que los filtros están calibrados de forma conservadora y que en ocasiones bloquearán solicitudes inofensivas.
Mythos sin restricciones: solo para defensores
Fable 5 se diferencia de Mythos 5, su contraparte sin restricciones. Mythos 5 tiene las mismas capacidades que Fable 5, pero con las salvaguardas levantadas en algunas áreas, y se desplegará inicialmente a través de Project Glasswing, en colaboración con el gobierno de Estados Unidos, como una actualización de Mythos Preview. Anthropic señala que posee las capacidades de ciberseguridad más avanzadas de cualquier modelo en el mundo.
El contexto en el que llega Fable 5 al público es el de una escalada documentada de ataques contra infraestructura de criptomonedas con asistencia de IA. Según Maximiliano Carjuzaa, cofundador de Money On Chain, cerca del 100% de los ataques DeFi registrados en los meses previos involucraron IA en alguna medida. Charles Guillemet, CTO de Ledger, advirtió en abril que la IA está reduciendo la barrera de entrada para los atacantes. En ese mismo mes, la industria registró al menos 34 hackeos con pérdidas cercanas a USD 635 millones, equivalentes a casi el 80% del total robado en lo que iba de 2026.
Para el ecosistema de criptomonedas, la llegada de Fable 5 al público plantea una tensión concreta: los mismos filtros que Anthropic considera suficientes para uso general no han sido verificados de forma independiente ante intentos sistemáticos de evasión. Fable 5 bloquea consultas de ciberseguridad, pero la versión sin restricciones —Mythos 5— ya opera en manos de organizaciones gubernamentales y de infraestructura, con capacidades que los registros de Project Glasswing demuestran como sin precedente en la detección autónoma de vulnerabilidades críticas.


