jesus manrique

Posted on Jun 10 • Originally published at guayoyo.tech

Claude Fable 5: Anthropic soltó la bestia (con correa) y subió la parada del coding autónomo

#ai #programming #automation #technology

Ayer 9 de junio de 2026 Anthropic sacó a la calle su modelo más bestia hasta ahora. Se llama Claude Fable 5, y no es un Opus con esteroides: es el primer modelo Mythos-class que llega al público, una categoría que estrenaron en abril en modo secreto y que hasta ayer solo existía tras una puerta con guardia.

El lanzamiento viene con letra pequeña. Bastante.

Fable 5 sale encadenado. Clasificadores de seguridad integrados que bloquean consultas de ciberseguridad ofensiva, biología de doble uso y destilación de modelos, y las redirigen automáticamente a Opus 4.8. Es como venderte un Ferrari pero el acelerador se corta solo cuando el GPS huele que estás cerca de una escuela.

La jugada es ambiciosa y medio esquizofrénica, y cae justo cuando Anthropic está en el ojo del huracán: acaban de meter su prospecto de IPO ante la SEC, están valorados en $965 mil millones con un revenue run rate de $47 mil millones, y hace cinco días publicaron un informe donde básicamente dicen que la IA está a punto de aprender a mejorarse sola sin pedirnos permiso.

Bienvenidos a 2026, el año donde todo pasa al mismo tiempo.

Mythos: el monstruo que guardaron bajo llave

En abril de 2026 Anthropic mostró Mythos, un modelo tan arrecho detectando y explotando vulnerabilidades de software que decidieron no soltarlo al público. Se lo dieron solo a un grupito de empresas de infraestructura crítica bajo un programa llamado Project Glasswing. El argumento: las capacidades de hacking ofensivo que tenía esto eran demasiado jugo como para cualquiera que no viniera a defender.

Wall Street se volvió loco. CrowdStrike y Palo Alto Networks empezaron a metérselo en sus flujos. Mozilla lo usó para encontrar 271 bugs en Firefox. El mensaje era clarísimo: olvídate del chatbot que te explica recetas, esto es otra cosa.

Dos meses después decidieron abrir. Pero con condiciones.

Fable 5 y Mythos 5: mellizos con vidas distintas

El mismo día soltaron dos:

Característica	Claude Fable 5	Claude Mythos 5
¿Quién lo usa?	Tú, yo, cualquiera con API key	Los del club VIP (Project Glasswing)
Salvaguardas	Puestas (ciber, bio, química, destilación)	Levantadas en varias áreas
Precio	$10 / $50 por millón de tokens (entrada/salida)	Lo mismo
API model ID	`claude-fable-5`	No está en venta
Ventana de contexto	~1M tokens	Lo mismo
Output máximo	~128K tokens por respuesta	Lo mismo

Misma arquitectura. Distinto permiso. Fable 5 es el que te venden con seguro incluido, Mythos 5 es para los que Anthropic ya investigó y dijo "ok, tú puedes".

Las salvaguardas: ¿protección o camisa de fuerza?

Fable 5 trae clasificadores de seguridad metidos dentro del modelo, no es un wrapper externo. Cuando detecta algo que no le cuadra, simplemente se niega y le pasa la llamada a Opus 4.8.

Lo que no vas a poder preguntarle:

Hacking ofensivo (explotar vulnerabilidades, crear malware)
Biología y química peligrosa (sintetizar toxinas, patógenos)
Destilación de modelos (usar respuestas de Fable para entrenar otro modelo)

Anthropic dice que esto afecta a menos del 5% de las sesiones y que metieron más de 1,000 horas de red-teaming sin que nadie encontrara un jailbreak universal. También admiten que el clasificador se va de conservador — algunas consultas perfectamente legales van a rebotar a Opus 4.8 porque el sistema prefiere pecar de precavido.

Y viene con un detalle polémico: 30 días de retención de tráfico obligatoria, incluso si antes tenías zero-retention por contrato. Según Anthropic los datos no se usan para entrenar, solo para "defenderse de ataques y reducir falsos positivos". Pero el precedente es incómodo: más potencia = menos privacidad.

Los números (no oficiales, pero sabrosos)

Anthropic no ha soltado la tarjeta de sistema todavía. Lo que hay son benchmarks de terceros. Agarra esto como referencia, no como biblia.

Benchmark	Claude Fable 5	Opus 4.8	GPT-5.5	Gemini 3.1 Pro
SWE-Bench Pro (coding agéntico)	80.3%	69.2%	58.6%	54.2%
Terminal-Bench 2.1	88.0%	—	83.4%	—
Humanity's Last Exam (sin herramientas)	59.0%	—	52.2%	—
FrontierCode Diamond	29.3%	~14%	—	—
Razonamiento espacial	38.6%	14.5%	—	—

SWE-Bench Pro a 80.3%. Más de 20 puntos arriba de GPT-5.5. Eso no es un incremento incremental — es otra liga. En coding agéntico, Fable 5 está jugando solo.

Más perlas de los que ya lo probaron:

Hex (analytics): primer modelo en romper 90% en su benchmark de tareas analíticas. "10 puntos sobre Opus."
Cognition (los de Devin): el puntaje más alto jamás en FrontierBench.
CursorBench: estado del arte. "Abrió problemas de largo plazo que eran imposibles con modelos anteriores."
Base44 (vibe-coding): "One-shotea apps completas. Tool calling excelente."
Hebbia (finanzas): "El modelo más fuerte en finanzas que hemos probado."
Rakuten: "Al máximo esfuerzo, Fable reflexiona y valida su propio trabajo. El thinking extra se paga solo."

¿Y no era que había que parar?

El 4 de junio — cinco días antes de lanzar Fable 5 — Anthropic publicó un informe donde avisa que los sistemas de IA están dando señales de poder diseñar, construir y entrenar a sus propios sucesores sin que un humano meta mano. Lo llaman Recursive Self-Improvement (RSI).

El mismo informe le pide a todos los grandes laboratorios que establezcan un "freno coordinado y verificable" al desarrollo de modelos frontera. Dario Amodei lleva meses con el mismo disco: la ventana para actuar se está cerrando.

La contradicción es evidente y a Anthropic le han llovido preguntas: ¿cómo pides una pausa global y al mismo tiempo lanzas el modelo más potente del mercado? La respuesta de Diane Penn, head de producto: "carrera hacia arriba". Soltar tecnología poderosa con salvaguardas robustas es mejor que dejar el hueco para que lo ocupe alguien sin estándares.

Tú verás si te la compras.

Plata: el doble que Opus

	Input (1M tokens)	Output (1M tokens)
Claude Fable 5	$10.00	$50.00
Claude Opus 4.8	$5.00	$25.00

¿Quieres inferencia solo en servidores gringos? 10% extra.

Hasta el 22 de junio, los suscriptores Pro, Max, Team y Enterprise lo usan sin costo extra. A partir del 23, corre por cuenta tuya.

Penn insiste en que el precio final por tarea resuelta es menor porque Fable necesita menos intentos. "Simplemente tienes más ROI con modelos más inteligentes." Ok, Diane. Vamos a ver las facturas de junio.

¿Para qué rayos sirve?

Agentes. Metido en Claude Code o Managed Agents, Fable 5 puede trabajar días enteros sin supervisión: planifica por etapas, delega a subagentes, revisa su propio output. No es un copiloto — es un empleado al que le das un proyecto y vuelves cuando esté listo.

Coding. Migraciones de las grandes, implementaciones complejas, refactors que antes necesitaban un equipo. Escribe sus propios tests, implementa diseños con fidelidad alta y usa visión para comparar lo que hizo contra lo que le pediste.

Enterprise. Investigación profunda, análisis de documentos, entregables listos para revisar. Le pasas un cerro de PDFs y te devuelve un informe. No supervisas — revisas.

Visión. Lee diagramas, tablas y gráficos anidados en PDFs. También usa visión para chequear su propio código. Mercado: finanzas, legal, analytics, arquitectura.

¿Te sirve a ti?

Para lo del día a día, quédate con Opus 4.8 o un modelo rápido como Gemini 3.5 Flash. Más baratos, más rápidos, resuelven.

Fable 5 es para cuando el problema de verdad es pelúo y largo: refactors autónomos de horas, agentes encadenados, tareas donde Opus 4.8 levanta la mano y se rinde. A $10/$50 el millón de tokens, no es tu default — es tu arma secreta para cuando la calidad del output lo justifica.

Y si tu proyecto toca aunque sea de ladito la ciberseguridad ofensiva o la biología sintética, asume que Opus 4.8 te va a responder la mitad de las veces.

El tablero completo

Fable 5 no cayó en un día tranquilo:

OpenAI metió su IPO confidencial, valorada en $852 mil millones.
SpaceX/xAI debuta en bolsa este viernes.
Google puso a Gemini 3.5 Flash como el caballo rápido y barato.
GPT-5.5 Pro compite en matemáticas y conocimiento general, pero ni publicó sus números de coding agéntico.

Fable 5 es el rey del coding autónomo hoy. Pero este trono se mueve todos los meses.

En criollo

Claude Fable 5 es ambicioso, caro y sale con más restricciones que ningún modelo de Anthropic antes. También es, por los números que hay, el modelo más arrecho de coding agéntico del momento.

Anthropic está haciendo malabares entre "esto es peligroso, hay que regular" y "tómalo, cómpralo, úsalo ya". Si les funciona, Fable 5 va a ser el momento en que los modelos Mythos-class dejaron de ser un secreto de empresa para volverse herramienta de trabajo. Si no, va a ser el caso de estudio perfecto de por qué las salvaguardas de seguridad llegaron muy temprano o muy tarde.

Lo único seguro es que la vara del coding autónomo acaba de subir. Otra vez.

¿Te gusta este contenido? Suscríbete al newsletter en guayoyo.tech o síguenos en X.

DEV Community