DEV Community

Daniel for Datalaria

Posted on • Originally published at datalaria.com

The Thinking Game: De cómo DeepMind convirtió los videojuegos en la mayor herramienta científica de la historia

En la era del hype desenfrenado por la Inteligencia Artificial Generativa, es fácil perder de vista el objetivo final. Mientras Silicon Valley compite por ver quién tiene el chatbot más elocuente, un laboratorio en Londres ha estado persiguiendo una meta diferente, casi esotérica: resolver la inteligencia para luego usarla para resolver todo lo demás.

El nuevo documental "The Thinking Game" (seleccionado por el Festival de Tribeca) no es solo una película sobre tecnología; es la crónica de una obsesión intelectual. Dirigida por Greg Kohs, la cinta sigue a Demis Hassabis y al equipo de Google DeepMind a lo largo de una década, narrando la transición desde una startup con problemas de liquidez hasta convertirse en el arquitecto de uno de los mayores avances científicos del siglo XXI: AlphaFold [1].

Cartel The Thinking Game

Este post analiza los pilares técnicos y filosóficos que el documental expone, desgranando cómo los videojuegos sirvieron de campo de entrenamiento para la ciencia dura y por qué la búsqueda de la Inteligencia Artificial General (AGI) es el "Juego del Pensamiento" definitivo.

Imagen representativa sobre The Thinking Game

1. El Arquitecto: De Niño Prodigio a Visionario de la AGI

Para entender DeepMind, hay que entender a Demis Hassabis. El documental hace un trabajo excelente al conectar los puntos de su biografía, revelando que la arquitectura de sus IAs no es accidental, sino un reflejo de su propia mente multidisciplinaria [2].

Hassabis no es el típico CEO tecnológico. Fue un niño prodigio del ajedrez (el segundo mejor del mundo en su categoría a los 13 años) y comenzó a programar a los 8 años. A los 17, ya trabajaba en Bullfrog Productions diseñando la IA del icónico videojuego Theme Park. Allí, Hassabis experimentó con una premisa fascinante: simular el comportamiento humano mediante agentes autónomos. Si ponías una tienda de comida con mucha sal al lado de una montaña rusa, los visitantes virtuales vomitaban. Nadie programó el vómito explícitamente; fue una consecuencia emergente [3].

Tras su paso por la industria del videojuego, Hassabis dio un giro hacia la neurociencia en Cambridge. Su tesis: el cerebro humano es la única "prueba de existencia" que tenemos de que la inteligencia general es posible. DeepMind nació de esa intersección: inspiración biológica para construir silicio inteligente [4].

Imagen representativa sobre Demis Hassabis

2. El Campo de Pruebas: De los Píxeles a la Intuición

La estrategia de DeepMind siempre fue clara: utilizar los juegos no como un fin, sino como un sandbox (caja de arena) seguro para entrenar algoritmos de Aprendizaje por Refuerzo (Reinforcement Learning). El documental estructura este progreso en tres fases críticas que definieron la última década de la IA:

Fase 1: La Era Atari y el Aprendizaje Profundo

El primer gran hito fue enseñar a una IA a jugar a juegos de Atari simplemente "mirando" los píxeles de la pantalla, sin conocer las reglas. El momento "Eureka" llegó con el juego Breakout. Tras horas de entrenamiento, el agente DQN no solo aprendió a jugar, sino que descubrió una estrategia óptima: cavar un túnel lateral para enviar la bola detrás del muro de ladrillos. Los desarrolladores no programaron esa táctica; la máquina la inventó [5].

Fase 2: AlphaGo y el "Momento Sputnik"

El enfrentamiento contra Lee Sedol en 2016 es el eje dramático de la primera mitad del filme. Aquí, el documental destaca el famoso Movimiento 37. Con una probabilidad de 1 entre 10.000 de ser jugado por un humano, ese movimiento fue la prueba definitiva de que la IA había trascendido el cálculo bruto para entrar en el terreno de la creatividad e intuición.

Más fascinante aún fue la evolución hacia AlphaZero. A diferencia de su predecesor, que estudió partidas humanas, AlphaZero aprendió desde la tabula rasa (pizarra en blanco), jugando contra sí mismo millones de veces. Se convirtió en su propio maestro, eliminando siglos de sesgo humano y descubriendo estrategias que ningún Gran Maestro había concebido jamás [6].

Fase 3: La Niebla de Guerra con AlphaStar

El salto a StarCraft II representó el desafío de la información imperfecta. A diferencia del Go, donde todo el tablero es visible, en StarCraft hay "niebla de guerra". AlphaStar tuvo que aprender a explorar, planificar a largo plazo y tomar decisiones en tiempo real, alcanzando un nivel de Gran Maestro y demostrando que la IA podía manejar la incertidumbre [7].

3. El Pivote Científico: El Telescopio de AlphaFold

Aquí es donde el documental y la misión de DeepMind alcanzan su clímax. Hassabis usa una analogía brillante que ayuda a entender la magnitud del salto desde los juegos a la biología:

"Construir sistemas como AlphaGo fue como aprender a pulir lentes de vidrio con una precisión perfecta. Fue un arte difícil y técnico, pero el fin último no era tener lentes bonitas en una estantería. AlphaFold fue el momento en que finalmente tomaron esas lentes, construyeron un telescopio y lo apuntaron al cielo biológico, revelando galaxias de estructuras de proteínas que antes eran invisibles para el ojo humano."

El problema del plegamiento de proteínas (cómo una cadena de aminoácidos 1D se pliega en una estructura 3D funcional) había desconcertado a la biología durante 50 años. La forma determina la función: si conoces la forma, puedes entender enfermedades y diseñar fármacos [8].

El documental muestra con cruda honestidad el fracaso inicial en la competición CASP13, donde ganaron pero sin la precisión necesaria para ser útiles a la ciencia experimental. "No sirve de nada tener la escalera más alta si vas a la luna", señala Hassabis.

Tras un rediseño total y un esfuerzo titánico durante el confinamiento por COVID-19, AlphaFold 2 resolvió el problema en CASP14. En lugar de convertirlo en un producto SaaS cerrado y lucrativo, DeepMind liberó las estructuras de 200 millones de proteínas —básicamente todo el universo proteico conocido— como un "regalo para la humanidad" [9].

4. Ética: El "Proyecto Manhattan" del Siglo XXI

"The Thinking Game" no rehúye la oscuridad. Se trazan paralelismos explícitos con el Proyecto Manhattan y la figura de Robert Oppenheimer. La tecnología es neutral, pero su aplicación no.

Hassabis se posiciona en contra del mantra de Silicon Valley de "muévete rápido y rompe cosas". Su argumento es lapidario: cuando construyes sistemas que pueden superar la inteligencia humana, no puedes permitirte romper cosas para luego arreglarlas.

El documental revela la tensión en la adquisición por parte de Google en 2014. DeepMind necesitaba el poder de computación (compute) masivo de Google, pero lucharon ferozmente por mantener su independencia cultural y ética, evitando ser absorbidos por la maquinaria de productos comerciales a corto plazo para centrarse en la AGI segura [10].

Conclusión: La Herramienta Definitiva

"The Thinking Game" es un testimonio visual de que la IA es mucho más que generación de texto o imágenes. Es la transición de herramientas específicas a una meta-herramienta científica.

Demis Hassabis cierra con una reflexión que pone la piel de gallina y define la era en la que estamos entrando:

"Quería resolver la inteligencia para usarla como la herramienta definitiva para resolver todos los problemas científicos más complejos del mundo... creo que es más grande que internet, más grande que el móvil, es más parecido a la llegada de la electricidad o el fuego." [1]

Si tienes oportunidad de ver el documental, hazlo. No es solo historia de la computación; es el prólogo de nuestro futuro inmediato. Aquí te lo dejo:

Video en Youtube


Referencias y Enlaces de Interés

Top comments (0)