La semana pasada Donald Trump presentó Stargate, un megaproyecto con el que Estados Unidos pretende invertir 500.000 millones de dólares en una infraestructura de inteligencia artificial (IA). La iniciativa está pensada para generar unos 100.000 empleos y reforzar la seguridad nacional del país americano. Pero, sobre todo, para consolidar el liderato del EE.UU. en este sector y aplacar a China, su gran rival en la carrera mundial por la IA.

Sin embargo, una semana después del anuncio de Trump todo el mundo está hablado de R1, el nuevo modelo de la empresa china DeepSeek que rivaliza con el archiconocido ChatGPT y ha provocado un auténtico terremoto en la bolsa. Y aunque aún es muy pronto, los expertos coinciden en señalar que sí podemos estar ante un avance importante (algo que ya es mucho decir dentro de un sector donde todo sucede tan rápido), hasta el punto de que el hasta ahora imparable monopolio estadounidense podría estar amenazado. Hay tres cuestiones fundamentales que lo explican.

Las tres ventajas de DeepSeek

En primer lugar, lo que más llama la atención de DeepSeek es su rendimiento. "Ha conseguido niveles de competencia similares a las habilidades del modelo GPT 4o1 de OpenAI en matemáticas, programación o razonamiento, pero con un coste un 90-95% inferior al del modelo de OpenAI, de solo 5,6 millones de dólares. Una cifra insignificante en comparación con las inversiones realizadas por los gigantes americanos. Es para reflexionar que una iniciativa pequeña, liderada por una persona como es Liang Wengfeng, y con un equipo compuesto principalmente de graduados jóvenes de universidades chinas haya conseguido algo así", comenta Nuria Oliver, doctora por el Instituto Tecnológico de Massachusetts (MIT) y directora científica y cofundadora de la fundación ELLIS Alicante.

Lo cierto es que DeepSeek es una start-up fundada hace apenas dos años para investigar la Inteligencia Artificial General. Wengfeng, su creador, afirmó en su momento que había contratado a jóvenes investigadores informáticos para "resolver las preguntas más difíciles del mundo", persiguiendo razones más científicas que empresariales. Detrás de esta compañía está el fondo de cobertura High-Flyer Quant, fundado en 2015, que a finales del 2024 ya provocó una guerra de precios dentro de la  industria de inteligencia artificial china después de lanzar algunos modelos, según Time.

Siguiendo con las ventajas, en segundo lugar la IA china es de código abierto, al contrario que la mayoría de grandes modelos estadounidenses. "Cualquiera puede ver cómo funciona la herramienta y estudiarla. Y la puedes entrenar en casa", explica Antonio Fernandes, hacker experto en ciberseguridad. "Esto permite que los programadores libres puedan experimentar con ella, lo que hace que detecten sus fallos y que la herramienta evolucione más rápido. Hay múltiples ejemplos de esto, como Linux, que también es de código abierto", añade.

Pero en paralelo, esto también significa que los ingenieros de empresas rivales pueden analizar el código de DeepSeek e incluso incorporarlo: "Si se demuestra que efectivamente es más eficiente, pueden aprovecharse de eso. Y si compañías como OpenAI implementan esas mejoras en sus chips, que son mucho más potentes que los que utilizan los chinos, los estadounidenses pueden volver a tomar ventaja. A lo mejor resulta incluso que Stargate no será necesario, porque no hará falta crear centros de datos tan monstruosos", valora Ramón López de Mántaras, experto en IA del CSIC.

En cualquier caso, y este es el tercer punto importante, los chinos han logrado crear un modelo a la altura de los mejores utilizando un hardware peor, precisamente obligados por EE.UU. Tal y cómo relata López de Mántaras, para entrenar a DeepSeek han usado chips de Nvidia H800, que no son ni de lejos los más potentes: "EEUU no vende a China los chips más nuevos con la excusa de proteger su seguridad nacional. Aunque de momento les está saliendo el tiro por la culata, porque parece que con eso han conseguido que los chinos agudicen el ingenio".

"Los chinos han hecho de la necesidad virtud y, frente a las restricciones de chips de alto rendimiento, impuestas precisamente por EEUU con el objetivo de 'cortarles las alas', han demostrado que se puede desarrollar un modelo de IA como DeepSeek. Creo que terminar con el monopolio de algo es bueno para los usuarios. Porque hasta ahora teníamos un monopolio no tanto de una empresa como de un país, en cuanto a productos de IA que, además, se entregan como una caja negra que nadie sabe qué contiene", sostiene Coral Calero, catedrática de lenguajes y sistemas informáticos y miembro del Comité Español de Ética de la Investigación.

El verdadero impacto de DeepSeek en la IA

Miguel Ángel Román, cofundador del Instituto de Inteligencia Artificial, resume qué significa realmente para el sector la llegada de la herramienta china: "La irrupción de DeepSeek es algo que tarde o temprano iba a ocurrir, porque esto es lo que pasa siempre con tecnología. Primero surge una solución y luego aparecen optimizaciones y mejoras de eficiencia que hacen que con menos coste computacional, económico, etcétera, se pueda llegar a los mismos resultados. DeepSeek permite llegar al mismo sitio con menos recursos. Así que no es una burbuja, pero tampoco un modelo de referencia, porque al final todo el mundo llegará al mismo punto".

"Desde el punto de vista científico no es muy interesante. Pero su algoritmo sí es lo es, porque ha dado resultados muy buenos en la segunda fase del entrenamiento, la de 'refinamiento', y es más eficiente", afirma López de Mántaras, que recuerda que DeepSeek tiene unos 670 mil millones de parámetros, un número también comparable al de otros grandes modelos. "No tengo por qué dudar de los resultados de su rendimiento, parecen fiables, aunque harían falta más análisis de investigadores independientes. En cualquier caso, parece que hay alguien más esta carrera en la que parecía que todo era un monopolio de EE.UU. Es muy pronto, así que está por ver si se extiende tanto como ChatGPT o es solo la novedad, aunque DeepSeek es totalmente gratis", señala.

"No es un rival comercial de Open AI porque es de código abierto. Pero por supuesto tener un competidor de calidad similar que es gratis les afectará muchísimo, pues deberán bajar los precios. Y aunque en muchos aspectos han copiado ideas, en otros han tenido que innovar para vencer las restricciones impuestas desde Estados Unidos", explica Ricardo Baeza-Yates, director de Investigación en el Instituto de IA Experiencial de Northeastern University (Boston, EE.UU.).

Sin embargo, la herramienta tiene también aspectos negativos, y apenas hay información sobre algunos aspectos clave de su desarrollo. DeepSeek se rige por las leyes chinas, lo que significa que algunos asuntos como temas geopolíticos relacionados con el régimen están, directamente, censurados. Por supuesto, habrá que valorar también qué nivel de sesgo presenta la herramienta. Y según Calero, todavía no hay muchos datos sobre el coste medioambiental de su entrenamiento y desarrollo.

El futuro de las compañías estadounidenses

La otra lectura que muchos estaban haciendo este lunes es que la industria de la IA que conocíamos había poco menos que colapsado. Y es que muchas empresas del sector habían registrado pérdidas bestiales en bolsa. Aunque ninguna como la de Nvidia, la firma estadounidense que suministra a todas las grandes compañías tecnológicas los chips necesarios para desarrollar los modelos de aprendizaje profundo de IA más potentes, como ChatGPT.

En los últimos meses Nvidia no había parado de crecer hasta convertirse en la compañía más valiosa del mundo, con una capitalización de unos 3,5 billones de dólares. Aunque algunas voces siempre aseguraron que su éxito era una burbuja que tarde o temprano estallaría. Este lunes, después del terremoto provocado por DeepSeek, Nvidia cayó más de un 17% en bolsa, la bajada más grande de la historia. De un plumazo, 600.000 millones se esfumaron. Así que es inevitable hacerse preguntas.

"Mi opinión sigue siendo la misma: dije que lo mejor de la fiesta ya lo habíamos visto, pero que no por eso Nvidia era burbuja. Mientras siga teniendo los mejores ingenieros, seguirá siendo una empresa valiosa. Lo de hoy es una sobrerreacción de los mercados, lo hacen tanto para arriba como para abajo, pero las ventas siempre son más violentas que las compras. La bolsa sube por las escaleras y baja por el ascensor", asegura Manuel Ujaldón, catedrático en el área de Arquitectura de Computadores en la Universidad de Málaga y embajador de Nvidia en España.

En ese sentido, Ujaldón recalca que "las buenas empresas dan pocas oportunidades de compra, así que las que dan, hay que aprovecharlas". "Yo en un día como hoy, lo último que hago es vender Nvidia, porque tienes más probabilidades de equivocarte vendiendo que comprando. La volatilidad estaba clara, pero las buenas empresas siempre se recuperan de las caídas. Y Nvidia es la mejor empresa que yo he conocido. Si te gusta el fútbol, pues como Messi", desliza.

Román lo ve parecido: "Las caídas en bolsa responden a los vaivenes emocionales que hay en torno a toda toda la tecnología, y en concreto alrededor de la inteligencia artificial. No creo que respondan a algo racional, puesto que el coste computacional siempre va a ir en aumento, independientemente de que haya técnicas de optimización. Lo que permiten las técnicas de optimización es llevar la computación a más personas, no reducir las necesidades computacionales. Así que creo que esto va a ser algo temporal debido a las noticias sobre DeepSeek, pero no creo que las necesidades computacionales bajen hasta el punto de que estas empresas pierdan valor".

"Las caídas en bolsa han sido muy sensacionalistas, creo que es algo provisional y en cierta medidas las empresas que han bajado se recuperarán. DeepSeek ha necesitado menos recursos que el resto de modelos comerciales, pero vamos a necesitar muchos medios computacionales en el futuro para desarrollar la IA, más allá de que se puedan crear modelos más pequeños que den respuestas más concretas y no necesiten tanta inversión. Aún así, sigo pensando que EE.UU está por encima y que ChatGPT sigue siendo el elemento diferenciador", destaca Alfonso Ureña, doctor en informática y catedrático de Lenguajes y Sistemas Informáticos. 

Mientras tanto, está por ver cuál será la respuesta de EE.UU o de alguna de sus compañías punteras. Por lo pronto, parece que OpenAI pondrá en breve a disposición de los usuarios su nuevo modelo de razonamiento o3, centrado en tareas más complejas, que podría suponer un nuevo salto. Un modelo, por cierto, que cambió de nombre por 'culpa' de Telefónica.