Hace unas semanas, concretamente el 14 de enero, en este espacio escribí sobre el error que estaba cometiendo el gobierno de EU al limitar el acceso a la Inteligencia Artificial (IA) a varios países del mundo. Por esos días, el gobierno falleciente de Joe Biden publicó una nueva Norma Final Provisional sobre la Difusión de la Inteligencia Artificial, la cual mantenía a China y Rusia como los malos de la película y que no deberían tener acceso al poder de cómputo para generar IA.
Cerré dicho comentario diciendo que solo sería cuestión de tiempo para copiar esa tecnología (la IA), y hasta mejorarla. Solo pasaron dos semanas desde entonces para que se presentara la versión china de una IA Generativa muy similar y, hasta en algunos rubros, más poderosa que el famoso ChatGPT de OpenAI.
Por si no lo sabes, esta IA china se llama DeepSeek y lo más impactante es que no solo es más poderosa, sino mucho más barata y de código abierto. DeepSeek se lanzó el 20 de enero en la tienda de aplicaciones de Apple y en unos cuantos días se convirtió en la que tuvo mayor número de descargas.
La comprobación de que DeepSeek tiene el mismo o mejor desempeño que ChatGPT no solo desató el pánico de cientos de inversionistas y dueños de empresas tecnológicas que ven crecer la posibilidad de estar frente a la temida burbuja especulativa de la IA; también es una profunda bofetada (Deepslap) a la soberbia y sobreestimado dominio de EU en el manejo de la Inteligencia Artificial.
Por otro lado, y para mi tristeza, mi tío Jen-Hsun Huang, CEO de Nvidia, debe estar muy preocupado por haberse enterado también que sus potentes tarjetas gráficas no fueron necesarias para crear DeepSeek. El valor de las acciones de Nvidia se desplomó ayer casi 17%.
El mercado ahora cuestiona si las grandes tecnológicas estadounidenses han desaprovechado los productos de Nvidia en el desarrollo de sus modelos de IA, ya que una empresa extranjera logró avances significativos con una inversión mucho menor. Al mismo tiempo, surge la preocupación de que la demanda de chips de Nvidia sea inferior a lo estimado, lo que afectaría negativamente las finanzas de la compañía.
La empresa china afirmó haber utilizado cerca de 2 mil chips H800 de Nvidia para lanzar su modelo de razonamiento de código abierto, conocido como R1. Estos chips, aunque menos avanzados que los empleados por las firmas estadounidenses, cumplen con las restricciones de exportación impuestas por Estados Unidos en 2022.
Otra maravilla de DeepSeek es que comienza a diseñar un nuevo modelo de desarrollo de mayores capacidades para la IA. DeepSeek-R1, la versión más reciente de esta IA rompe con las convenciones. A diferencia del tradicional Ajuste Fino Supervisado (SFT), DeepSeek emplea un enfoque basado en Aprendizaje por Refuerzo (RL), que permite que el modelo aprenda y se mejore a sí mismo. En palabras sencillas, se trata de un sistema que “razona” de manera autónoma y se optimiza en tiempo real, eliminando la necesidad de procesos de entrenamiento prolongados y costosos. Se reentrena a sí misma.
Los analistas coinciden en que este cambio de paradigma fue forzado por las restricciones impuestas por Estados Unidos a la exportación de tecnología avanzada. Estas limitaciones obligaron a las empresas chinas a innovar y repensar cómo entrenar a la IA. El resultado fue un modelo disruptivo que amenaza con redefinir las reglas del juego.
Elon Musk, CEO de Tesla, y Alexandr Wang, fundador de Scale AI, han especulado que DeepSeek podría estar operando con un número de GPUs mucho mayor al declarado oficialmente, desafiando las regulaciones estadounidenses. Musk ha sugerido que DeepSeek, podría poseer alrededor de 50 mil GPU Hopper de NVIDIA. Esto se opone a las 10 mil A100 que DeepSeek afirma tener. Wang también afirmó que DeepSeek probablemente disponga de unas 50 mil NVIDIA H100, pero ambos creen que DeepSeek no puede revelar el número real de GPU debido a los controles de exportación estadounidenses actualmente en vigor.
Nvidia dijo en un comunicado que el éxito de DeepSeek demuestra la utilidad de sus unidades de procesamiento gráfico (GPU) y que se necesitarán más para dar respuesta al crecimiento del grupo chino. “El trabajo de DeepSeek ilustra cómo se pueden crear nuevos modelos utilizando esa técnica, aprovechando modelos ampliamente disponibles y capacidades de computación que cumplen completamente con las regulaciones de control de exportaciones”, agregó Nvidia en su nota de prensa, que además califica de “excelente” el avance logrado por la empresa china.
Nvidia insiste en que el avance de DeepSeek es una oportunidad para demostrar el potencial de sus tecnologías. Pero más allá de los comunicados optimistas, el mensaje es claro: las restricciones impuestas por Estados Unidos no sólo fracasaron, sino que aceleraron el desarrollo de una competencia formidable. Nvidia nos confirma que las restricciones comerciales de EU a China en materia de IA solo sirvieron para que, en menos tiempo y con menos dinero, un startup chino como DeepSeek haya superado a los grandes y millonarios consorcios estadounidenses.