DeepSeek lanzó una nueva actualización de su modelo: ¿cuáles son las mejoras que incluye?
La startup china presentó una versión mejorada de su modelo de inteligencia artificial, con avances en razonamiento, programación y escritura.

Esta semana, la startup china DeepSeek anunció una nueva versión de su modelo de lenguaje, con mejoras importantes respecto de la anterior. El anuncio refuerza la competencia con OpenAI y otras empresas estadounidenses de inteligencia artificial, después de haber sacudido el mercado global de acciones tecnológicas con una versión previa de su tecnología.

La compañía lanzó la actualización de su modelo V3, llamado DeepSeek-V3-0324, en la plataforma de desarrollo de IA Hugging Face. Según la startup, la nueva versión mejora la capacidad para razonar y programar, en comparación con su predecesora.

El modelo V3 original de DeepSeek se presentó el 26 de diciembre de 2024 y, según la empresa, era tres veces más rápido que la versión V2. Además, logró entrar entre los diez primeros puestos del ranking Chatbot Arena, un indicador de desempeño en inteligencia artificial que gestiona la Universidad de California en Berkeley.

 

La nueva actualización incluye mejoras en diversos test de referencia, además de optimizaciones en desarrollo web, escritura en chino (con funciones como "reescritura interactiva") y capacidades avanzadas de búsqueda en ese idioma, como "análisis mejorado de informes".

 

El impacto de DeepSeek en los mercados

 

Uno de los puntos a seguir es el impacto que el nuevo modelo de DeepSeek podría tener en las acciones tecnológicas de Estados Unidos.

En la jornada del martes, los papeles de Nvidia bajaron un 1,2%, mientras que otras compañías como Broadcom (-0,6%) y Tesla (-0,3%) también registraron leves caídas. En cambio, Apple (+0,3%), Meta (+0,7%) y Microsoft (+0,3%) mostraron una tendencia alcista en el inicio de la rueda bursátil.

 

 

¿Qué es DeepSeek?

 

DeepSeek es una startup de inteligencia artificial fundada en 2023 por el emprendedor chino Liang Wenfeng. En 2021, Liang comenzó a acumular miles de procesadores gráficos de Nvidia para un proyecto de IA cuyo objetivo no fue revelado en ese momento. Sin embargo, poco después, la administración de Joe Biden restringió la venta de esos chips a China.

El empresario llamó a su país a "transicionar gradualmente hacia un papel más activo en la industria de IA", en lugar de seguir "dependiendo de los demás". 

Según DeepSeek, sus productos son más eficientes y requieren menos costos de entrenamiento y desarrollo en comparación con los de OpenAI y Meta. La compañía estima que uno de sus modelos más recientes costó alrededor de 5,6 millones de dólares, una cifra muy inferior a los entre 100 millones y 1.000 millones de dólares que, según ejecutivos del sector, demandaría el desarrollo de modelos similares en Estados Unidos.

 

 

¿Puede DeepSeek ser prohibida en Estados Unidos?

 

En febrero, un grupo de legisladores demócratas y republicanos presentó un proyecto de ley para prohibir el uso de DeepSeek en dispositivos gubernamentales, después de que un informe vinculó su chatbot con una empresa de telecomunicaciones estatal china que ya fue sancionada. Aún no está claro si el proyecto de ley conseguirá respaldo suficiente.

Por otro lado, la administración de Donald Trump también evalúa una prohibición por cuestiones de seguridad nacional, según informó una fuente a Reuters

Algunas agencias estadounidenses, como la Armada, el Departamento de Defensa, el Departamento de Comercio y la NASA, ya restringieron su uso. Además, la oficina del Jefe de Administración de la Cámara de Representantes advirtió que "actores maliciosos ya están explotando DeepSeek para distribuir software malicioso e infectar dispositivos", motivo por el cual algunas oficinas legislativas fueron alertadas de no utilizarlo.

 

 

La carrera por liderar los avances de IA 

 

En enero, DeepSeek lanzó su modelo avanzado de razonamiento R1, lo que pareció poner a China en una posición competitiva frente a OpenAI y Meta, de Estados Unidos. Según la empresa, el R1 alcanzó un rendimiento comparable al modelo o1 de OpenAI en varias pruebas de referencia e incluso lo superó en el test MATH-500.

R1 está disponible en formato de código abierto, lo que permite a cualquier usuario acceder, modificar y compartirlo. Su lanzamiento generó un fuerte impacto en el mercado, llegando a posicionarse en los primeros puestos de descargas en iPhone, por encima de ChatGPT de OpenAI.

El debut de R1 también sacudió a las empresas tecnológicas en Wall Street: el 27 de enero, Nvidia cerró con una caída del 17%, lo que implicó una pérdida de 589.000 millones de dólares en su capitalización de mercado, la mayor baja en un solo día en la historia de una compañía pública.

 

El propio CEO de OpenAI, Sam Altman, reconoció la calidad del producto y afirmó que el modelo R1 era "Impresionante, particularmente por lo que DeepSeek es capaz de ofrecer por su precio".

Nota publicada en Forbes US.