En los últimos meses, la inteligencia artificial china DeepSeek ha irrumpido con fuerza en el mercado, generando importantes pérdidas económicas para gigantes tecnológicos como OpenAI, NVIDIA y Microsoft. Con un rendimiento superior y una eficiencia sin precedentes, este modelo de lenguaje está marcando un nuevo estándar en el sector.
Los orígenes de DeepSeek: una historia de adaptación e innovación
El origen de DeepSeek se remonta a 2015, cuando tres ingenieros de la Universidad de Zhejiang fundaron High-Flyer, una empresa dedicada al trading cuantitativo. Nacida en un contexto económico adverso tras la crisis financiera de 2008, la compañía comenzó enfocándose en modelos estadísticos para identificar oportunidades de inversión.
El verdadero punto de inflexión llegó en 2019, cuando High-Flyer decidió incursionar en el aprendizaje automático, convirtiéndose en un fondo de cobertura basado en algoritmos de inteligencia artificial. Este cambio estratégico motivó la construcción de sus primeras supercomputadoras, conocidas como Fire-Flyer, una de las cuales albergaba más de 10.000 GPU NVIDIA A100 adquiridas antes de las restricciones comerciales impuestas por Estados Unidos a China.
Evolución y éxito de DeepSeek
En noviembre de 2023, High-Flyer lanzó la primera versión de DeepSeek, un modelo de código abierto con 67.000 millones de parámetros. Aunque se destacó por su rendimiento en matemáticas y programación, su eficiencia computacional era limitada.
Seis meses después, la compañía presentó una segunda versión más eficiente y económica, lo que generó un gran impacto en el mercado, llevando a competidores como Alibaba y Baidu a ajustar sus precios o ofrecer sus modelos sin coste.
Finalmente, en diciembre de 2024, DeepSeek lanzó su tercera versión con una arquitectura innovadora que requería menos recursos para entrenarse. Según el South China Morning Post, DeepSeek V3 consumió 2.780 millones de horas de entrenamiento utilizando tarjetas H800, en comparación con las 30.800 millones de horas necesarias para Llama 3.1 de Meta.
El éxito impulsado por las restricciones
Las sanciones de Estados Unidos y la escasez de tecnología de semiconductores obligaron a DeepSeek a reinventar su arquitectura. “Las limitaciones de recursos te obligan a reinventarte de maneras espectaculares”, afirmó Jim Fan, investigador senior de NVIDIA. Andrej Karpathy, cofundador de OpenAI, también destacó que la competencia en el mundo de la IA impulsa avances notables.
El rol del gobierno chino y las preocupaciones de seguridad
El éxito de DeepSeek no ha estado exento de polémicas. Reportes señalan que Liang Wenfeng, CEO de High-Flyer, mantiene vínculos estrechos con el Partido Comunista Chino y que el desarrollo del modelo habría contado con apoyo estatal. Expertos en seguridad advierten que DeepSeek podría ser usado para identificar vulnerabilidades en sistemas de países enemigos o llevar a cabo campañas de desinformación.
Pese a las críticas, DeepSeek ha demostrado que las limitaciones pueden ser una oportunidad para la innovación, posicionándose como un competidor clave en la carrera global por el dominio de la inteligencia artificial.