DeepSeek: David contra Goliat

Opinion Jorge Bravo

El Economista Jorge Bravo

La irrupción de DeepSeek, una startup china de Inteligencia Artificial (IA) y un nuevo modelo de lenguaje fundada en 2023 por Liang Wenfeng y financiada por High-Flyer, llegó para diferenciar y estresar aún más la vertiginosa carrera por el dominio y la hegemonía de esta tecnología en el mundo tecnológico. 

Su lanzamiento en enero de 2025 fue visto como un desafío a los gigantes de la IA como OpenAI y Google, ambos estadounidenses, aunque en realidad China viene desarrollando desde mucho tiempo atrás una visión estratégica e industrial de la Inteligencia Artificial al más alto nivel político y tecnológico.

No debe sorprender el lanzamiento de DeepSeek ni el surgimiento de nuevos modelos de IA incluso superiores en cuanto a características y desempeño, porque China quiere ser líder en IA. Lo cierto es que DeepSeek refuerza la geopolítica de la Inteligencia Artificial y abre un nuevo capítulo en la competencia entre Occidente y China por el dominio digital.

Lo que más llamó la atención de DeepSeek fue que la innovación no requiere presupuestos estratosféricos. Mientras entrenar modelos como GPT-4 de OpenAI ha requerido de más de 100 millones de dólares, DeepSeek-V3 se desarrolló con sólo 6 mdd. Para ello utilizó semiconductores NVIDIA H800, optimizados para superar las restricciones estadounidenses, porque existe la prohibición de vender chips avanzados y tecnología de EE.UU. a empresas chinas.

Otro aspecto llamativo de DeepSeek es su arquitectura con 671 mil millones de parámetros de búsqueda, pero sorprendió que sólo utiliza 37 mil millones por consulta, lo cual reduce el consumo de memoria, hardware y energía. Esta eficiencia tecnológica significa que permite operar con GPUs convencionales, lo cual se ha interpretado como una forma de democratizar el acceso a la IA. Su sistema “multi-token” procesa frases completas en lugar de palabras individuales; esto acelera el análisis de datos sin sacrificar precisión.

El conjunto de estas innovaciones provocaron caídas bursátiles de empresas como NVIDIA y Oracle y un retroceso de 3% en el índice de empresas tecnológicas Nasdaq 100. Es decir, el mercado interpretó que DeepSeek y su tecnología tienen un impacto disruptivo sobre diversos proveedores y competidores.

¿Qué distingue DeepSeek de otros modelos como ChatGPT? La competencia entre ambos refleja filosofías opuestas. La principal es el costo y accesibilidad, pues DeepSeek es gratuito y de código abierto, con un costo de 2.19 dólares por millón de tokens, frente a 60 de ChatGPT. En cuanto a diseño y arquitectura, mientras ChatGPT usa un modelo de 1.8 billones de parámetros, DeepSeek prioriza la especialización y la eficiencia.

En el mundo de las aplicaciones, ChatGPT es poderoso en creatividad y multimodalidad (texto e imágenes), mientras DeepSeek destaca en tareas técnicas y análisis estructurados.

Desde luego, no se pueden omitir los sesgos algorítmicos: DeepSeek evita temas sensibles para China (Taiwán o derechos humanos), mientras ChatGPT ofrece respuestas más neutrales. Otra ventaja de DeepSeek es que China tiene desde hace tiempo un sistema regulatorio propiciatorio de la innovación y acceso a datos masivos en su propio mercado, lo cual le permite acelerar su desarrollo. En cambio, las empresas en EE.UU han hecho inversiones multimillonarias como capital de despegue de sus IAs.

Estoy convencido de que después del impacto inicial de DeepSeek en los mercados financieros, en la opinión especializada y en los medios, la empresa requerirá rondas de inversión que le permitan expandirse, construir alianzas y librar los primeros desafíos regulatorios en diversos territorios, resultado de la geopolítica digital.

En términos de competencia, la aparición de DeepSeek beneficia a empresas y usuarios al reducir costos de implementación de IA, personalización gracias a su código abierto y competencia al evitar oligopolios tecnológicos.

Sin embargo, su modelo conlleva riesgos de privacidad porque almacena datos en servidores chinos, sujetos a leyes locales, lo cual genera temores de ciberespionaje. También tiene sesgos algorítmicos, porque el entrenamiento del modelo con datos masivos predominantemente chinos limita su neutralidad en temas globales. Para mitigar estos cuestionamientos, DeepSeek ya ofrece una versión con datos alojados en Estados Unidos, estrategia similar a la fallida de TikTok para evitar prohibiciones.

El futuro de DeepSeek y de cualquier otro modelo de IA Generativa depende de su capacidad para establecer alianzas globales. Empresas como Meta y Apple ya elogiaron su enfoque de código abierto, y su integración en plataformas occidentales podría acelerar y consolidar su adopción. Además, su modelo de negocio —gratuito y escalable— convertiría la IA en una commodity y acelerar su implementación masiva en industrias como finanzas, salud y logística, las que principalmente se han interesado en una adopción temprana de la IA.

DeepSeek surge como un avance técnico en los modelos de Inteligencia Artificial Generativa y como un desafío tecnológico, operativo y de eficiencia para sus adversarios de EE.UU. Pero lo que hizo para cimbrar los índices bursátiles y que estemos hablando de DeepSeek es su impacto simbólico: la innovación puede emerger en contextos limitados, las estrategias de IA se pueden cuestionar y replantear y aún así desafiar a gigantes tecnológicos. Similar a la enseñanza de David contra Goliat.

DeepSeek es un ejemplo de que la geoestrategia tecnoindustrial china tiene resultados si combina innovación, colaboración y paciencia. Lo importante no es llegar primero sino saber llegar y en esta nueva carrera, la colaboración —más que la confrontación— define el liderazgo tecnológico.

Adicionar aos favoritos o Link permanente.