CluPad

DeepSeek es el ‘Sputnik’ que ha sacudido Wall Street y desatado la paranoia tecnológica

enero 30, 2025 CluPad por Carlos Guadián

Creo que el asunto DeepSeek es digno de análisis y muestra de ello es que no solo internet, sino también todo tipo de medios han dedicado parte de sus recursos a hacerse eco de lo que está pasando con esta empresa China.

Ya hace un tiempo que podíamos identificar pistas de por dónde podía ir la cosa, aunque (que yo sepa) nadie había podido suponer que el lanzamiento del modelo R1 de DeepSeek iba a tener el impacto que ha tenido.

CluPad es una publicación que cuenta con el respaldo de los lectores. Para recibir nuevos posts y apoyar mi trabajo, considera convertirte en un suscriptor gratis o de pago.

Suscríbete a CluPad

He querido tirar de mi base de datos (info que acumulo a base de procesar más de 40 newsletters sobre IA) y pasarla por GPT para obtener alguna información al respecto, además de pedirle algunas respuestas buscando info en Internet.

Espero que la “conversación” os resulte tan interesante como a mi.

Índice de contenidos

Un breve timeline de DeepSeek

Con la información que te proporciono sobre DeepSeek, haz un recorrido temporal de su evolución.

La evolución de DeepSeek: De promesa tecnológica a fenómeno global

La historia de DeepSeek es una prueba de cómo la inteligencia artificial en China ha alcanzado un nivel de desarrollo que compite directamente con los gigantes tecnológicos de Occidente. A continuación, un recorrido temporal de su evolución y el impacto que ha generado en la industria de la IA.

📌 Noviembre 2024: Primeros indicios de un nuevo competidor

21/11: DeepSeek lanza R1-Lite-Preview, un modelo de razonamiento que compite con los mejores LLM de OpenAI. Utiliza razonamiento encadenado y permite observar su proceso de pensamiento en tiempo real.
22/11: Se destaca que el modelo de DeepSeek ha sido entrenado con aprendizaje por refuerzo, lo que lo convierte en una alternativa poderosa a pesar de las restricciones tecnológicas en China.

📌 Diciembre 2024: Expansión en capacidades y primeros anuncios disruptivos

03/12: DeepSeek R1-Lite-Preview mejora en razonamiento lógico y alcanza un rendimiento comparable al de OpenAI.
12/12: Se lanza el modelo mejorado DeepSeek-V2.5-1210, junto con una herramienta de búsqueda en tiempo real.
19/12: Presentación del modelo DeepSeek-VL2, enfocado en procesamiento multimodal para tareas como el reconocimiento óptico de caracteres (OCR) y preguntas visuales.
27/12: Lanzamiento de DeepSeek-V3, un modelo de 671 mil millones de parámetros que supera en benchmarks a Llama 3.1 y GPT-4.

📌 Enero 2025: El gran salto al escenario global

🚀 Primera ola de disrupción (Principios de enero)

02/01: DeepSeek supera a OpenAI en benchmarks de razonamiento, provocando un ajuste de precios en el mercado de IA.
21/01: Lanzamiento de DeepSeek-R1, que ofrece rendimiento comparable al modelo O1 de OpenAI, pero a costos significativamente menores. Utiliza 671 mil millones de parámetros y ofrece versiones más ligeras para dispositivos con hardware limitado.
24/01: DeepSeek anuncia modelos más accesibles, incluso para dispositivos como Raspberry Pi, democratizando el acceso a la IA avanzada.

📉 Impacto económico y reacciones en el mercado (Mediados de enero)

28/01: Lanzamiento de Janus Pro 7B, un modelo multimodal diseñado para comprensión y generación de imágenes, superando a DALL-E 3.
29/01: La aplicación DeepSeek Chatbot se convierte en la app gratuita más descargada en la App Store de iOS en EE. UU., aumentando su adopción global.
29/01: Se revela que DeepSeek entrenó su modelo usando solo 2,000 GPUs, en contraste con las 16,000 GPUs necesarias para modelos de OpenAI, demostrando una eficiencia sin precedentes en el entrenamiento de IA.

📌 Reacciones y consecuencias en la industria

💸 Impacto en el mercado financiero

29/01: Las acciones de Nvidia caen un 18% tras el auge de DeepSeek, lo que refleja la intensa competencia en el sector de IA y hardware.
29/01: OpenAI, Microsoft y Google reaccionan a la irrupción de DeepSeek. Sam Altman, CEO de OpenAI, minimiza el impacto, asegurando que su empresa lanzará modelos aún más potentes en el futuro.

🔍 Seguridad, censura y controversias

29/01: DeepSeek sufre una serie de ciberataques, lo que lo obliga a limitar los nuevos registros.
29/01: Preocupaciones sobre censura en el modelo y restricciones en temas políticamente sensibles.
29/01: Se revelan preocupaciones sobre la privacidad: DeepSeek recopila datos de usuario como direcciones IP y patrones de pulsación, lo que provoca un escrutinio del gobierno de EE. UU.

⚔️ Competencia global y estrategias de respuesta

29/01: Hugging Face anuncia el desarrollo de Open-R1, una versión de código abierto inspirada en DeepSeek.
29/01: Meta crea equipos de análisis (‘war rooms’) para comprender la estrategia detrás del éxito de DeepSeek y cómo ha logrado reducir drásticamente costos de entrenamiento.
29/01: Microsoft y OpenAI investigan si DeepSeek utilizó técnicas de “distillation” para entrenar su modelo aprovechando recursos de OpenAI, lo que podría haber violado términos de servicio.

📌 ¿Hacia dónde va DeepSeek?

El ascenso de DeepSeek ha demostrado que China no necesita acceso a los chips más avanzados de EE. UU. para competir en el campo de la IA. Su estrategia basada en eficiencia de hardware, modelos accesibles y código abierto ha provocado:

Una crisis en Nvidia y otras empresas de chips.
Una respuesta urgente de OpenAI, Google y Meta para mantener su liderazgo en IA.
Preocupaciones de seguridad y privacidad, lo que ha llevado a restricciones en el uso de DeepSeek en algunos países.

La pregunta clave es si DeepSeek podrá mantener su crecimiento y expandirse a nivel global sin las mismas restricciones de censura que han afectado a otras tecnologías chinas. Sin duda, estamos ante el mayor punto de inflexión en la inteligencia artificial desde la creación de ChatGPT.

DeepSeek es lo que es gracias a la prohibición de EE.UU.

Tiene que ver la prohibición de EE. UU. de poder acceder a procesadores en esta evolución?

Sí, la prohibición de Estados Unidos que limita el acceso de China a procesadores avanzados ha influido en la evolución de la inteligencia artificial en China. Estas restricciones han impulsado a empresas chinas, como DeepSeek, a innovar y desarrollar soluciones de IA utilizando chips menos potentes y más asequibles. Este enfoque ha permitido a DeepSeek crear modelos de IA eficientes sin depender de hardware costoso, desafiando así el dominio de empresas estadounidenses que se basan en tecnologías avanzadas para la IA. (El País)

TE PUEDE INTERESAR: IA para ricos y pobres: ¿Cómo afecta la brecha digital?

Además, la aparición de DeepSeek ha generado un impacto significativo en el mercado tecnológico global, afectando a empresas como Nvidia, líder en la fabricación de chips para IA, que ha experimentado una caída notable en el valor de sus acciones. (Cadena SER)

En resumen, las restricciones impuestas por Estados Unidos han acelerado la innovación en China, llevando al desarrollo de alternativas más económicas y eficientes en el campo de la inteligencia artificial. (El País)

¿Es DeepSeek un momento Sputnik para el desarrollo de la IA?

¿Puede suponer el lanzamiento de R1 de DeepSeek un momento Sputnik para la IA a nivel global?

El lanzamiento del modelo R1 de DeepSeek ha sido comparado con un “momento Sputnik” para la inteligencia artificial a nivel global. Este término se refiere a un evento que marca un punto de inflexión significativo en una competencia tecnológica, evocando el lanzamiento del satélite Sputnik por la Unión Soviética en 1957, que sorprendió al mundo y aceleró la carrera espacial. En este contexto, el modelo R1 de DeepSeek ha generado un impacto similar al demostrar que una empresa china puede desarrollar un modelo de IA avanzado y eficiente sin depender de los procesadores más avanzados de Estados Unidos, a pesar de las restricciones impuestas por este país. (theguardian.com)

Este desarrollo ha provocado una reevaluación de la posición de Estados Unidos en el ámbito de la IA y ha generado preocupaciones sobre la eficacia de las sanciones tecnológicas como medio para mantener la ventaja competitiva. Además, ha llevado a una significativa caída en el valor de las acciones de empresas tecnológicas estadounidenses, con pérdidas que superan el billón de dólares en el índice Nasdaq. (theguardian.com)

Por lo tanto, el lanzamiento del R1 de DeepSeek puede considerarse un “momento Sputnik” para la IA, ya que ha alterado las percepciones sobre el liderazgo tecnológico global y ha subrayado la capacidad de innovación de China en este campo, incluso frente a restricciones significativas.

La censura puede suponer una barrera en la adopción de DeepSeek

Respecto del tema de la censura del modelo R1 de deepseek puede tener problemas por competencia por otros modelos menos “censurados” como Grok

La reciente desregulación propuesta por el presidente Donald Trump en el ámbito de la inteligencia artificial (IA) tiene como objetivo fortalecer la posición de Estados Unidos frente a competidores como China. Al derogar la orden ejecutiva de 2023 de la administración Biden, que imponía restricciones y requería que las empresas compartieran información sobre sus modelos avanzados de IA con el gobierno, Trump busca eliminar barreras que, según él, obstaculizan la innovación en este sector. (AP News)

Además, la administración Trump ha anunciado el proyecto Stargate, una iniciativa que contempla una inversión de hasta 500.000 millones de dólares en infraestructura de IA, con el objetivo de consolidar el liderazgo estadounidense en esta tecnología. (Business Insider)

Sin embargo, esta postura de desregulación ha generado debate. Algunos expertos argumentan que una regulación insuficiente podría conllevar riesgos, como la proliferación de sistemas de IA sin las debidas garantías de seguridad y ética. Por otro lado, defensores de la desregulación sostienen que una menor intervención gubernamental permitirá una mayor competitividad y rapidez en el desarrollo de innovaciones, posicionando a Estados Unidos de manera más efectiva frente a avances como los de la empresa china DeepSeek. (Le Monde.fr)

En resumen, la desregulación propuesta por Trump podría impulsar el posicionamiento de Estados Unidos en el campo de la IA respecto a China, al fomentar un entorno más propicio para la innovación y el desarrollo tecnológico. No obstante, es esencial equilibrar este impulso con consideraciones de seguridad y ética para garantizar un desarrollo responsable de la IA.

DeepSeek no es el fin de NVIDIA

¿Qué cabe esperar respecto de la caída bursátil de empresas como Nvidia por el lanzamiento de DeepSeek?

El reciente lanzamiento del modelo de inteligencia artificial R1 por parte de la empresa china DeepSeek ha tenido un impacto significativo en el mercado bursátil, especialmente en empresas tecnológicas como Nvidia. DeepSeek ha desarrollado un modelo de IA comparable a los líderes del sector con una inversión de aproximadamente 5,6 millones de dólares, lo que ha generado inquietud entre los inversores sobre la sostenibilidad de las elevadas inversiones en infraestructura de IA. (Financial Times)

Como resultado, las acciones de Nvidia experimentaron una caída del 17%, lo que se traduce en una pérdida de capitalización de mercado de casi 600.000 millones de dólares. (infobae)

A pesar de esta reacción inicial, algunos analistas consideran que la innovación de DeepSeek podría ampliar la adopción de la IA y, en última instancia, mantener la demanda de los chips de Nvidia. Además, aunque DeepSeek ha logrado avances significativos, su desarrollo aún depende en gran medida de las GPU de Nvidia. (Financial Times)

En resumen, aunque el lanzamiento de DeepSeek ha provocado una caída notable en el valor de las acciones de Nvidia, la perspectiva a largo plazo para la empresa podría seguir siendo positiva si la demanda de tecnología de IA continúa creciendo.

De momento es imposible (al menos para mi) hablar con DeepSeek

Por último, comentar que hará un par de meses estuve probando RAGflow para generar un chatbot basado en documentación propia. Al trastear un poco con él, vi que utilizaba como LLM un modelo de DeepSeek. Tengo que decir que me gustó los resultados que ofrecía, por lo que lo estuve utilizando en AnythingLLM (actualmente estoy probando Phi4 de Microsoft).

Más allá de esta experiencia, hará un par de días que intenté darme de alta en la web de DeepSeek y no hubo manera. En ese momento, estaba teniendo su prueba de fuego. Una gran avalancha de nuevos usuarios que se querían dar de alta y un ataque DDos que los obliga a tener mucho cuidado en los pasos que dan y no morir de éxito en el primer intento por desbancar a OpenAI.

Pero a día de hoy, a pesar de poder darme de alta y entrar, no consigo ir más allá de obtener respuestas que dicen que los servidores están ocupados.

No es por nada, pero una lección que hace tiempo que tengo muy interiorizada, es que en tecnología hay muy poca fidelidad. En el momento que una aplicación empieza a fallar o a no cubrir las expectativas, los usuarios tardan poco en buscar una alternativa. Con esto quiero decir que o DeepSeek soluciona sus problemas de acceso o no conseguirá quitarle el puesto de IA de cabecera a muchas personas. Otra cosa muy diferente es lo que empresas y organizaciones quieran hacer con los diferentes modelos disponibles en plataformas como Ollama o HuggingFace.

CluPad es una publicación que cuenta con el respaldo de los lectores. Para recibir nuevos posts y apoyar mi trabajo, considera convertirte en un suscriptor gratis o de pago.

Suscríbete a CluPad

Taggs: IA