DeepSeek

DeepSeek
Tipo	negocio y empresa emergente
Industria	tecnologías de la información y la comunicación; inteligencia artificial
Forma legal	empresa privada
Fundación	mayo de 2023
Fundador	Liang Wenfeng
Sede central	Hangzhou (República Popular China)
Propietario	High-Flyer
Sitio web	www.deepseek.com
	[editar datos en Wikidata]

DeepSeek (chino: 深度求索; pinyin: Shēndù Qiúsuǒ; en español: 'Búsqueda Profunda') es una empresa china de inteligencia artificial que desarrolla modelos extensos de lenguaje (LLM) de código abierto. Tiene sede en Hangzhou, Zhejiang, es propiedad y está financiada exclusivamente por el fondo de cobertura chino High-Flyer, cuyo cofundador, Liang Wenfeng, estableció la empresa en 2023 y se desempeña como su director ejecutivo.

El modelo DeepSeek-R1 proporciona respuestas comparables a otros LLM contemporáneos, como GPT-4o y o1 de OpenAI,^[1] a pesar de estar entrenado a un costo significativamente menor (se estima en 6 millones de dólares en comparación con los 100 millones de dólares para GPT-4 de OpenAI en 2023)^[2] y requiere una décima parte de la potencia informática de un LLM comparable.^[2]^[3]^[4]^[5] Los modelos de IA de DeepSeek se desarrollaron en medio de las sanciones de Estados Unidos a China por los chips Nvidia, que tenían como objetivo restringir la capacidad del país para desarrollar sistemas de IA avanzados.^[6]^[7]

El 10 de enero de 2025, DeepSeek lanzó su primera aplicación de bot conversacional gratuita, basada en el modelo DeepSeek-R1, para iOS y Android; para el 27 de enero, DeepSeek-R1 había superado a ChatGPT como la aplicación gratuita más descargada en la App Store (iOS) en los Estados Unidos,^[8] lo que provocó que el precio de las acciones de Nvidia cayera un 18%.^[9]^[10] El éxito de DeepSeek frente a rivales más grandes y establecidos ha sido descrito como «una revolución en la IA»,^[8] constituyendo «el primer intento de lo que está surgiendo como una carrera espacial global en versión IA»,^[11] y marcando el comienzo de «una nueva era de política arriesgada en materia de IA».^[12]

DeepSeek hace que sus algoritmos, modelos y detalles de entrenamiento de inteligencia artificial generativa sean de código abierto, lo que permite que su código esté disponible libremente para su uso, modificación, visualización y diseño de documentos con fines de construcción.^[13] Según se informa, la empresa recluta vigorosamente a jóvenes investigadores de IA de las mejores universidades chinas^[8] y contrata a personas ajenas al campo de la informática para diversificar el conocimiento y las habilidades de sus modelos.^[4]

El bot conversacional de inteligencia artificial de DeepSeek está desarrollado íntegramente por ingenieros de software chinos, mientras que los modelos de inteligencia artificial establecidos en Silicon Valley son creados por personas de diversas nacionalidades, incluidos titulares de visas H-1B de diferentes países que trabajan en Estados Unidos. Los modelos de IA de DeepSeek pueden considerarse un paso significativo hacia el desarrollo de tecnologías autóctonas de alta gama por parte de los países asiáticos, ayudando a retener talentos y reducir la fuga de cerebros de países como India y China.^[14]

Antecedentes

En febrero de 2016, High-Flyer fue cofundada por el entusiasta de la inteligencia artificial (IA) Liang Wenfeng, que había estado operando desde la crisis financiera de 2007-2008 mientras asistía a la Universidad de Zhejiang.^[15] En 2019, estableció High-Flyer como un fondo de cobertura centrado en el desarrollo y uso de algoritmos de negociación de IA. En 2021, High-Flyer utilizó exclusivamente IA en el comercio.^[16]

Según estimaciones de 36Kr, Liang había acumulado un almacén de más de 10.000 chips Nvidia A100 antes de que el gobierno de Estados Unidos impusiera restricciones a los chips de IA en China. Dylan Patel, de la consultora de investigación de IA SemiAnalysis, estima que DeepSeek tenía al menos 50.000 chips.^[15]

En abril de 2023, High-Flyer puso en marcha un laboratorio de inteligencia artificial general dedicado a investigar el desarrollo de herramientas de IA independientes del negocio financiero de High-Flyer.^[17]^[18] En mayo de 2023, con High-Flyer como uno de los inversores, el laboratorio se convirtió en su propia empresa, DeepSeek.^[16]^[19]^[18] Las empresas de capital riesgo se mostraron reacias a proporcionar financiación, ya que era poco probable que pudieran generar una salida (retorno sobre la inversión) en un corto período de tiempo.^[16]

Después de lanzar DeepSeek-V2 en mayo de 2024, que ofrecía un gran rendimiento a un precio bajo, DeepSeek se hizo conocido como el catalizador de la guerra de precios de los modelos de IA de China. Rápidamente se lo denominó el "Pinduoduo de la IA", y otros gigantes tecnológicos importantes como ByteDance, Tencent, Baidu y Alibaba comenzaron a reducir el precio de sus modelos de IA para competir con la empresa. A pesar del bajo precio cobrado por DeepSeek, fue rentable en comparación con sus rivales que estaban perdiendo dinero.^[20]

Hasta el momento, DeepSeek se centra únicamente en la investigación y no tiene planes detallados de comercialización.^[20]

Las preferencias de contratación de DeepSeek se centran en las habilidades técnicas más que en la experiencia laboral al reclutar nuevos empleados, por lo que la mayoría de sus nuevos empleados son estudiantes universitarios recientemente graduados o desarrolladores cuyas carreras en IA están menos establecidas.^[18]

Historial de versiones

DeepSeek LLM

El 2 de noviembre de 2023, DeepSeek presentó su primer modelo, DeepSeek Coder, que está disponible de forma gratuita tanto para investigadores como para usuarios comerciales.^[21] El código del modelo se hizo de código abierto bajo la licencia MIT, con un acuerdo de licencia adicional sobre el "uso posterior abierto y responsable" del modelo en sí.^[22]

El 29 de noviembre de 2023, DeepSeek lanzó DeepSeek LLM^[23], que se escaló hasta 67 000 millones de parámetros. Se desarrolló para competir con otros LLM disponibles en ese momento con un rendimiento cercano al de GPT-4. Sin embargo, enfrentó desafíos en términos de eficiencia computacional y escalabilidad.^[21] También se lanzó una versión de chatbot del modelo llamada DeepSeek Chat.^[24]

V2

En mayo de 2024 se lanzó DeepSeek-V2.^[25] El Financial Times informó que era más barato que sus pares con un precio de 2 RMB por cada millón de tokens de salida. La clasificación de Tiger Lab de la Universidad de Waterloo clasificó a DeepSeek-V2 en el séptimo lugar de su clasificación LLM.^[19]

V3

En diciembre de 2024 se lanzó DeepSeek-V3. Llegó con 671 mil millones de parámetros y se entrenó en alrededor de 55 días a un costo de 5,58 millones de $^[18], utilizando significativamente menos recursos en comparación con sus pares. Se entrenó en un conjunto de datos de 14,8 billones de tokens. Las pruebas de referencia mostraron que superó a LLaMA 3.1 y Qwen 2.5 mientras que igualó a GPT-4o y Claude 3.5 Sonnet.^[18]^[26]^[27]^[28] La optimización de DeepSeek de recursos limitados destacó los límites potenciales de las sanciones estadounidenses al desarrollo de IA de China.^[18] Un artículo de opinión de The Hill describió el lanzamiento como la IA estadounidense llegando a su "momento Sputnik".^[29]

El modelo es una mezcla de expertos con Multi-head Latent Attention Transformer, que contiene 256 expertos enrutados y 1 experto compartido. Cada token activa 37 mil millones de parámetros y más.^[30]

El 27 de enero de 2025, el asistente de inteligencia artificial de la startup china DeepSeek superó a ChatGPT como la aplicación gratuita mejor calificada en la App Store de EE. UU. Ha provocado debates sobre la efectividad de las restricciones de exportación de EE.UU. sobre chips de inteligencia artificial avanzados a China. El modelo DeepSeek-V3, que utiliza los chips H800 de Nvidia, está ganando reconocimiento por su desempeño competitivo, desafiando el dominio global de los modelos de inteligencia artificial de EE.UU.^[31]

Coste total de entrenamiento del modelo DeepSeek-V3^[30]
Escenario	Coste (en mil horas de GPU)	Coste (en un millón de dólares estadounidenses)
Pre-entrenamiento	2.664	5,328
Extensión de contexto	119	0,24
Ajuste fino	5	0,01
Total	2.788	5,576

R1

En noviembre de 2024 se lanzó DeepSeek R1-Lite-Preview, que fue entrenado para inferencia lógica, razonamiento matemático y resolución de problemas en tiempo real. DeepSeek afirmó que superó el rendimiento de OpenAI o1 en puntos de referencia como American Invitational Mathematics Examination (AIME) y MATH.^[32] Sin embargo, The Wall Street Journal afirmó que cuando utilizó 15 problemas de la edición 2024 de AIME, el modelo o1 alcanzó una solución más rápido que DeepSeek R1-Lite-Preview.^[33]

El 20 de enero de 2025 se lanzaron DeepSeek-R1 y DeepSeek-R1-Zero.^[34]^[35] Se basaron en V3-Base. Al igual que V3, cada uno es una mezcla de expertos con 671B de parámetros totales y 37B de parámetros activados. También lanzaron algunos modelos "DeepSeek-R1-Distill", que no se basan en R1. En cambio, son similares a otros modelos de peso abierto como LLaMA y Qwen, ajustados con datos sintéticos generados por R1.

R1-Zero se entrenó exclusivamente mediante aprendizaje por refuerzo (RL), sin ningún aprendizaje supervisado (SFT).^[36] Se entrenó utilizando optimización de política relativa de grupo (GRPO), que estima la línea de base a partir de las puntuaciones del grupo en lugar de utilizar un modelo crítico.^[37] El sistema de recompensa utilizado se basa en reglas y consta principalmente de dos tipos de recompensas: recompensas de precisión y recompensas de formato.

Los resultados de R1-Zero no son muy legibles y cambian entre inglés y chino en los mismos, por lo que lo entrenaron para abordar estos problemas y mejorar aún más el razonamiento.^[36]

Evaluación y reacciones

DeepSeek lanzó su asistente virtual, que utiliza el modelo V3 como una aplicación de bot conversacional para iOS y Android. Para el 27 de enero de 2025, la aplicación había superado a ChatGPT como la aplicación gratuita mejor calificada en la App Store de iOS en los Estados Unidos; se informa que su bot conversacional responde preguntas, resuelve problemas de lógica y escribe programas de computadora a la par de otros bots conversacionales en el mercado, según pruebas de referencia utilizadas por empresas de IA estadounidenses.^[4]

DeepSeek-V3 utiliza significativamente menos recursos en comparación con sus pares; por ejemplo, mientras que las principales compañías de IA del mundo entrenan a sus chatbots con supercomputadora s que utilizan hasta 16 000 unidades de procesamiento gráfico (GPU), si no más, DeepSeek afirma haber necesitado solo alrededor de 2000 GPU, concretamente el chip de la serie H800 de Nvidia. Se capacitó en alrededor de 55 días a un costo de US$5,58 millones,^[30] lo que es aproximadamente 10 veces menos de lo que el gigante tecnológico estadounidense Meta gastó en construir su última tecnología de inteligencia artificial.^[4]

El desempeño competitivo de DeepSeek a un costo relativamente mínimo ha sido reconocido como un desafío potencial al dominio global de los modelos de IA estadounidenses.^[38] Varias publicaciones y medios de comunicación, como The Hill y The Guardian, describieron el lanzamiento de su bot conversacional como un «momento Sputnik» para la IA estadounidense.^[39]^[40] El rendimiento de su modelo R1 estaba «a la par» con uno de los últimos modelos de OpenAI cuando se usaba para tareas como matemáticas, codificación y razonamiento en lenguaje natural;^[41] haciéndose eco de otros comentaristas, el capitalista de riesgo estadounidense de Silicon Valley Marc Andreessen también describió R1 como «el momento Sputnik de la IA».^[41]

El fundador de Deepseek, Liang Wenfeng, ha sido comparado con el CEO de Open AI, Sam Altman. CNN lo llama el «Sam Altman de China» y un «evangelista de la IA».^[42]

La optimización de recursos limitados por parte de DeepSeek ha puesto de relieve los posibles límites de las sanciones estadounidenses al desarrollo de la IA de China, que incluyen restricciones a la exportación de chips de IA avanzados a China.^[18]^[43] El éxito de los modelos de inteligencia artificial de la empresa «desató una turbulencia en el mercado»^[44] y provocó que las acciones de las principales empresas tecnológicas mundiales cayeran en picado el 27 de enero: las acciones de Nvidia cayeron hasta un 17-18%,^[45] al igual que las acciones de su rival Broadcom. Otras empresas tecnológicas también se hundieron, entre ellas Microsoft (bajó un 2,5%), Alphabet, el propietario de Google (bajó más del 4%) y el fabricante neerlandés de equipos de chips ASML (bajó más del 7%).^[41] Una liquidación global de acciones tecnológicas en Nasdaq, impulsada por el lanzamiento del modelo R1, había llevado a pérdidas récord de alrededor de $593 mil millones en las capitalizaciones de mercado de las empresas de IA y hardware informático;^[46] para el 28 de enero, un total de $1 billón de valor se había esfumado de las acciones estadounidenses.^[40]

Las figuras principales del sector de inteligencia artificial estadounidense tuvieron reacciones encontradas ante el éxito y el rendimiento de DeepSeek.^[47] Satya Nadella, director ejecutivo de Microsoft, y Sam Altman, director ejecutivo de OpenAI (cuyas empresas participan en el «The Stargate Project», respaldado por el gobierno de Estados Unidos, para desarrollar una infraestructura de inteligencia artificial estadounidense) calificaron a DeepSeek de «súper impresionante».^[48]^[49] El presidente estadounidense Donald Trump, quien anunció The Stargate Project, calificó a DeepSeek como una «llamada de atención»^[50] y un avance positivo.^[3]^[40]^[51]^[52] Otros líderes en el campo, incluido el director ejecutivo de Scale AI, Alexandr Wang, el cofundador y director ejecutivo de Anthropic, Dario Amodei, y Elon Musk, expresaron escepticismo sobre el rendimiento de la aplicación o sobre la sostenibilidad de su éxito.^[47]^[53]^[54] Varias empresas, incluidas Amazon Web Services, Toyota y Stripe, buscan utilizar el modelo en su programa.^[55]

El 27 de enero, DeepSeek limitó el registro de nuevos usuarios a números de teléfono, correo electrónico e inicio de sesión de Google de China continental después de un ciberataque denunciado que causó una ralentización de sus servidores y servicios.^[56]^[57]

Preocupaciones

Censura

Artículos principales: Censura internacional china y Censura en China.

Algunas fuentes han observado que la versión API oficial de R1 utiliza mecanismos de censura para temas que se consideran políticamente sensibles para el gobierno de la República Popular China. Por ejemplo, el modelo se niega a responder preguntas sobre las protestas de la Plaza de Tiananmén de 1989, la persecución de los uigures o derechos humanos en la República Popular China.^[58]^[59] La IA puede generar inicialmente una respuesta, pero poco después la elimina y la reemplaza con un mensaje como: «Lo siento, eso está más allá de mi alcance actual. Hablemos de otra cosa».^[59] Los mecanismos de censura y restricciones integrados solo se pueden eliminar de forma limitada en la versión de código abierto del modelo R1. Si se tocan los «valores socialistas fundamentales» definidos por las autoridades reguladoras de Internet chinas o se plantea el estatus político de Taiwán, las discusiones se dan por terminadas.^[60] Cuando fue probado por NBC News, el R1 de DeepSeek describió a Taiwán como «una parte inalienable del territorio de China» y declaró: «Nos oponemos firmemente a cualquier forma de actividad separatista de 'independencia de Taiwán' y estamos comprometidos a lograr la reunificación completa de la patria a través de medios pacíficos».^[61] Los investigadores occidentales pudieron en enero de 2025 engañar a DeepSeek para que diera respuestas precisas a algunos de estos temas adaptando la pregunta formulada.^[62]

Seguridad y privacidad

También existe el temor de que el sistema de IA pueda utilizarse para operaciones de influencia extranjera, difusión de desinformación, vigilancia y desarrollo de armas cibernéticas para el gobierno de la República Popular China.^[63]^[64]^[65] Los términos y condiciones de privacidad de DeepSeek establecen lo siguiente: «Almacenamos la información que recopilamos en servidores seguros ubicados en la República Popular China... Podemos recopilar su entrada de texto o audio, indicaciones, archivos cargados, comentarios, historial de chat u otro contenido que proporcione a nuestro modelo y Servicios». Si bien la política de almacenamiento y recopilación de datos es coherente con la política de privacidad de ChatGPT,^[66] un artículo de prensa informa que esto representa un problema de seguridad.^[67] En respuesta, la autoridad de protección de datos italiana está buscando información adicional sobre la recopilación y el uso de datos personales por parte de DeepSeek y el Consejo de Seguridad Nacional de los Estados Unidos anunció que había iniciado una revisión de seguridad nacional.^[68]^[69] Sin embargo, cuando se utiliza DeepSeek AI localmente, los datos no se comparten públicamente.^[70]

Véase también

Industria de la inteligencia artificial en China

Referencias

↑ Gibney, Elizabeth (23 de enero de 2025). «China's cheap, open AI model DeepSeek thrills scientists». Nature (en inglés). ISSN 1476-4687. PMID 39849139. doi:10.1038/d41586-025-00229-6.
↑ ^a ^b Vincent, James (28 de enero de 2025). «The DeepSeek panic reveals an AI world ready to blow». The Guardian.
↑ ^a ^b Hoskins, Peter (27 de enero de 2025). «Nvidia shares sink as Chinese AI app spooks markets». BBC News (en inglés británico). Consultado el 28 de enero de 2025.
↑ ^a ^b ^c ^d Metz, Cade (23 de enero de 2025). «How Chinese A.I. Start-Up DeepSeek Is Competing With Silicon Valley Giants». The New York Times (en inglés estadounidense). ISSN 0362-4331. Consultado el 27 de enero de 2025.
↑ Cosgrove, Emma (27 de enero de 2025). «DeepSeek's cheaper models and weaker chips call into question trillions in AI infrastructure spending». Business Insider.
↑ Saran, Cliff (10 de diciembre de 2024). «Nvidia investigation signals widening of US and China chip war». Computer Weekly. Consultado el 27 de enero de 2025.
↑ Sherman, Natalie (9 de diciembre de 2024). «Nvidia targeted by China in new chip war probe». BBC News. Consultado el 27 de enero de 2025.
↑ ^a ^b ^c Metz, Cade (27 de enero de 2025). «What is DeepSeek? And How Is It Upending A.I.?». The New York Times (en inglés estadounidense). ISSN 0362-4331. Consultado el 27 de enero de 2025.
↑ Field, Hayden (27 de enero de 2025). «China's DeepSeek AI dethrones ChatGPT on App Store: Here's what you should know». CNBC.
↑ «What is DeepSeek, and why is it causing Nvidia and other stocks to slump?». CBS News. 27 de enero de 2025.
↑ Zahn, Max. «Nvidia, Microsoft shares tumble as China-based AI app DeepSeek hammers tech giants». ABC News (en inglés). Consultado el 27 de enero de 2025.
↑ Roose, Kevin (28 de enero de 2025). «Why DeepSeek Could Change What Silicon Valley Believe About A.I.». The New York Times (en inglés estadounidense). ISSN 0362-4331. Consultado el 28 de enero de 2025.
↑ Romero, Luis E. (27 de enero de 2025). «ChatGPT, DeepSeek, Or Llama? Meta's LeCun Says Open-Source Is The Key». Forbes.
↑ Panda, Aishwarya (28 de enero de 2025). «Deepseek Wounds Redirected to Low-Cost H1-Bs». M9 news (en inglés estadounidense). Consultado el 28 de enero de 2025.
↑ ^a ^b Chen, Caiwei (24 de enero de 2025). «How a top Chinese AI model overcame US sanctions». MIT Technology Review (en inglés). Archivado desde el original el 25 January 2025.
↑ ^a ^b ^c Ottinger, Lily (9 December 2024). «Deepseek: From Hedge Fund to Frontier Model Maker». ChinaTalk (en inglés). Archivado desde el original el 28 December 2024. Consultado el 28 December 2024.
↑ Yu, Xu (17 April 2023). «[Exclusive] Chinese Quant Hedge Fund High-Flyer Won't Use AGI to Trade Stocks, MD Says». Yicai Global (en inglés). Archivado desde el original el 31 December 2023. Consultado el 28 December 2024.
↑ ^a ^b ^c ^d ^e ^f ^g Jiang, Ben (1 de enero de 2025). «Meet DeepSeek: the Chinese start-up that is changing how AI models are trained». South China Morning Post (en inglés). Archivado desde el original el 22 de enero de 2025. Consultado el 1 de enero de 2025.
↑ ^a ^b McMorrow, Ryan; Olcott, Eleanor (9 June 2024). «The Chinese quant fund-turned-AI pioneer». Financial Times. Archivado desde el original el 17 July 2024. Consultado el 28 December 2024.
↑ ^a ^b Schneider, Jordan (27 November 2024). «Deepseek: The Quiet Giant Leading China's AI Race». ChinaTalk (en inglés). Consultado el 28 December 2024.
↑ ^a ^b Se, Ksenia (28 August 2024). «Inside DeepSeek Models». Turing Post (en inglés). Archivado desde el original el 18 September 2024. Consultado el 28 December 2024.
↑ «DeepSeek-Coder/LICENSE-MODEL at main · deepseek-ai/DeepSeek-Coder». GitHub (en inglés). Archivado desde el original el 22 January 2025. Consultado el 24 de enero de 2025.
↑ DeepSeek-AI; Bi, Xiao; Chen, Deli; Chen, Guanting; Chen, Shanhuang; Dai, Damai; Deng, Chengqi; Ding, Honghui et al. (5 de enero de 2024), DeepSeek LLM: Scaling Open-Source Language Models with Longtermism, arXiv, doi:10.48550/arXiv.2401.02954, arXiv:2401.02954 .
↑ Sharma, Shubham (1 December 2023). «Meet DeepSeek Chat, China's latest ChatGPT rival with a 67B model». VentureBeat (en inglés estadounidense). Archivado desde el original el 23 December 2024. Consultado el 28 December 2024.
↑ DeepSeek-AI; Liu, Aixin; Feng, Bei; Wang, Bin; Wang, Bingxuan; Liu, Bo; Zhao, Chenggang; Dengr, Chengqi et al. (19 de junio de 2024), DeepSeek-V2: A Strong, Economical, and Efficient Mixture-of-Experts Language Model, arXiv, doi:10.48550/arXiv.2405.04434, arXiv:2405.04434 .
↑ Jiang, Ben (27 December 2024). «Chinese start-up DeepSeek's new AI model outperforms Meta, OpenAI products». South China Morning Post (en inglés). Archivado desde el original el 27 December 2024. Consultado el 28 December 2024.
↑ Sharma, Shubham (26 December 2024). «DeepSeek-V3, ultra-large open-source AI, outperforms Llama and Qwen on launch». VentureBeat (en inglés estadounidense). Archivado desde el original el 27 December 2024. Consultado el 28 December 2024.
↑ Wiggers, Kyle (26 December 2024). «DeepSeek's new AI model appears to be one of the best 'open' challengers yet». TechCrunch. Archivado desde el original el 2 January 2025. Consultado el 31 December 2024.
↑ Wade, David (6 de diciembre de 2024). «American AI has reached its Sputnik moment». The Hill (en inglés estadounidense). Archivado desde el original el 8 December 2024. Consultado el 25 de enero de 2025.
↑ ^a ^b ^c DeepSeek-AI; Liu, Aixin; Feng, Bei; Xue, Bing; Wang, Bingxuan; Wu, Bochao; Lu, Chengda; Zhao, Chenggang (27 de diciembre de 2024), DeepSeek-V3 Technical Report .
↑ «Chinese AI startup DeepSeek overtakes ChatGPT on Apple App Store». Reuters. 27 January 2025. Consultado el 27 January 2025.
↑ Franzen, Carl (20 November 2024). «DeepSeek's first reasoning model R1-Lite-Preview turns heads, beating OpenAI o1 performance». VentureBeat (en inglés estadounidense). Archivado desde el original el 22 November 2024. Consultado el 28 December 2024.
↑ Huang, Raffaele (24 December 2024). «Don't Look Now, but China's AI Is Catching Up Fast». The Wall Street Journal (en inglés estadounidense). Archivado desde el original el 27 December 2024. Consultado el 28 December 2024.
↑ «Release DeepSeek-R1 · deepseek-ai/DeepSeek-R1@23807ce». GitHub (en inglés). Archivado desde el original el 21 January 2025. Consultado el 21 de enero de 2025.
↑ DeepSeek-AI; Guo, Daya; Yang, Dejian; Zhang, Haowei; Song, Junxiao; Zhang, Ruoyu; Xu, Runxin; Zhu, Qihao et al. (22 de enero de 2025), DeepSeek-R1: Incentivizing Reasoning Capability in LLMs via Reinforcement Learning, arXiv, doi:10.48550/arXiv.2501.12948, arXiv:2501.12948 .
↑ ^a ^b Sharma, Shubham (20 de enero de 2025). «Open-source DeepSeek-R1 uses pure reinforcement learning to match OpenAI o1 — at 95% less cost». VentureBeat (en inglés estadounidense). Archivado desde el original el 25 January 2025. Consultado el 25 de enero de 2025.
↑ Shao, Zhihong; Wang, Peiyi; Zhu, Qihao; Xu, Runxin; Song, Junxiao; Bi, Xiao; Zhang, Haowei; Zhang, Mingchuan et al. (27 de abril de 2024), DeepSeekMath: Pushing the Limits of Mathematical Reasoning in Open Language Models, arXiv:2402.03300 .
↑ «Chinese AI startup DeepSeek overtakes ChatGPT on Apple App Store». Reuters. 27 de enero de 2025. Consultado el 27 de enero de 2025.
↑ Wade, David (6 de diciembre de 2024). «American AI has reached its Sputnik moment». The Hill (en inglés estadounidense). Archivado desde el original el 8 de diciembre de 2024. Consultado el 25 de enero de 2025.
↑ ^a ^b ^c Milmo, Dan (28 de enero de 2025). «‘Sputnik moment’: $1tn wiped off US stocks after Chinese firm unveils AI chatbot». The Guardian (en inglés británico). ISSN 0261-3077. Consultado el 28 de enero de 2025.
↑ ^a ^b ^c «DeepSeek Chinese AI chatbot sparks market turmoil for rivals». BBC News (en inglés británico). 27 de enero de 2025. Consultado el 27 de enero de 2025.
↑ Goldman, David (27 de enero de 2025). «What is DeepSeek, the Chinese AI startup that shook the tech world? | CNN Business». CNN (en inglés). Consultado el 27 de enero de 2025.
↑ Shilov, Anton (27 de diciembre de 2024). «Chinese AI company's AI model breakthrough highlights limits of US sanctions». Tom's Hardware (en inglés). Archivado desde el original el 28 de diciembre de 2024. Consultado el 28 de diciembre de 2024.
↑ «DeepSeek updates – Chinese AI chatbot sparks US market turmoil, wiping $500bn off Nvidia». BBC News (en inglés británico). Consultado el 27 de enero de 2025.
↑ Nazareth, Rita (26 de enero de 2025). «Stock Rout Gets Ugly as Nvidia Extends Loss to 17%: Markets Wrap». Bloomberg. Consultado el 27 de enero de 2025.
↑ Carew, Sinéad (27 de enero de 2025). «DeepSeek sparks global AI selloff, Nvidia losses about $593 billion of value». Reuters.
↑ ^a ^b Sherry, Ben (28 de enero de 2025). «DeepSeek, Calling It 'Impressive' but Staying Skeptical». Inc. Consultado el 29 de enero de 2025.
↑ Kevin Okemwa (28 de enero de 2025). «Microsoft CEO Satya Nadella touts DeepSeek's open-source AI as "super impressive": "We should take the developments out of China very, very seriously"». Windows Central (en inglés). Consultado el 28 de enero de 2025.
↑ Nazzaro, Miranda (28 de enero de 2025). «OpenAI's Sam Altman calls DeepSeek model 'impressive'». The Hill. Consultado el 28 de enero de 2025.
↑ Dou, Eva (28 de enero de 2025). «Trump calls China's DeepSeek AI app a 'wake-up call' after tech stocks slide». The Washington Post. Consultado el 28 de enero de 2025.
↑ Habeshian, Sareen (28 de enero de 2025). «Johnson bashes China on AI, Trump calls DeepSeek development "positive"». Axios.
↑ Karaian, Jason (27 de enero de 2025). «U.S. Stocks Sink Amid Fears Over DeepSeek and Chinese A.I. Advancements». The New York Times (en inglés estadounidense). ISSN 0362-4331. Consultado el 27 de enero de 2025.
↑ Sharma, Manoj (6 de enero de 2025). «Musk dismisses, Altman applauds: What leaders say on DeepSeek's disruption». Fortune India (en inglés). Consultado el 28 de enero de 2025.
↑ «Elon Musk 'questions' DeepSeek's claims, suggests massive Nvidia GPU infrastructure». Financial Express (en inglés). 28 de enero de 2025. Consultado el 28 de enero de 2025.
↑ Kim, Eugene (27 de enero de 2025). «Big AWS customers, including Stripe and Toyota, are hounding the cloud giant for access to DeepSeek AI models». Business Insider (en inglés estadounidense). Consultado el 27 de enero de 2025.
↑ Kerr, Dara (27 de enero de 2025). «DeepSeek hit with ‘large-scale’ cyber-attack after AI chatbot tops app stores». The Guardian (en inglés británico). ISSN 0261-3077. Consultado el 27 de enero de 2025.
↑ Tweedie, Steven; Altchek, Ana (27 de enero de 2025). «DeepSeek temporarily limited new sign-ups, citing 'large-scale malicious attacks'». Business Insider (en inglés estadounidense). Consultado el 27 de enero de 2025.
↑ Field, Matthew (27 de enero de 2025). «Chinese AI has sparked a $1 trillion panic – and it doesn't care about free speech». The Daily Telegraph (en inglés británico). ISSN 0307-1235. Consultado el 27 de enero de 2025.
↑ ^a ^b Steinschaden, Jakob (27 de enero de 2025). «DeepSeek: This is what live censorship looks like in the Chinese AI chatbot». Trending Topics (en inglés). Consultado el 27 de enero de 2025.
↑ «The Guardian view on a global AI race: geopolitics, innovation and the rise of chaos». The Guardian (en inglés británico). 26 de enero de 2025. ISSN 0261-3077. Consultado el 27 de enero de 2025.
↑ Yang, Angela (27 de enero de 2025). «Chinese AI DeepSeek jolts Silicon Valley, giving the AI race its 'Sputnik moment'». NBC News (en inglés). Consultado el 27 de enero de 2025.
↑ Lu, Donna (28 de enero de 2025). «We tried out DeepSeek. It worked well, until we asked it about Tiananmen Square and Taiwan». The Guardian (en inglés británico). ISSN 0261-3077. Consultado el 28 de enero de 2025.
↑ Kimery, Anthony (26 de enero de 2025). «China's DeepSeek AI poses formidable cyber, data privacy threats». Biometric Update (en inglés estadounidense). Consultado el 27 de enero de 2025.
↑ Booth, Robert (28 de enero de 2025). «Experts urge caution over use of Chinese AI DeepSeek». The Guardian (en inglés británico). ISSN 0261-3077. Consultado el 28 de enero de 2025.
↑ Hornby, Rael (28 de enero de 2025). «DeepSeek's success has painted a huge TikTok-shaped target on its back». LaptopMag (en inglés). Consultado el 28 de enero de 2025.
↑ «Privacy policy». Open AI (en inglés estadounidense). Consultado el 28 de enero de 2025.
↑ Burgess, Matt. «DeepSeek's Popular AI App Is Explicitly Sending US Data to China». Wired (en inglés estadounidense). ISSN 1059-1028. Consultado el 28 de enero de 2025.
↑ «Italy regulator seeks information from DeepSeek on data protection». Reuters. 28 de enero de 2025. Consultado el 28 de enero de 2025.
↑ Shalal, Andrea (28 de enero de 2025). «White House evaluates effect of China AI app DeepSeek on national security, official says». Reuters. Consultado el 28 de enero de 2025.
↑ deepseek-ai/DeepSeek-R1, DeepSeek, 29 de enero de 2025, consultado el 29 de enero de 2025 .

Enlaces externos

Esta obra contiene una traducción derivada de «DeepSeek» de Wikipedia en inglés, concretamente de esta versión, publicada por sus editores bajo la Licencia de documentación libre de GNU y la Licencia Creative Commons Atribución-CompartirIgual 4.0 Internacional.
DeepSeek: qué es, cómo funciona y qué opciones tiene esta inteligencia artificial Xataka
DeepSeek: qué es y quién está detrás de la alternativa china a ChatGPT que ha puesto en jaque a la industria de la IA La Vanguardia
Qué es DeepSeek, la startup de inteligencia artificial con la que China sacude a los mercados y pone en alerta a Silicon Valley Infobae
La IA china 'low cost' de DeepSeek amenaza con desmontar las altas valoraciones de las tecnológicas El Economista

Datos: Q131577453
Multimedia: DeepSeek / Q131577453

[1] Gibney, Elizabeth (23 de enero de 2025). «China's cheap, open AI model DeepSeek thrills scientists». Nature (en inglés). ISSN 1476-4687. PMID 39849139. doi:10.1038/d41586-025-00229-6.

[vincent-2] Vincent, James (28 de enero de 2025). «The DeepSeek panic reveals an AI world ready to blow». The Guardian.

[Hoskins_RJ-3] Hoskins, Peter (27 de enero de 2025). «Nvidia shares sink as Chinese AI app spooks markets». BBC News (en inglés británico). Consultado el 28 de enero de 2025.

[:8-4] Metz, Cade (23 de enero de 2025). «How Chinese A.I. Start-Up DeepSeek Is Competing With Silicon Valley Giants». The New York Times (en inglés estadounidense). ISSN 0362-4331. Consultado el 27 de enero de 2025.

[5] Cosgrove, Emma (27 de enero de 2025). «DeepSeek's cheaper models and weaker chips call into question trillions in AI infrastructure spending». Business Insider.

[6] Saran, Cliff (10 de diciembre de 2024). «Nvidia investigation signals widening of US and China chip war». Computer Weekly. Consultado el 27 de enero de 2025.

[7] Sherman, Natalie (9 de diciembre de 2024). «Nvidia targeted by China in new chip war probe». BBC News. Consultado el 27 de enero de 2025.

[auto-8] Metz, Cade (27 de enero de 2025). «What is DeepSeek? And How Is It Upending A.I.?». The New York Times (en inglés estadounidense). ISSN 0362-4331. Consultado el 27 de enero de 2025.

[9] Field, Hayden (27 de enero de 2025). «China's DeepSeek AI dethrones ChatGPT on App Store: Here's what you should know». CNBC.

[10] «What is DeepSeek, and why is it causing Nvidia and other stocks to slump?». CBS News. 27 de enero de 2025.

[11] Zahn, Max. «Nvidia, Microsoft shares tumble as China-based AI app DeepSeek hammers tech giants». ABC News (en inglés). Consultado el 27 de enero de 2025.

[12] Roose, Kevin (28 de enero de 2025). «Why DeepSeek Could Change What Silicon Valley Believe About A.I.». The New York Times (en inglés estadounidense). ISSN 0362-4331. Consultado el 28 de enero de 2025.

[auto1-13] Romero, Luis E. (27 de enero de 2025). «ChatGPT, DeepSeek, Or Llama? Meta's LeCun Says Open-Source Is The Key». Forbes.

[14] Panda, Aishwarya (28 de enero de 2025). «Deepseek Wounds Redirected to Low-Cost H1-Bs». M9 news (en inglés estadounidense). Consultado el 28 de enero de 2025.

[:6-15] Chen, Caiwei (24 de enero de 2025). «How a top Chinese AI model overcame US sanctions». MIT Technology Review (en inglés). Archivado desde el original el 25 January 2025.

[:0-16] Ottinger, Lily (9 December 2024). «Deepseek: From Hedge Fund to Frontier Model Maker». ChinaTalk (en inglés). Archivado desde el original el 28 December 2024. Consultado el 28 December 2024.

[17] Yu, Xu (17 April 2023). «[Exclusive] Chinese Quant Hedge Fund High-Flyer Won't Use AGI to Trade Stocks, MD Says». Yicai Global (en inglés). Archivado desde el original el 31 December 2023. Consultado el 28 December 2024.

[scmp_1_January_2025-18] ↑ ^a ^b ^c ^d ^e ^f ^g Jiang, Ben (1 de enero de 2025). «Meet DeepSeek: the Chinese start-up that is changing how AI models are trained». South China Morning Post (en inglés). Archivado desde el original el 22 de enero de 2025. Consultado el 1 de enero de 2025.

[:2-19] McMorrow, Ryan; Olcott, Eleanor (9 June 2024). «The Chinese quant fund-turned-AI pioneer». Financial Times. Archivado desde el original el 17 July 2024. Consultado el 28 December 2024.

[:3-20] Schneider, Jordan (27 November 2024). «Deepseek: The Quiet Giant Leading China's AI Race». ChinaTalk (en inglés). Consultado el 28 December 2024.

[:1-21] Se, Ksenia (28 August 2024). «Inside DeepSeek Models». Turing Post (en inglés). Archivado desde el original el 18 September 2024. Consultado el 28 December 2024.

[22] «DeepSeek-Coder/LICENSE-MODEL at main · deepseek-ai/DeepSeek-Coder». GitHub (en inglés). Archivado desde el original el 22 January 2025. Consultado el 24 de enero de 2025.

[23] DeepSeek-AI; Bi, Xiao; Chen, Deli; Chen, Guanting; Chen, Shanhuang; Dai, Damai; Deng, Chengqi; Ding, Honghui et al. (5 de enero de 2024), DeepSeek LLM: Scaling Open-Source Language Models with Longtermism, arXiv, doi:10.48550/arXiv.2401.02954, arXiv:2401.02954 .

[24] Sharma, Shubham (1 December 2023). «Meet DeepSeek Chat, China's latest ChatGPT rival with a 67B model». VentureBeat (en inglés estadounidense). Archivado desde el original el 23 December 2024. Consultado el 28 December 2024.

[25] DeepSeek-AI; Liu, Aixin; Feng, Bei; Wang, Bin; Wang, Bingxuan; Liu, Bo; Zhao, Chenggang; Dengr, Chengqi et al. (19 de junio de 2024), DeepSeek-V2: A Strong, Economical, and Efficient Mixture-of-Experts Language Model, arXiv, doi:10.48550/arXiv.2405.04434, arXiv:2405.04434 .

[26] Jiang, Ben (27 December 2024). «Chinese start-up DeepSeek's new AI model outperforms Meta, OpenAI products». South China Morning Post (en inglés). Archivado desde el original el 27 December 2024. Consultado el 28 December 2024.

[27] Sharma, Shubham (26 December 2024). «DeepSeek-V3, ultra-large open-source AI, outperforms Llama and Qwen on launch». VentureBeat (en inglés estadounidense). Archivado desde el original el 27 December 2024. Consultado el 28 December 2024.

[28] Wiggers, Kyle (26 December 2024). «DeepSeek's new AI model appears to be one of the best 'open' challengers yet». TechCrunch. Archivado desde el original el 2 January 2025. Consultado el 31 December 2024.

[29] Wade, David (6 de diciembre de 2024). «American AI has reached its Sputnik moment». The Hill (en inglés estadounidense). Archivado desde el original el 8 December 2024. Consultado el 25 de enero de 2025.

[:5-30] DeepSeek-AI; Liu, Aixin; Feng, Bei; Xue, Bing; Wang, Bingxuan; Wu, Bochao; Lu, Chengda; Zhao, Chenggang (27 de diciembre de 2024), DeepSeek-V3 Technical Report .

[31] «Chinese AI startup DeepSeek overtakes ChatGPT on Apple App Store». Reuters. 27 January 2025. Consultado el 27 January 2025.

[32] Franzen, Carl (20 November 2024). «DeepSeek's first reasoning model R1-Lite-Preview turns heads, beating OpenAI o1 performance». VentureBeat (en inglés estadounidense). Archivado desde el original el 22 November 2024. Consultado el 28 December 2024.

[33] Huang, Raffaele (24 December 2024). «Don't Look Now, but China's AI Is Catching Up Fast». The Wall Street Journal (en inglés estadounidense). Archivado desde el original el 27 December 2024. Consultado el 28 December 2024.

[34] «Release DeepSeek-R1 · deepseek-ai/DeepSeek-R1@23807ce». GitHub (en inglés). Archivado desde el original el 21 January 2025. Consultado el 21 de enero de 2025.

[35] DeepSeek-AI; Guo, Daya; Yang, Dejian; Zhang, Haowei; Song, Junxiao; Zhang, Ruoyu; Xu, Runxin; Zhu, Qihao et al. (22 de enero de 2025), DeepSeek-R1: Incentivizing Reasoning Capability in LLMs via Reinforcement Learning, arXiv, doi:10.48550/arXiv.2501.12948, arXiv:2501.12948 .

[:4-36] Sharma, Shubham (20 de enero de 2025). «Open-source DeepSeek-R1 uses pure reinforcement learning to match OpenAI o1 — at 95% less cost». VentureBeat (en inglés estadounidense). Archivado desde el original el 25 January 2025. Consultado el 25 de enero de 2025.

[37] Shao, Zhihong; Wang, Peiyi; Zhu, Qihao; Xu, Runxin; Song, Junxiao; Bi, Xiao; Zhang, Haowei; Zhang, Mingchuan et al. (27 de abril de 2024), DeepSeekMath: Pushing the Limits of Mathematical Reasoning in Open Language Models, arXiv:2402.03300 .

[38] «Chinese AI startup DeepSeek overtakes ChatGPT on Apple App Store». Reuters. 27 de enero de 2025. Consultado el 27 de enero de 2025.

[39] Wade, David (6 de diciembre de 2024). «American AI has reached its Sputnik moment». The Hill (en inglés estadounidense). Archivado desde el original el 8 de diciembre de 2024. Consultado el 25 de enero de 2025.

[Guardian-40] Milmo, Dan (28 de enero de 2025). «‘Sputnik moment’: $1tn wiped off US stocks after Chinese firm unveils AI chatbot». The Guardian (en inglés británico). ISSN 0261-3077. Consultado el 28 de enero de 2025.

[auto2-41] «DeepSeek Chinese AI chatbot sparks market turmoil for rivals». BBC News (en inglés británico). 27 de enero de 2025. Consultado el 27 de enero de 2025.

[42] Goldman, David (27 de enero de 2025). «What is DeepSeek, the Chinese AI startup that shook the tech world? | CNN Business». CNN (en inglés). Consultado el 27 de enero de 2025.

[43] Shilov, Anton (27 de diciembre de 2024). «Chinese AI company's AI model breakthrough highlights limits of US sanctions». Tom's Hardware (en inglés). Archivado desde el original el 28 de diciembre de 2024. Consultado el 28 de diciembre de 2024.

[44] «DeepSeek updates – Chinese AI chatbot sparks US market turmoil, wiping $500bn off Nvidia». BBC News (en inglés británico). Consultado el 27 de enero de 2025.

[45] Nazareth, Rita (26 de enero de 2025). «Stock Rout Gets Ugly as Nvidia Extends Loss to 17%: Markets Wrap». Bloomberg. Consultado el 27 de enero de 2025.

[46] Carew, Sinéad (27 de enero de 2025). «DeepSeek sparks global AI selloff, Nvidia losses about $593 billion of value». Reuters.

[DSCI_1-47] Sherry, Ben (28 de enero de 2025). «DeepSeek, Calling It 'Impressive' but Staying Skeptical». Inc. Consultado el 29 de enero de 2025.

[48] Kevin Okemwa (28 de enero de 2025). «Microsoft CEO Satya Nadella touts DeepSeek's open-source AI as "super impressive": "We should take the developments out of China very, very seriously"». Windows Central (en inglés). Consultado el 28 de enero de 2025.

[49] Nazzaro, Miranda (28 de enero de 2025). «OpenAI's Sam Altman calls DeepSeek model 'impressive'». The Hill. Consultado el 28 de enero de 2025.

[50] Dou, Eva (28 de enero de 2025). «Trump calls China's DeepSeek AI app a 'wake-up call' after tech stocks slide». The Washington Post. Consultado el 28 de enero de 2025.

[51] Habeshian, Sareen (28 de enero de 2025). «Johnson bashes China on AI, Trump calls DeepSeek development "positive"». Axios.

[52] Karaian, Jason (27 de enero de 2025). «U.S. Stocks Sink Amid Fears Over DeepSeek and Chinese A.I. Advancements». The New York Times (en inglés estadounidense). ISSN 0362-4331. Consultado el 27 de enero de 2025.

[53] Sharma, Manoj (6 de enero de 2025). «Musk dismisses, Altman applauds: What leaders say on DeepSeek's disruption». Fortune India (en inglés). Consultado el 28 de enero de 2025.

[54] «Elon Musk 'questions' DeepSeek's claims, suggests massive Nvidia GPU infrastructure». Financial Express (en inglés). 28 de enero de 2025. Consultado el 28 de enero de 2025.

[55] Kim, Eugene (27 de enero de 2025). «Big AWS customers, including Stripe and Toyota, are hounding the cloud giant for access to DeepSeek AI models». Business Insider (en inglés estadounidense). Consultado el 27 de enero de 2025.

[56] Kerr, Dara (27 de enero de 2025). «DeepSeek hit with ‘large-scale’ cyber-attack after AI chatbot tops app stores». The Guardian (en inglés británico). ISSN 0261-3077. Consultado el 27 de enero de 2025.

[57] Tweedie, Steven; Altchek, Ana (27 de enero de 2025). «DeepSeek temporarily limited new sign-ups, citing 'large-scale malicious attacks'». Business Insider (en inglés estadounidense). Consultado el 27 de enero de 2025.

[58] Field, Matthew (27 de enero de 2025). «Chinese AI has sparked a $1 trillion panic – and it doesn't care about free speech». The Daily Telegraph (en inglés británico). ISSN 0307-1235. Consultado el 27 de enero de 2025.

[tt-59] Steinschaden, Jakob (27 de enero de 2025). «DeepSeek: This is what live censorship looks like in the Chinese AI chatbot». Trending Topics (en inglés). Consultado el 27 de enero de 2025.

[60] «The Guardian view on a global AI race: geopolitics, innovation and the rise of chaos». The Guardian (en inglés británico). 26 de enero de 2025. ISSN 0261-3077. Consultado el 27 de enero de 2025.

[61] Yang, Angela (27 de enero de 2025). «Chinese AI DeepSeek jolts Silicon Valley, giving the AI race its 'Sputnik moment'». NBC News (en inglés). Consultado el 27 de enero de 2025.

[62] Lu, Donna (28 de enero de 2025). «We tried out DeepSeek. It worked well, until we asked it about Tiananmen Square and Taiwan». The Guardian (en inglés británico). ISSN 0261-3077. Consultado el 28 de enero de 2025.

[63] Kimery, Anthony (26 de enero de 2025). «China's DeepSeek AI poses formidable cyber, data privacy threats». Biometric Update (en inglés estadounidense). Consultado el 27 de enero de 2025.

[64] Booth, Robert (28 de enero de 2025). «Experts urge caution over use of Chinese AI DeepSeek». The Guardian (en inglés británico). ISSN 0261-3077. Consultado el 28 de enero de 2025.

[65] Hornby, Rael (28 de enero de 2025). «DeepSeek's success has painted a huge TikTok-shaped target on its back». LaptopMag (en inglés). Consultado el 28 de enero de 2025.

[66] «Privacy policy». Open AI (en inglés estadounidense). Consultado el 28 de enero de 2025.

[67] Burgess, Matt. «DeepSeek's Popular AI App Is Explicitly Sending US Data to China». Wired (en inglés estadounidense). ISSN 1059-1028. Consultado el 28 de enero de 2025.

[68] «Italy regulator seeks information from DeepSeek on data protection». Reuters. 28 de enero de 2025. Consultado el 28 de enero de 2025.

[69] Shalal, Andrea (28 de enero de 2025). «White House evaluates effect of China AI app DeepSeek on national security, official says». Reuters. Consultado el 28 de enero de 2025.

[70] deepseek-ai/DeepSeek-R1, DeepSeek, 29 de enero de 2025, consultado el 29 de enero de 2025 .

[1]

[2]

[3]

[4]

[5]

[6]

[7]

[8]

[9]

[10]

[11]

[12]

[13]

[14]

[15]

[16]

[17]

[18]

[19]

[20]

[21]

[22]

[23]

[24]

[25]

[26]

[27]

[28]

[29]

[30]

[31]

[32]

[33]

[34]

[35]

[36]

[37]

[38]

[39]

[40]

[41]

[42]

[43]

[44]

[45]

[46]

[47]

[48]

[49]

[50]

[51]

[52]

[53]

[54]

[55]

[56]

[57]

[58]

[59]

[60]

[61]

[62]

[63]

[64]

[65]

[66]

[67]

[68]

[69]

[70]