深度求索

深度求索
深度求索
DeepSeek
原文名称	杭州深度求索人工智能基础技术研究有限公司
公司類型	私人公司
成立	2023年5月，19個月前
創辦人	梁文锋;
總部	中國浙江省杭州市
产业	信息技术
所有權者	幻方量化
网站	deepseek.com

深度求索（全称杭州深度求索人工智能基础技术研究有限公司，英文简称DeepSeek）是中国人工智能以及大型语言模型公司，其创始人和CEO为梁文锋。

沿革

DeepSeek成立于2023年7月，由中国对冲基金幻方量化创立，其创始人和CEO为梁文锋，公司的总部位于中國浙江省杭州市，公司专注于AI大模型的研究和开发^[1]。

2024年5月，DeepSeek发布并开源^[2]了旗下MoE大模型 DeepSeek-V2，因其模型架构与经济性而脱颖而出，DeepSeek-V2的API定价为每百万tokens输入1元、输出2元，价格仅为GPT-4 Turbo的百分之一^[1]^[3]。

2024年12月，DeepSeek发布并开源^[4]了DeepSeek-V3，DeepSeek表示该大模型的训练系基于2,048块英伟达H800型GPU（针对中国市场的低配版GPU）集群上运行55天完成，训练耗资557.6万美元^[5]；DeepSeek-V3的评测成绩超越Qwen2.5-72B（阿里自研大模型）和Llama 3.1-405B（Meta自研大模型）等开源模型，能与GPT-4o、Claude 3.5-Sonnet（Anthropic自研大模型）等闭源模型相抗衡^[1]。

2025年1月20日， DeepSeek发布并开源^[6]了DeepSeek-R1模型，该模型在数学、代码、自然语言推理等任务上，性能超越OpenAI o1正式版^[1]。

参考文献

^ ^1.0 ^1.1 ^1.2 ^1.3 量化巨头幻方创始人梁文锋参加总理座谈会并发言，他还创办了“AI界拼多多”. 新浪财经. 2025-01-22 [2025-01-22] （中文）.
^ DeepSeek. DeepSeek-V2: A Strong, Economical, 和 Efficient Mixture-of-Experts Language Model. github. 2024-05-06.
^ 大模型价格又砍一刀这次“屠夫”竟是量化私募？. 财联社. 2024-05-10 [2025-01-22] （中文）.
^ DeepSeek. DeepSeek-V3. github.
^ DeepSeek. DeepSeek-V3 Technical Report (PDF). github. 2024-12-26 [2025-01-24] （英语）.
^ DeepSeek-R1. github. 2025-01-20 [2025-01-24] （英语）.

外部链接

与深度求索发布的大语言模型开启对话

[v421-1] 1.0 ^1.1 ^1.2 ^1.3 量化巨头幻方创始人梁文锋参加总理座谈会并发言，他还创办了“AI界拼多多”. 新浪财经. 2025-01-22 [2025-01-22] （中文）.

[2] DeepSeek. DeepSeek-V2: A Strong, Economical, 和 Efficient Mixture-of-Experts Language Model. github. 2024-05-06.

[k794-3] 大模型价格又砍一刀这次“屠夫”竟是量化私募？. 财联社. 2024-05-10 [2025-01-22] （中文）.

[4] DeepSeek. DeepSeek-V3. github.

[5] DeepSeek. DeepSeek-V3 Technical Report (PDF). github. 2024-12-26 [2025-01-24] （英语）.

[6] DeepSeek-R1. github. 2025-01-20 [2025-01-24] （英语）.

[1]

[2]

[3]

[4]

[5]

[6]

深度求索

沿革

参考文献

外部链接

Portal di Ensiklopedia Dunia