引言

在人工智能的浪潮中,DeepSeek 的 R1 模型以其强大的性能和独特的技术架构,迅速在全球 AI 领域崭露头角,甚至被誉为国产大模型的“技术奇点”。那么,DeepSeek 究竟是如何炼成的?它能做什么?我们又该如何利用它呢?

DeepSeek 的优势、影响力与市场地位

DeepSeek R1 模型在技术领域的表现堪称卓越,尤其是在高难度提示词处理、代码生成和数学推理等复杂任务中,其能力远超同类产品。令人瞩目的是,训练这样一款顶尖模型仅需 2048 块 H800 显卡和 600 万美元的成本,这一数字仅为国际同行的 1/18,展现了极高的效率与性价比。

然而,DeepSeek 的火爆并不仅仅源于其技术实力,其独特之处在于两点:

  1. 开源策略
  2. 低算力需求

DeepSeek 的成功可以说是开源精神的胜利。它的工具源于开源社区,最终又回馈于开源社区。开源不仅让开发者能够站在巨人的肩膀上,也为后来者提供了攀登的阶梯。通过开源,更多开发者可以参与到模型的微调与训练中,从而推动技术的不断进步。而低算力需求则让这一技术更易于普及,真正惠及大众。正如电灯的发明改变了人类生活,技术的伟大在于其普世价值。至于 DeepSeek 对市场的冲击,从英伟达股价下跌 17%、市值蒸发约 5900 亿美元的数据中可见一斑。

关于开源,梁文锋有一段访谈发言让我很受感动[3]:

暗涌:但你们究竟是一个商业组织,而非一个公益科研机构,选择创新,又通过开源分享出去,那要在哪里形成护城河?像 2024 年 5 月这次 MLA 架构的创新,也会很快被其他家 copy 吧?

梁文锋:在颠覆性的技术面前,闭源形成的护城河是短暂的。即使 OpenAI 闭源,也无法阻止被别人赶超。所以我们把价值沉淀在团队上,我们的同事在这个过程中得到成长,积累很多 know-how, 形成可以创新的组织和文化,就是我们的护城河。

此外,DeepSeek 还有一个不可忽视的亮点:它是国产 AI 的杰出代表。它打破了美国在 AI 领域的绝对领先地位,并对 GPT、Claude、Gemini 等严格封锁政策进行了有力回击(尽管部分原因是服务器宕机,但至少让美国也体验了一把被“封锁”的感觉,笑)。

DeepSeek 和幻方,和老板,和员工构成

DeepSeek 能够在当下这个时间点崛起,与其历史背景密不可分。

DeepSeek 由梁文锋创立,而梁文锋此前也是幻方量化的创始人。幻方量化成立于 2015 年,最初是一家专注于利用 AI 进行投资的对冲基金。

2023 年,DeepSeek 作为一家独立公司成立,专注于大模型技术的开发,而梁文锋持有约 83.37% 的股份,是公司的主要控制者。

DeepSeek 与其他公司最大的不同就是员工构成方面:

员工人数不足 140 人,与 OpenAI 等大型竞争对手相比,规模仅为后者的 10%。主要招聘来自中国顶尖高校(如北大、清华等)的应届毕业生和博士生,注重培养本土人才,而非依赖海外专家。不看业绩,没有任务,没有 kpi, 只有向最难的问题创新。

暗涌:但你们不参与融资,很少对外发声,社会声量上肯定不如那些融资活跃的公司,怎么确保 DeepSeek 就是做大模型的人的首选?

梁文锋:因为我们在做最难的事。对顶级人才吸引最大的,肯定是去解决世界上最难的问题。其实,顶尖人才在中国是被低估的。因为整个社会层面的硬核创新太少了,使得他们没有机会被识别出来。我们在做最难的事,对他们就是有吸引力的。

暗涌:这种发散性灵感的诞生和你们完全创新型组织的架构很有关系。幻方时代,你们就很少自上而下地指派目标或任务。但 AGI 这种充满不确定性的前沿探索,是否多了管理动作?

梁文锋:DeepSeek 也全是自下而上。而且我们一般不前置分工,而是自然分工。每个人有自己独特的成长经历,都是自带想法的,不需要 push 他。探索过程中,他遇到问题,自己就会拉人讨论。不过当一个 idea 显示出潜力,我们也会自上而下地去调配资源。

待遇方面,DeepSeek 对员工的薪酬相对优厚,采取“一年 14 薪”的模式。核心岗位的薪资可达月薪 11 万元人民币,年薪超过百万。此外,公司还提供实习机会,日薪为 500 元,并有转正名额。

DeepSeek 的使用方法

网页使用

接下来介绍 DeepSeek 最核心的功能:

“深度思考”和联网搜索。

  1. 深度思考:用户只需选中输入框下的按钮,就能使模型获得思考能力并在思考后作答。这一功能可以让 ai 理解复杂内容,特别适合学术研究、新闻阅读或技术文档分析等场景,并极大增强了回答准确性和可用性。
  2. 联网搜索:DeepSeek V2.5 版本新增了联网搜索功能,能够从网络信息中提取数据并进行分析,提供更全面、个性化的答案。

这两项功能在用户体验上表现非常出色,既准确又高效。然而,最近 DeepSeek 的深度思考和联网搜索功能都出现了无法使用的情况。用户在尝试时会收到“由于技术原因,联网搜索暂不可用”或“服务器繁忙,请稍后再试”的提示。

总的来说,尽管 DeepSeek 提供了强大的工具和功能,但目前的技术问题确实影响了用户体验。希望未来能尽快解决这些问题,恢复其高效的服务。

API

简单来说,API 是一种接口。你传入一些内容,它就会返回相应的结果。通过这项技术,开发者可以轻松在自己的应用中集成自然语言处理(NLP)、自然语言理解(NLU)和自然语言生成(NLG)等功能,而不需要深入了解模型背后的复杂结构或训练过程。

如果你关注过 LLM 领域,可能还记得 DeepSeek 上一次火爆的原因——它便宜。没错,它真的很便宜。据梁文锋透露,他们只是定了一个能回本的价格,结果却引发了大模型行业的价格战。这无疑是一件值得高兴的事。

然而,目前官方的 API 几乎处于不可用的状态。

硅基流动 (SiliconFlow)

市面上有不少可用的 API 供应商,比如 Azure、Groq,甚至英伟达。而硅基流动不仅稳定高效,还基于国产卡部署[1],尤其适合国内用户。

那么,硅基流动的 DeepSeek API 有什么特别之处呢?以下几个理由可能会让你觉得它是个不错的选择:

  1. 免费额度

如果你是第一次接触 DeepSeek R1 API,完全不用担心费用问题。硅基流动为新用户提供了免费的 API 使用额度,让你可以零风险地体验,看看它是否适合你的项目。

  1. 部署在国产卡上,稳定又安全

硅基流动的 DeepSeek R1 API 部署在国产卡上,这意味着它能为国内用户提供更低的延迟和更高的稳定性,避免了跨境数据传输带来的额外延迟。同时,国产卡的部署也确保了数据安全,完全符合国内的合规要求。

  1. 支持 DeepSeek R1 和 V3 版本

不同版本的 API 提供了不同的功能和优化。硅基流动同时支持 R1 和 V3 版本,无论是新手还是经验丰富的开发者,都能找到适合自己的接口来解决需求。

事实上,SiliconFlow 也确实是官方以外价格最低的供应商了。

想要体验 DeepSeek R1 API?其实非常简单:

  1. 点击下方的链接,注册账号。
  2. 获取你的 API 密钥。
  3. 按照文档集成 API,开始使用!

立即注册并获得免费额度

我的邀请码是jtaKtZMM

邀请码 jtaKtZMM

基于 SiliconCloud 活动,使用邀请码作为新用户完成 SiliconCloud 账号注册,可立刻获得 2000 万 Tokens。

结论

不得不说失去 r1+ 搜索的组合让我非常不适应,很多原来可以”提问”的内容现在必须自己去搜索。我可以很负责任的说,chatgpt 和 perplexiai 的联网搜索不如 deepseek 远矣,希望大家之后尽量去用一用。

最后,祝大家新年快乐,恭喜发财~

篇外

api 使用方法[1]

如果你想直接在客户端应用里体验 DeepSeek-R1 & V3 模型,可在本地安装以下产品,接入 SiliconCloud 的 API 后(可自定义添加这两款模型),即可体验 DeepSeek-R1 & V3。

大模型客户端应用:ChatBox、Cherry Studio、OneAPI、LobeChat、NextChat

代码生成应用:Cursor、Windsurf、Cline

大模型应用开发平台:Dify

AI 知识库:Obsidian AI、FastGPT

翻译插件:沉浸式翻译、欧路词典

更多场景与应用案例接入教程可参考:https://docs.siliconflow.cn/usercases/awesome-user-cases

Token 工厂 SiliconCloud Qwen2.5(7B)等 20+ 模型免费用[1]

作为一站式大模型云服务平台,SiliconCloud 致力于为开发者提供极速响应、价格亲民、品类齐全、体验丝滑的模型 API。

除了 DeepSeek-R1、DeepSeek-V3,SiliconCloud 已上架包括 Janus-Pro-7B、CosyVoice2、QVQ-72B-Preview、DeepSeek-VL2、DeepSeek-V2.5-1210、Llama-3.3-70B-Instruct、HunyuanVideo、fish-speech-1.5、Qwen2.5-7B/14B/32B/72B、FLUX.1、InternLM2.5-20B-Chat、BCE、BGE、SenseVoice-Small、GLM-4-9B-Chat 在内的数十种开源大语言模型、图片/视频生成模型、语音模型、代码/数学模型以及向量与重排序模型。平台支持开发者自由对比、组合各种模态的大模型,为你的生成式 AI 应用选择最佳实践。

引用

  1. 首发!硅基流动 x 华为云联合推出基于昇腾云的 DeepSeek R1 & V3 推理服务!
  2. DeepSeek-R1 发布是 AI 发展的一个重大转折
  3. DeepSeek 创始人专访:中国的 AI 不可能永远跟随,需要有人站到技术的前沿