DeepSeek寻求3亿美元融资，回归商业正轨能否突破多重挑战？

张开发

• 2026/6/20 21:00:32 • 15 分钟阅读

分享文章

DeepSeek传出融资消息DeepSeek终于传出了融资消息。据外媒报道DeepSeek正在寻求至少3亿美元的首轮外部融资估值至少100亿美元。字母榜向深度求索求证但对方未予回应。过去一年特殊定位与市场变化2025年初DeepSeek爆火之后投资人们曾密集寻找见梁文锋的机会但DeepSeek长期没有开放融资窗口。过去一年DeepSeek最特殊的地方恰恰在于它不像一家典型AI公司。它背后有幻方量化供血梁文锋不急着融资也不急着把公司推上估值、商业化和资本退出的流水线。DeepSeek对自己的定位与其说是一家商业公司不如说更像是一个完全独立于资本市场而运作的开源研究机构。融资传闻出现后市场马上闻风而动。投资人估计已经把梁文锋电话打爆了甚至有人已经准备订机票只为这一次能够见到梁文锋获得投资DeepSeek的机会。然而时间毕竟已经过去了一年DeepSeek自身和市场都出现了难以忽视和影响深远的变化。过去一年DeepSeek当然不能说技术上已经落后。但如果和同行相比很多同行已经做了很多DeepSeek没有做、或者没有做成体系的事情。字节有豆包、有即梦、有Seedance视频生成模型阿里和腾讯开始把世界模型推到台前腾讯元宝、阿里千问都在往各自生态里嵌智谱、MiniMax已经登陆港股并在二级市场上完成了新的估值重估。资本市场的参照系也变了。如果只看DeepSeek至少100亿美元的估值它当然还是一家很贵的AI公司。可放在今天的中国AI坐标系里这个数字已经不再惊人。智谱、MiniMax在港股高点的市值都曾突破3000亿港元按部分市场口径折算DeepSeek的百亿美元估值只是它们的一小部分而月之暗面这样的“小龙”最新估值已经达到了180亿美元。融资若属实两大意义如果这次融资三亿美元的传闻属实那对DeepSeek来说至少有两道关已经迈过去了。第一DeepSeek不再视融资为畏途。服务器、数据、算力、商业化、人才、期权每一项都不是纯研究机构可以长期绕开的东西。尤其是人才成本已经比一年前高了太多。DeepSeek过去可以靠技术理想、开源声望和梁文锋的个人号召力凝聚一批人但当郭达雅在字节获得近亿的年包时作为DeepSeek员工能不能用期权分到公司的发展红利这件事就显得格外重要。某种程度来说期权也给梁文锋减少了压力让员工拿走员工应得的那部分梁文锋自己也就无需过多操心了。第二DeepSeek正在回归一家商业公司的正常发展路径。公司的归公司。研究理想可以继续存在但公司终究需要治理结构、估值体系、薪酬激励、商业化收入和长期预算。过去DeepSeek被要求每一次发布都震撼世界。现在它需要做的反而是成为一家正常公司。模型能力与竞争短板DeepSeek的底层模型能力仍然很强。它在模型算法、工程效率、开源路线和降低推理成本上的贡献仍然是中国AI过去一年最重要的技术事件之一。R1证明了一个小团队也可以用更少资源、更开放路线做出世界级模型。然而事实上今天的AI竞争已经不是单点模型能力的竞争。DeepSeek最强的是模型本身同行则在模型之外做了更多事情。最明显的是产品入口。DeepSeek曾经是国内AI App增长最快的名字但到了2025年下半年豆包已经在月活规模上反超DeepSeek。QuestMobile的报告显示2025年8月豆包以约1.57亿月活登上中国原生AI App月活榜首DeepSeek退居第二。字节透露截止至目前豆包在2026年3月的全渠道月活跃用户已突破3.31亿是第2至第5名产品的月活总和。这说明一件事模型爆红可以带来巨大的第一波流量长期用户规模要靠产品、场景、运营和生态入口留住。字节的优势就在这里。豆包背后有抖音、剪映、火山引擎和内容生态即梦承接创作需求Seedance 2.0又把视频生成能力推到市场焦点。DeepSeek虽说在模型社区里有声望而在大众产品层面它并没有形成豆包那种持续分发和高频使用能力。多模态也是类似问题。DeepSeek做过Janus - Pro也做过DeepSeek - OCR但它还没有形成一个足够稳定、完整、强势的多模态产品体系。今天的AI竞争越来越强调文本、图像、语音、视频、工具和Agent的统一体验。OpenAI、Google、Anthropic在往这个方向走国内的字节、阿里、腾讯也在往这个方向走。阿里和腾讯开始押注世界模型就是一个很典型的信号。阿里发布Happy Oyster强调可互动、可演绎、可探索的AI数字世界腾讯发布并开源混元3D世界模型2.0面向文字、图片、视频输入生成和模拟3D世界。这些未必立刻变成成熟商业收入但它们代表了大厂正在把AI能力从聊天框、代码框往更复杂的空间、视频、游戏和内容生产场景里推。字节则是在视频生成上持续加码。Seedance 2.0发布后市场关注点已经不只是“能不能生成一段视频”而是多镜头、音画同步、叙事节奏、人物动作和生产流程。这些能力一旦和剪映、抖音、电商广告、影视制作连接起来就会形成DeepSeek目前很难复制的产品闭环。Agent和AI编程也是DeepSeek的短板。DeepSeek不是没有工具调用和agent能力但它还没有在开发者心智里形成类似Claude、GPT、Kimi、MiniMax、腾讯、阿里那样明确的生产力入口。AI编程正在成为大模型商业化最清晰的场景开发者会选择效果好、稳定性强的。以OpenClaw为例几乎没有人会用DeepSeek来养龙虾因为效果实在是不尽人意。这就是DeepSeek眼下面临的真实处境。它不是不强而是强得不够完整。它在模型效率上仍然有优势但在App入口、多模态、视频生成、世界模型、Agent、AI编程、企业服务和生态分发上都被同行拉开了距离。对一家过去以“技术奇迹”被记住的公司来说这种落差尤其刺眼。融资原因人才与商业生态需求梁文锋这次融资不能只理解成缺钱。更准确地说是梁文锋意识到单靠基础模型上已经不足以支撑下一阶段竞争。DeepSeek需要更多比如人才、服务器、以及一个更完整的商业生态。DeepSeek现在最紧迫的问题是人才。从2025年下半年开始外界陆续看到几位核心成员离开。参与早期大模型训练的王炳宣去了腾讯DeepSeek - OCR核心作者魏浩然离开DeepSeek - R1核心作者郭达雅去了字节。从幻方时期加入、参与Janus - Pro等多模态工作的阮翀也在2026年1月官宣加入元戎启行。罗福莉也已加入小米负责相关AI业务。这是DeepSeek爆红之后必然要面对的市场结果。他们的核心研究员就会成为所有大厂和AI创业公司争夺的对象。过去DeepSeek是一个理想主义团队。它的人才吸引力来自技术挑战、开源声望、研究自由和梁文锋本人。但今天AI行业的人才定价已经完全不同了顶尖的行业研究员拿到近亿年包已经成为常态。可DeepSeek没办法开出这样的价码。所以对梁文锋来说期权变得越来越重要。DeepSeek过去不融资不对外定价保持独立运作短期看可以减少外部干扰。但长期看员工手里的期权很难被清晰定价。别的公司有融资轮次、有上市预期、有二级市场价格员工至少知道自己手里的东西大概值多少钱。DeepSeek如果没有外部估值没有清晰激励体系就很难让核心人才相信自己一定能分享到公司成长红利。恒业资本创始合伙人江一表示公司需要估值定价因为大厂给人才开的不是单纯现金而是现金加高估值期权。没有明确估值DeepSeek很难让员工准确判断自己手里的期权到底对应什么未来。这也是3亿美元融资真正重要的地方。它未必是为了立刻大规模烧钱。按照江一的看法100亿美元以下的估值对梁文锋来说是偏低。正如文章开头提到的如果估值过高梁文锋自己也要背上更大的增长压力。因此这一轮融资很可能不只是拿钱更是给公司定价给团队定价也给未来的激励体系定价。DeepSeek早期的魅力正来自它没有被资本市场推着走。江一提到梁文锋本人的性格就是如此他比较反感投资人干预公司决策。对一个技术理想很强的创始人来说融资意味着新的股东、新的约束、新的沟通成本也意味着公司不可能再完全按照研究团队的节奏运转。但这也是正常公司必须面对的代价。公司的归公司员工的归员工。如果DeepSeek希望继续留住最顶尖的人它就必须让团队成员看到可兑现的未来。不能只要求他们相信模型会越来越强也要让他们相信公司越来越值钱的时候自己也能分到那部分发展红利。回归正常公司多重挑战DeepSeek要回归正常公司人才只是第一关。第二关是服务稳定性。2026年3月底DeepSeek经历了长达11小时的宕机这次宕机甚至登上热搜。模型能力再强只要它面向海量用户和开发者提供服务就必须接受商业化检验。服务器不稳最简单、最直接的方法就是花钱买更多服务器购买更多算力和冗余资源建设更强的云服务与运维体系。当然工程优化、调度策略、模型压缩、缓存机制都重要。但在高峰流量面前很多问题最后仍然会落回资金投入。用户不会因为一家公司的训练故事足够漂亮就能长期忍受不可用、排队过久或API波动。开发者也不会因为一个模型曾经震撼世界就把核心业务压在不稳定的接口上。好模型只是起点稳定服务才是日常。第三关是数据和训练成本。江一提到早期DeepSeek训练成本相对低是因为团队在模型结构、工程效率和蒸馏等方法上做得足够极致。但到了V4阶段单轮训练成本可能已经大于5亿美元。与此同时Anthropic等企业对蒸馏路径进行封锁之后DeepSeek下半年如果继续冲击第一梯队就需要采购更多高质量数据集训练成本会明显抬升。DeepSeek过去最被外界津津乐道的“低成本奇迹”不会自然延续到以后的模型里。低成本训练证明了团队能力但下一代基础模型仍然要面对很朴素的产业规律即Scaling Law。更强模型通常需要更多高质量数据、更大规模算力、更复杂的后训练系统、更高强度的评测和安全对齐。基础模型很花钱也很吃算力。越接近第一梯队边际成本越高。这还没有算上国产算力适配和合规成本。江一提到幻方量化去年收入不错今年也保持较好水平但国内围绕量化交易出现了不少监管和合规要求相关调整本身就需要投入。另一方面DeepSeek如果要适配国产算力也需要工程团队、测试体系和长期磨合。这份投入不是一次性开支而是持续消耗。第四关是商业化。过去DeepSeek的逻辑很清晰开源模型制造影响力API收费承接开发者需求优秀模型能力带来传播和调用。但这套逻辑对今天的DeepSeek来说已经不够用了。江一表示梁文锋现在想给DeepSeek找到一个完整的商业体系比如订阅制以及不同档位的API收费。生态不是把模型开源出去就自然长出来的它需要稳定API、开发者工具、企业服务、文档体系、计费体系、安全合规、客户成功和渠道合作。DeepSeek如果要从0到1撑起商业生态就必须承担基础设施建设的成本。单纯依赖开源声量和基础API收入很难支撑一家具备全球影响力的基础模型公司继续向前。商业化不是背叛技术路线而是技术路线进入长期竞争后必须补上的底座。融资必然结果与积极意义所以DeepSeek融资不是一个孤立事件。它是服务器、数据、算力、人才、期权、商业化生态叠加在一起之后的必然结果。对于像DeepSeek这样以模型能力立身的公司来说这些事物反而比估值数字本身更关键。也因此DeepSeek回到融资、估值、商业化这条“正常公司”的路径并不是退步。DeepSeek回归正常对DeepSeek是好事对梁文锋也是好事。融资不一定就代表梁文锋被资本裹挟也可以意味着一家公司终于有能力承担更长期的竞争。对用户和行业来说也该告别“DeepSeek时刻”了。真正健康的局面应该是DeepSeek继续做DeepSeek其他模型也被看见、被比较、被承认。中国AI不应该永远等待一个名字再次震撼世界而应该让很多公司在不同方向上一起往前走。放过DeepSeek也放过人们自己的执念。一家公司的成熟常常不是从掌声最响的那一天开始而是从掌声落下之后它仍然愿意去修服务器、买数据、招人、谈客户、发账单、处理宕机、重写文档、把产品一点点变稳定开始。如果DeepSeek真的走到这一步它并不是失去特殊性。它只是终于从一个被仰望的故事回到了一家公司应该站立的地面。