更新时间:2026-01-19 00:21 来源:牛马见闻
Thinking MachinesThinking Machines Lab就是这种情况因此
<p id="48I20QNB">在即将到!来的1月27日—?—也就是“DeepSeek时刻”一周年之际,全球AI社区都期待DeepSeek再来个大招。</p> <p id="48I20QNC">市场喧嚣期待之时,知名科技评论作者Kevin Xu发布长文对DeepSeek的商业模式、护城河进行了分析,在AI圈内引起了很大反响。</p> <p id="48I20QND"><strong>他认为,DeepSeek最坚固的护城河,是它零外部融资、无商业化压力的独特模式。在全球AI巨头都被资本裹挟着必须赚钱的时候,DeepSeek是唯一一个可以不计成本、不看脸色、只为AGI梦想狂奔的“自由人”。</strong></p> <p id="48I20QNE"><strong>Kevin S. Xu(徐凯文)</strong>是专注中美科技与资本交叉领域的独立观察者,知名科技评论人。他创办的ChinaTalk播客及Newsletter在专业圈层颇具影响力,擅长从资本流向、组织行为与地缘政治多维度解构技术演进逻辑。</p> <p id="48I20QNF">我们给大家梳理了一下文章要点:</p> <p></p> <ul> <strong>给市场预期泼盆冷水</strong>:虽然大家都在等DeepSeek的新模型,但作者直言“不要指望它能像去年那样再次震惊世界”。因为现在的市场已经被“开源模型”喂饱了,DeepSeek虽然打响了第一枪,但现在并不是唯一、也不是最开源的玩家了(比如它至今没开源数据集)。 <strong>唯一的“零融资”异类</strong>:现在的AI圈就是“销金窟”,连马斯克都没扛住,最近也给xAI融了一笔高达200亿美元的巨资。但DeepSeek的老板梁文锋至今坚持“零外部融资”,这在所有顶尖实验室里是独一份的,他把控制权看得比钱重。 <strong>超级“印钞机”兜底</strong>:梁文锋能这么硬气,是因为他背后的量化基金“幻方量化”太赚钱了。去年,幻方以53%的回报率赚了超7亿美元(约50亿人民币)的利润。梁文锋直接把这些钱拿来买显卡、招人,这种用“老钱”养“新梦”的模式,让他完全不需要看投资人的脸色。 <strong>被VC拒绝反而是福报</strong>:2023年DeepSeek刚成立时其实找过融资,但当时国内VC普遍短视、不敢投,结果这反而成了“塞翁失马”。作者认为,一旦拿了VC的钱,就必须背上商业化KPI,动作就会变形,而现在的DeepSeek只需要对技术负责,不需要对财报负责。 <strong>“钱多”麻烦多</strong>:这是一个非常深刻的洞察——钱太多会滋生“大公司病”。作者举了个很讽刺的例子:有些富得流油的实验室(比如Thinking Machines),甚至在办公室健身房里用上了<strong>印着自家Logo的定制杠铃片</strong>。这种浮夸的排场背后,是员工盯着期权带来的“纸面富贵”,部门之间为了争夺算力资源搞“宫斗”。而DeepSeek因为没有外部估值,团队极度扁平,没有资源内耗。 <strong>算力不是万能药</strong>:文章引用了前OpenAI大神Ilya Sutskever的观点——<strong>真正的颠覆性创新往往不需要无限堆算力</strong>。Transformer架构当年只用了8到64张卡就跑出来了。钱太多反而会让团队变懒,以为堆算力就能解决一切,从而失去了“科研品味”。 <strong>投资人的终极悖论</strong>:最后,作者站在一位投资人的角度发出了一声叹息——作为一个投资人,他做梦都想投DeepSeek;但他心里也清楚,<strong>一旦DeepSeek接受了外部投资,那种纯粹的特质就会消失了</strong> </ul> <p id="48I20QNG">作者原文如下(由AI翻译):</p> <p></p> <blockquote id="48I20QOI"> <strong>没有商业模式:DeepSeek的长期优势</strong><br>作者:Kevin S. Xu<br>随着1月27日“DeepSeek时刻(DeepSeek Moment)”一周年纪念日的临近,市场对于DeepSeek在农历新年(2月17日)前发布一款更强大新模型的期待正日益高涨。<br>然而,过高的期望几乎注定会带来失望。虽然我也急切地等待着这款新模型,想看看DeepSeek究竟在忙些什么,但我并不预期它会像一年前那样再次震惊市场。整个AI行业乃至更广泛的市场,已经习惯了每隔一两个月就有一款新的“开放权重”模型发布,尤其是来自中国实验室的模型,它们即便算不上最尖端,也往往表现扎实。凭借着开放和免费的特性,这些模型正以一种无法追踪和溯源的方式在各地获得牵引力——这也是开源技术整体上的一种美德(或者说是缺陷)。正如英伟达CEO黄仁勋喜欢说的那样,以Token生成量计算,世界上最大的AI仍然是OpenAI,但第二大的,是开源AI。<br>DeepSeek或许在去年通过发布V3和R1打响了MIT License许可的开源模型的第一枪,但其他实验室迅速跟进,从同样来自中国的竞争对手阿里巴巴及其Qwen(通义千问)模型系列,到OpenAI推出的gpt-oss模型。(两者均使用Apache 2.0许可,这是另一种常见的开源宽松许可。)正如我之前指出的,<strong>如果不是因为DeepSeek,OpenAI可能永远不会感受到压力,从而去兑现其开源根源的承诺,哪怕只是口头上的,比如发布gpt-oss。</strong>虽然DeepSeek继续开源其模型的权重以及各种工具和库,但它已不再是市场上最开放的实验室,因为它从未开放过其用于训练模型的数据集或主代码库。<br>根据Artificial Analysis的数据,目前全球开放程度排名前三的模型分别来自NVIDIA(Nemotron 3)、Allen Institute(Olmo 3)和穆罕默德·本·扎耶德人工智能大学(MBZUAI,K2-V2)。<br><br>因此,DeepSeek的模型不再是开放模型中能力最强的,不再是最便宜的,甚至也不再是最开放的。那么,是否还有一个充分的理由,让我们继续给予这个曾经震惊世界的实验室超乎寻常的关注?<br>是的,我认为有。但不是因为它的模型或技术进步,而是因为其内部的激励机制和商业模式。更确切地说,<strong>我们应该关注DeepSeek,因为它没有商业模式</strong>——在中国、美国及其他地区的所有前沿实验室中,这是一个独特且反直觉的特性,而非缺陷。<br>1. 自筹资金支撑的 AGI 梦想早在DeepSeek迎来其“高光时刻”并成为家喻户晓的名字之前的几周,我首次撰写关于DeepSeek的文章时(当时也在ChinaTalk播客上讨论过),就提到了这种“无商业模式优势”。值得注意的是,当整个AI世界都被资本淹没时,这种优势竟表现得如此顽固且持久。<br>梁文锋没有筹集任何外部资金。该实验室确实通过其API服务产生一些收入,但仍在不断降低定价。梁文锋满足于用他的量化基金——幻方量化的收益来资助DeepSeek的研发,正是幻方量化最初孵化了DeepSeek。需要明确的是,梁文锋在2023年ChatGPT推出几个月后想要创办DeepSeek时,确实曾尝试从中国投资者那里筹集风险投资。但他那“笃信AGI(AGI-pilled)”的理想主义,加上缺乏商业计划书,以及中国VC著名的短视和风险厌恶,导致了那次融资努力的失败——但这反而塞翁失马,焉知非福。<br>随着2025年的飞逝,为了不错过更多潜在的进步,越来越多的资金涌入,资助了更多的AI进展。每一个哪怕只有一点点牵引力的实验室都筹集了更多的钱,随之而来的是对未来商业化的更多期望。一批所谓的“AI新实验室”——由明星研究员领导的、风投支持的纯研究实验室——如雨后春笋般涌现,例如Thinking Machines Lab(Mira Murati)、SSI(Ilya Sutskever)和AMI Labs(Yann LeCun)。甚至连我过去常拿来与DeepSeek做最紧密类比的xAI——因为它们同样缺乏商业化的紧迫性——也屈服于外部资本的诱惑。几天前,埃隆·马斯克(Elon Musk)的实验室完成了一轮200亿美元的E轮融资,资金结构包含了股权和债权。<br>即便是世界上最富有的人之一,也无法对更多的钱说“不”!与此同时,梁文锋继续自筹资金维持他那神秘的店铺和他的AGI梦想。当然,梁文锋的量化基金去年业绩辉煌,以53%的回报率创造了超过7亿美元的利润,这无疑提供了巨大帮助。据推测,这些利润的大部分都投入到了购买更多GPU(尽管面临美国的出口管制,但尽其所能)和招聘人才上,以继续推动DeepSeek的研究路线图。尽管如此,在DeepSeek获得全球知名度并在AI行业实现100%的品牌认知度之后,筹集一二十亿美元以加速其步伐本应是轻而易举的事。无论你爱它还是恨它,每个人都听说过它。<br>然而,对外部资金说“不”,让你能够掌控自己的命运。如果你的自定命运是“致力于让AGI成为现实……用好奇心解开AGI之谜……用长期主义回答本质问题”——这是DeepSeek在HuggingFace页面上的标语——那么用较少的资金换取完全的控制权是一个值得的权衡。当然,你也可以通过一些“公司治理创新”来达到目的。Thinking Machines Lab就是这种情况,创始人的1票投票权价值比所有其他董事会成员的票数总和还多1票,从而实际上拥有完全控制权。<strong>但无论你在董事会层面如何“创新”,一旦你接受了风险投资,为了产生风投规模的回报而进行的大规模商业化,迟早是会被期待的。</strong><br>DeepSeek没有任何这些预期。因此,它没有商业模式,也不需要商业模式。通往AGI的道路需要算力、人才,以及相当剂量的良好研究品味。没人规定它必须需要一个商业模式。<br>2. 钱多麻烦多,没钱没烦恼当然,筹集更多资金最常见的理由是为了购买更多的算力来支持研究。然而,并不显见的是,要产出好的研究成果,更多的算力总是必要的。<br>这一洞察并非DeepSeek那独特的自筹资金架构所独有。Ilya Sutskever,这位可以说是拥有最佳研究品味的AI研究员,也表示同意。他在Dwarkesh播客中用自己的话说道:<br><blockquote id="48I20QOJ">“算力规模已经足够大,以至于并不显见你需要那么多额外的算力来证明某个想法。我给你打个比方。AlexNet是建立在两块GPU上的。那是用于它的总算力。Transformer是建立在8到64块GPU上的。2017年没有哪篇Transformer论文的实验使用了超过64块GPU,这相当于什么,今天的两块GPU?ResNet也是如此,对吧?你可以争辩说,o1推理模型(o1 reasoning)并不是世界上最耗算力的东西。<br>因此,对于研究来说,你绝对需要一定量的算力,但远非显而易见的是,你需要绝对最大量的算力来进行研究。”<br> </blockquote> <p id="48I20QO4">另一方面,通过消除外部资金的附带条件,以及“仅仅因为有钱就必须购买更多算力”的必要性,两种组织层面的优势显现出来。而DeepSeek两者兼备。</p> <p id="48I20QO5"><strong>首先,即使资源更加有限,内部也不存在资源竞争。</strong>这里没有官僚主义、内斗、权力斗争,也没有为了决定GPU是应该支持新产品发布、扩展现有流行服务的推理需求,还是分配给一个新的研究想法而进行的利益交换。在一个没有外部资金、没有商业模式的小型实验室里,良好的研究品味和新想法可以得到最大程度的支持和拥抱,即使绝对层面上的总算力是有限的。</p> <p id="48I20QO6"><strong>其次,基于薪酬、津贴或团队获得的算力多少而产生的嫉妒和等级秩序更少,而这些往往是有毒的,却根植于人性之中。</strong>你的组织瞬间变得扁平,并且可以保持扁平。伴随外部资金而来的不仅是商业模式的期望,还有估值、股票期权,以及一个高估值AI实验室所有的浮华装饰,无论这种估值在早期是多么没有意义。来自梦幻估值的纸面财富往往会让位于膨胀的自我价值感、嫉妒,以及被资金更雄厚的竞争对手挖角。这些浮华装饰不仅仅关乎个人财富创造,还与实验室的品牌、声望和吸引更多人才的魅力捆绑在一起。而这些装饰可能会变得相当荒谬,比如该实验室办公室健身房里那些印有“Thinking Machines”品牌的杠铃片:</p> <p class="f_center"><br></p> <p id="48I20QO8">DeepSeek有自己的健身房吗?我不知道。可能有。但我很确定它没有印着品牌的杠铃片。Ilya Sutskever是否希望他能像梁文锋一样自筹资金来运营SSI(迄今已筹集30亿美元)?可能吧。他可能拥有最好的直觉和研究品味,但他无法阻止挖角者——甚至他的联合创始人CEO也被Meta财力更雄厚的扎克伯格挖走了。这并不是说DeepSeek对挖角免疫。其明星研究员之一罗福莉,现在正领导着财力更雄厚的雷军旗下小米的AI工作。</p> <p id="48I20QO9">在一个被金钱淹没的行业,以及金钱总是带来的阴谋和戏剧性中,DeepSeek因零外部资金而导致的商业模式缺失,是其唯一持久优势的源泉:<strong>为服务于AGI研究而实现的内部最大化对齐,别无其他。</strong></p> <p id="48I20QOA">我甚至不确定我是否相信AGI。但作为一名投资者和资本家,我很乐意进入DeepSeek的股东名册。话虽如此,如果DeepSeek曾经让我或任何外部投资者进入,那么让DeepSeek之所以成为DeepSeek的特质,将彻底毁掉,不复存在。</p> <p></p> </blockquote>
Copyright ® 版权 所有:吉林日报
违法和不良信息举报邮箱:dajilinwang@163.com 违法和不良信息举报: 0431-88600010
ICP备案号:吉ICP备18006035号 网络经营许可证号:吉B-2-4-20100020
地址:长春市高新技术产业开发区火炬路1518号 爆料电话:0431-88601901