DeepSeek爆火一周年的寂静

  这个春节,在所有人都盯着 DeepSeek,会不会再度搞事情的时候,DeepSeek 罕见地保持了沉默。

  这下子,中国 AI 圈的画风就有些割裂了。一边是智谱、千问、即梦纷纷亮剑,接连发布新模型,争先恐后地展示技术进步。而另一边,则是 DeepSeek 新模型缺席春节假期,与一年前 R1 横空出世、引爆全球关注的高光姿态,形成了鲜明对比。

  恰逢 R1 爆火一周年的时刻,我们回溯了过去一年 DeepSeek 的动向,会发现 V3、DeepSeekMath 等系列模型,都未能复刻初代 R1 的核爆效应。当初那个被冠以国运级创新、算力焦虑终结者光环的 DeepSeek,在 2025 年的发展轨迹,似乎经历了一场预期的落空。

  DeepSeek 的高开低走,是一种刻意的寂静,更像是幻方量化的主动选择。读懂这份选择与背后的考量,或许是读懂当下中国 AI 发展复杂性的一把钥匙。

  2025 年 2 月底,R1 石破天惊地打开了局面,创下了中国 AI 模型前所未有的高度。自此,DeepSeek 公众热度曲线一路向下,再也未能复现年初的辉煌。

  DeepSeek R1 的影响力,不用赘述,问世之后长达数月的时间里,创造了消费级 AI 应用增长速度的新纪录,全国各地也都在反思和探讨,为什么自己没能孵化出幻方量化这样的科技企业。这种现象级的社会影响力,至今都是独一无二的。

  但后续发布模型的热度,都无法跟 R1 相比。是 DeepSeek 的技术产品力不行了吗?

  并不是。

  应用层面,DeepSeek 的留存率和日活量仍稳居 AI 应用榜单前列,与第二梯队形成了断层式的领先优势,说明用户并没有大规模流失。

  技术层面,DeepSeek 在 2025 年保持着高频的模型迭代。2025 年 3 月 24 日,DeepSeek-V3-0324 发布;5 月,旗舰模型 R1 完成迭代升级;9 月 29 日,首个垂直领域专业模型 DeepSeek-OCR 发布;11 月 27 日,推出第二代数学专业模型 DeepSeekMath V2。在顶级大模型竞赛中始终位于第一梯队,技术创新也没有停滞。

  行业影响力方面,DeepSeek 积极与华为昇腾、寒武纪等国产 AI 芯片厂商展开深度合作,比如与昇腾达成了“Day0 适配”,新模型当天上线,企业当天就能在国产算力上跑起来,避免了“模型有了、算力跟不上”的尴尬。从这个角度来看,大众对 DeepSeek 解决算力问题的期待,其实也已经兑现。只不过 AI 应用浪潮全面兴起,使得算力总需求大幅激增,才让大家感觉算力仍然很紧缺。

  既然产品没走下坡路,为何 DeepSeek 无法复刻 2025 年初的盛况?这应该是幻方量化的主动选择。

  有人会提出不同观点:AI 的舞台就这么大,新选手、新模型纷纷涌现,分流了公众注意力,所以 DeepSeek 的热度就下滑了。

  这种说法有一定道理。

  DeepSeek 的鲇鱼效应下,OpenAI、谷歌等国际巨头和国内竞争对手,都加快了技术迭代与产品优化步伐。市面上涌现出了更多性能逼近甚至超越 R1 的模型,这些竞品在推广营销、产品迭代上更是不遗余力,无法让 DeepSeek 这一个热点永远占据舞台中央。

  问题在于,面对如此激烈的竞争,DeepSeek 为何按兵不动?

  DeepSeek 在 AI 竞赛中十分低调,刚刚过去的马年春节也保持了沉默,有种“不在三界内,跳出五行中”的感觉。

  低调的营销:与 OpenAI、Google 等全球 AI 巨头发布新模型时铺天盖地的媒体宣传和精心策划的发布会不同,DeepSeek 后续的发布都采用了静默发布策略。很多重要的模型更新,都没有进行大规模媒体宣传,主要在开发者社区和技术爱好者群体内传播。后续的模型都逐渐脱离了大众媒体和普通用户的视野。平时不怎么关注技术新闻的人,压根都注意不到哪个模型又“炸裂”了。

  低调的模型:R1 之后,DeepSeek 也表现出了对编码、数学等垂直领域的专注,而这类专业场景本身就很难吸引大众。比如 V3 和 DeepSeekMath 系列模型,吸引的是程序员、企业开发者,无法转化为公众热度。

  低调的产品:OpenAI 的 GPT-4o、Google 的 Gemini 以及国内的豆包、元宝、文心等产品,都在探索多模态融合与智能体。而作为一款现象级 AI chatbot 应用,DeepSeek 始终聚焦在文字、识图等单一的功能形态。没有 AI 生图、视频理解与生成、语音通话、智能体等更丰富的功能,使得 DeepSeek 无法满足用户在泛娱乐、社交、创作等场景下的需求,更在超级 AI 应用阵营中显得格格不入。DeepSeek 显然不是做不出更多功能,更像是特意在控制产品功能的无限膨胀。

  而且年初炸裂开局之后,公司创始人及核心团队就极少出现在公众视野中,并没有投入大量资源进行个人 IP 的打造,整个团队对外发声的低调,也与一些明星创业者、科技大佬做 IP 形成了鲜明对比。

  从这些特质中,我们或许可以得出一个结论:R1 的高开,是技术领先性的意外外溢,实力藏不住了。而低走的 2025,则是 DeepSeek 在市场狂热之后的主动降噪。

  当下,互联网巨头们为了争抢超级 AI 应用入口,发红包、做地推、去村口刷广告,都在主动抢夺更大的声量,恨不得把“下载 XX”的横幅挂到月亮上。幻方量化没有经营和助推 R1 带来的市场声量,好像是一种失败,也有人解读为技术情怀。

  在这种放弃的背后,我们更多看到的是,AI 产业的复杂一面。

  一度处于全球 AI 核心位置的 DeepSeek,当务之急不是追求更高的热度、更大的声量,反而应该对各种雷区保持清醒、主动规避。

  雷区一:急功近利。

  DeepSeek R1 的热度,和“国运级创新”的舆论说辞,无形中拔高了大众对 DeepSeek 的预期和关注度,使其必须承担起社会责任和政治担当,不能只是追求商业效益或流量。回归技术的纯粹性,在基础创新领域取得根本性突破,价值将远超在应用层面的微创新,这也更符合企业长期发展的要求。

  同样是现象级产品,Manus 爆火之后前往新加坡、出售却遭遇审查的现象,与幻方量化的技术理想之路,形成了这个时代的某种对照。

  雷区二:树大招风。

  DeepSeek 的成功被赋予了特殊的象征意义,被视为中国在关键核心技术领域实现自主可控和独立创新的力证。过度高调,容易招到敌意和打压。DeepSeek 通过静默的方式发布最新模型成果,将讨论焦点维持在技术社区内部,避免引发不必要的对抗情绪,为自身争取到更宽松的发展空间。

  在开源社区中,DS 的技术极客形象,展现出的是一种开放、合作的姿态,降低了海外用户对模型中立性和独立性的顾虑,增强了全球用户对国产模型的信任。通过开源和与全球开发者社区的互动。

  所以,DeepSeek 的刻意低调,也是在复杂政治博弈环境中的一种生存智慧。

  雷区三:独木难支。

  各行各业的智能化,不是靠一个模型、一家公司之力所能完成,尤其幻方量化还是一家偏金融属性的金融科技公司。而 R1 爆火之后,对 DeepSeek 的神话和追捧,已经对其他模型厂商造成了挤压。比如有的企业明确要求接入 DeepSeek,觉得其他大模型都不行。

  如果 DeepSeek 持续高调,吸引了过多焦点,势必会影响其他 AI 模型的发展,也会让幻方量化在行业合作中陷入尴尬境地。2025 年,部分金融、政务、医疗等领域的机构已明确发文要求,不得只押注于某一个大模型,而应采用多模型并行方案,可见模型多元化发展,才是行业所期待的。所以,刻意低调,回归底座定位,是规避与同行冲突的明智之举。

  保持低调,是回归技术纯粹的抉择,也是在地缘政治夹缝中审慎前行、穿越雷区的一种保护色。这或许是很长一段时间里,中国 AI 都会面临的某种复杂和真实。