开源社区

Kimi熹妃回宫

Kimi熹妃回宫

  • 发布:
  • 人气: 15
  • 评论: 0

应用介绍

  借助前几天发布的Kimi K2,月之暗面强势归来。海外技术论坛热议,黄仁勋点赞,马斯克评论,都在为月之暗面加冕,让它又成了“AI大模型这条街上最靓的仔”。

  而月之暗面、阶跃星辰、智谱AI们在沉寂多时后的回归,无疑为观察后DeepSeek时代的中国AI创业公司走向提供了切片。

  大浪淘沙,“AI六小虎”很快脱颖而出,成了业内瞩目的头部玩家。2023年全年,“AI六小虎”累计融资占到了国产大模型厂商的逾50%。

  细究起来:智谱AI的B端生态、阶跃星辰的多模态终端Agent、MiniMax的MoE混合专家模型……几家明星创企各擅胜场。

  而月之暗面更是在2024年3月因为长文本能力引爆概念股。长文本能力就像九阴真经,帮Kimi一战封神。在一众卷参数规模的大模型中极具辨识度的Kimi,迅速火爆出圈。

  两个月后,腾讯在红杉中国、美团、阿里后的参投,将其估值推至33亿美元,月之暗面一时风头无两。

  如果没有后来的情节,围绕Kimi的叙事还会沿着“一个天才少年带着一家明星创企会当凌绝顶”的脉络延续下去,AI创业公司们会呈现出“张华考上了北京大学,李萍进了中等技术学校……我们都有光明的前途”的走向。

  “AI六小虎”中,曾表示底层模型将对标OpenAI的百川智能,自2024年起停止了超大规模通用模型训练,转而深耕医疗领域;号称要做“打造AI 2.0全新平台”的零一万物,2024年底对整个预训练算法团队进行了裁撤,Infra团队被阿里云接收。

  背靠G端资源的智谱与阶跃星辰,越来越多地押注政企市场。Minimax发力多模态,还部分转向海外市场。

  对AGI痴心不改的月之暗面,下半年的技术重心似乎完全转到了“强化学习”,陆续发了数学模型、视觉思考模型,同时采用了激进的产品推广投放策略,避免Kimi在与同样面向C端的的豆包等产品的竞争中落下风。

  更大的变局由DeepSeek开启。今年初DeepSeek R1的横空出世,改变了本已成型的大模型行业格局。凭着“新架构+低成本+开源生态”,DeepSeek成功登顶。

  大模型产品市占率有幂次分布效应,舆论场有频域遮蔽效应。在DeepSeek“国运级成果”的风头下,曾稳居C位的“AI六小虎”,俨然已沦为陪衬。

  多家退出“超大基模争霸赛”,大模型迭代速度放缓,开年后只有一家公布了融资消息……许多人拼凑出一堆“AI六小虎失意”的证据。

  月之暗面就被“亮瑜”对比压着。Kimi1.5推理模型跟DeepSeek R1同日发布,但热度遭全面碾压。事情之后朝着“嬛嬛类卿但非卿”的方向演进:DeepSeek跟Kimi被拉来作对照后,“扬一抑一”的舆论臧否倾向就变成口水落在了二者头顶。

  随之而来的,是用户留存遭遇挑战。就连搜索引擎和应用商店里检索Kimi的时候,跳出来的,都是其他几家继续投流的产品。

  在今年6月的技术发布周上,MiniMax连续五天甩出覆盖底层模型、多模态技术、通用智能体等领域的五款重磅产品,包括全球首个开源混合架构推理模型 MiniMax - M1,系统展现了“模型—多模态—应用”一体化技术路线月初,正冲击IPO的智谱AI推出了会看“苏超”的开源视觉理解模型GLM-4.1V-Thinking。

  月之暗面更是憋出大招。Kimi就宛如AI圈的甄嬛,当别人都觉得她已失宠时,她用“一个更强的甄嬛回来了”打了不少人的脸。Kimi K2中的那个2,与其说是序位数,不如说是全方位升级版。

  月之暗面更是憋出大招。Kimi宛如AI圈的甄嬛,当别人都觉得她已失宠时,她用“一个更强的甄嬛回来了”打了不少人的脸。

  在C端用户对高专业门槛的技术革新感知偏弱的情况下,很多人未必清楚Kimi K2在代码、智能体、工具调用等测试中做到开源SOTA(表现最好)是什么概念。

  在大众对AI叙事中“最强”“炸裂”之类的震惊体已免疫的背景下,很多人也未必理解Kimi K2在OpenRouter平台上上线仅两天Token消耗量就超越xAI、登顶全球API调用增长榜,在Cline、Roo Code、Kilo Code等平台的API使用量在全球开源模型中排名最高,意味着什么。

  但黄仁勋受访时说“DeepSeek R1、Qwen、Kimi是全球最好的开源模型”,美国有媒体报道称,Kimi K2在基准测试中超越Claude Opus 4、优于OpenAI的GPT-4.1且成本更低,已说明了很多事情。

  《自然》杂志网站更是将Kimi K2发布称为“世界迎来又一个DeepSeek时刻”,满满的都是“Make Kimi Great Again”既视感。

  接下来,还要几家要出牌。看着Kimi K2在全球科技圈激起的反响,许多人已期待值拉满:你们还有多少是朕不知道的惊喜?

  Kimi K2推出后,独角兽Perplexity CEO阿拉温德在社交媒体表示,基于Kimi K2模型的出色表现,公司将会利用K2进行后训练,上一个被该公司用于技术训练的中国模型,是DeepSeek R1;全球最大开源AI社区Hugging Face联合创始人托马斯表示,不断突破极限挑战闭源的K2模型令人难以置信。

  有意思的是,7月14日,美国知名AI研究员内森·兰博特写了篇题为《Kimi K2和当DeepSeek时刻成为常态》的文章。

  文中直言,Kimi K2已经能与美国领先的前沿模型竞争,“中国正在不断逼近甚至达到模型性能的绝对前沿,我们正处于‘失败’的节奏中,西方已在开源模型方面进一步落后。”

  他表示,“斯普特尼克1号证明了苏联能突破地球引力,打破西方技术主导。四年后,东方1号航天器载着尤里·加加林绕地球飞行一圈,证实斯普特尼克并非偶然事件。在如今的人工智能领域,DeepSeek扮演了斯普特尼克的角色,而现在,人工智能迎来了它的东方1号航天器时刻。”

  话语间隐约透露出一层意思:DeepSeek和Kimi就是这两颗闪耀世界的中国AI双子星,并给美国又了上一课。

  从DeepSeek R1到Kimi K2的起势,不是偶然:不论DeepSeek还是月之暗面,都在持续蓄势,也数次在顶峰相会。

  今年2月份,梁文锋和杨植麟二人差不多同一天发布论文,研究的都是Transformer架构最核心的注意力机制;4月份,月之暗面推出用于形式化定理证明的大模型Kimina-Prover,DeepSeek也紧接着上线了数学定理证明专用模型DeepSeek-Prover-V2力压Kimi,再到7月,Kimina-Prover-7B-Distil继续更新,实现反超。

  某种程度上,从DeepSeek时刻到现在的Kimi时刻,都为中国AI创业公司崛起提供了路径指引:最关键的,还是在原始创新上蓄势。

  《甄嬛传》里,甄嬛回宫前说过一句:“与其心生敬佩,不如自己便是那样的人。”“那样”指的是能掌控自己命运。

  喜欢摇滚乐队平克·弗洛伊德的专辑《The Dark Side of the Moon(月之暗面)》,听过他们唱的“不要坐下,挖到另一个的时间到了……只有驾驭那浪潮的时候,才能在巨浪中取得平衡”的杨植麟,用Kimi K2表明,他在努力成为“那样的人”。

  中国AI创业公司难免会走向分化、前景各异,但可以肯定的是——Kimi“熹妃回宫”,其他小龙小虎也在继续“秀操作”,这部大戏,精彩还在后头。

相关应用