
杨植麟被梁文锋叫醒了!Kimi新模型发布即开源1T参数全线SOTA
应用介绍
全新Kimi K2基础大模型,MoE架构,总参数1T,激活参数32B,能力领先性尤其展现在代码、Agent、数学推理任务上。
作为DeepSeek R1发布后最大的“被冲击者”,Kimi这半年几乎遭遇到了全方位质疑:技术领先性还有吗?营销投流意义几何?以及之前非技术花边缠身——Kimi还有技术信仰吗?
Kimi K2具备稳定的复杂指令解析能力,可将需求自动拆解为一系列格式规范、可以直接执行的ToolCall结构。
全年追星计划,演唱会机酒和旅行规划它都能帮忙做,还能生成日历,用html概括完整行程规划并给你发送邮件。
MIT协议可以说是最宽松的协议(约等于怎么用都行)。而Kimi的修改在于,如果基于Kimi K2打造的产品或服务月活跃用户超过1亿,或者月收入超过2000万美元,那么需要在该产品和服务的用户界面上显示“Kimi K2”。
为了缓解大规模训练中的attention logits偏大问题,他们提出MuonClip,并将其扩展到万亿参数规模,提升了训练稳定性和token使用效率。
Kimi K2构建了可大规模生成多轮工具使用场景的合成pipeline,覆盖数百领域、数千工具。高质量样本由LLM评估筛选后用于训练。
Kimi K2不仅在可验证任务上(代码、数学)强化学习,还通过引入自我评价机制(self-judging),解决了不可验证任务的奖励稀缺问题。通过可验证任务持续优化critic,提升泛化任务表现。
审美属于是简洁挂的。比较有意思的是,其中“立即体验”和“下载开源模型”按钮,都是真的可以跳转到正确网址的。
这个UI确实不错。另外在提示词没有给出具体要求的情况下,Kimi K2贴心地自动设计了行数和小球数量的调整滑杆。
172天之前,2025年春节之前,Kimi曾是国产基础大模型中最受关注的一个,团队青春风暴,产品体验优雅。
据量子位智库统计数据,在2024年全年数据,AI智能助手Web端市场格局已经相对稳定,特别是头部,形成了Kimi智能助手、豆包AI和文心一言的TOP 3格局,占据70%市场份额。
在APP端,这种态势就更明确,豆包和Kimi智能助手几乎断崖式领先其他玩家,各维度数据占比市场份额80%。几乎就是双寡头。
因为正是这一天,DeepSeek R1横空出世,迅速引爆国内外,并在春节假期中,形成了全民话题。
量子位智库最新的2025上半年数据显示,Web端和App端,头部格局都变成了DDKT,占据90%市场份额。
因为Kimi的数据增长地位,跟其之前拿着巨额融资后烧钱投流的策略密不可分,然而如果DeepSeek和腾讯元宝,可以靠着先进模型就能快速突破,那这壁垒又何在?这烧钱投流的正当性又何在?
如果市面上已经有如此全方位开源的领先模型,为什么其他公司特别是创业公司,还有合理的融资理由去推进自研基础大模型的故事?
至少在DeepSeek之后,曾经包含Kimi在内的AI大模型“六小龙”创业格局,已经一夜分崩,有至少2家放弃了大模型自研。