8月AI圈“大混战”！谷歌、Anthropic、OpenAI同日“亮剑”暗藏三种打法

分类：开源社区
大小：未知
支持：

发布： 2025-08-06 19:32:37
人气： 8
评论： 0

标签：

开源社区源码

应用介绍

　　当地时间8月5日，谷歌、Anthropic和OpenAI三大AI巨头相继发布新模型。从战略上看，三家巨头“打法”各异：谷歌推出Genie 3世界模型，为通用人工智能（AGI）铺路；Anthropic深耕编程这一高价值赛道；OpenAI则重返开源，意在构建开发者生态。AI行业的竞争或由此进入新阶段。

　　当地时间8月5日，谷歌、Anthropic和OpenAI相继推出“王炸”新模型，上演了一场“三国杀”。

　　谷歌押注未来，发布了第三代通用型世界模型Genie 3，为通用人工智能（AGI）的实现铺设关键基石；

　　Anthropic继续深耕编程这一高价值赛道，发布编程能力更强的Claude Opus 4.1模型；

　　OpenAI则以开源作为“生态诱饵”，发布了免费、可商用的gpt-oss系列模型，意在构建庞大的开发者生态。

　　这场密集“出招”揭开了差异化竞争的底牌。而8月的AI战场或将持续 “高能”。Anthropic 5日预告称，将在未来几周内发布“重大改进”。OpenAI此前也宣布，“重要的一周即将到来”，外界猜测GPT-5或将登场。

　　用户只需输入文本、图片甚至草图，Genie 3就能创造出一个风格一致、符合物理逻辑的3D环境，并允许用户实时在其中行动和互动。比如，Genie 3能理解“向左走”或“跳起来”等自然语言指令，并即时渲染出对应的第一人称视角画面。

　　与此前的视频生成模型（如谷歌自家的Veo）和前代模型相比，Genie 3主要进行了以下升级：

　　一是实现高清实时生成。它能以720p分辨率、24帧/秒的速度在消费级显卡上流畅运行，画面流畅度媲美传统游戏引擎。

　　二是具备视觉记忆与一致性。Genie 3为场景要素建立了持久的隐变量，解决了早期版本“转身即刷新”的沉浸感断裂问题。模型可以在生成每一帧的同时，回溯并利用最长可达1分钟的历史信息，确保环境的连贯性。

　　三是加入可提示的世界事件（Promptable World Events）。除了导航指令外，Genie 3还支持用户追加提示来实时改变场景，例如“下雨”“加入两只狗”，模型会即时重算物理与光照，让世界状态随剧情动态演进。

　　需要强调的是，Genie 3的核心优势是通用性，游戏应用只是其中一个场景。Genie 3通过生成可交互的虚拟世界，为游戏开发、模拟器、机器人训练乃至元宇宙的实现路径提供了极具震撼力的雏形。

　　英伟达的研究科学家Jim Fan直接将其称为“一次量子跃迁”。这表明谷歌正扮演着“下一个Transformer时刻”的缔造者角色，为走向AGI提供关键拼图。

　　在谷歌“出招”大约2个半小时后，Anthropic宣布推出新模型Claude Opus 4.1，直接瞄准编程这一“变现高地”。据称，该模型的编程、研究和数据分析能力有显著提升。

　　在另一项衡量代码生成、调试和逻辑推理能力的HumanEval+基准测试中，Claude 4.1 Opus的得分达到85.2%，首次超越了此前由GPT-4o创下的84.9%的纪录。

　　Anthropic援引开源软件社区GitHub的数据强调，Opus 4.1此次升级的重点在于多文件代码重构的性能提升。

　　此外，根据AI编程公司Windsurf的报告，Opus 4.1在其初级开发人员基准测试中比Opus 4提高了一个标准差，性能提升幅度与从Sonnet 3.7到Sonnet 4的提升大致相当。

　　在定价方面，Opus 4.1与Opus 4保持一致，输入和输出价格分别为15美元/百万Token和75美元/百万Token，基本实现了“加量不加价”。这有望进一步巩固Anthropic在编程这一高付费意愿场景的竞争力。

　　当天压轴登场的OpenAI则选择以“开源”破局。该公司推出了两款开放权重模型：gpt-oss-120b和gpt-oss-20b，标志着其时隔六年重返开源赛道。

　　这一步棋，OpenAI可谓精明。在闭源模型引领消费者市场后，OpenAI选择用开源来构建更庞大的生态系统，通过降低门槛，它希望让gpt-oss成为未来无数AI应用的基础设施，从而在下一阶段的竞争中掌握主动权。

　　gpt-oss-120b拥有1170亿参数，每token激活51亿参数，是一款为高推理能力、生产级通用场景打造的模型，可以在单张英伟达H100 GPU上高效运行；

　　gpt-oss-20b更具“普惠性”，总参数为210亿，每token激活36亿参数，专为低延迟、本地化或专业场景设计，仅需16GB内存即可在消费级笔记本电脑或手机等边缘设备上部署。

　　根据OpenAI发布的技术报告，这两款大模型均为纯文本语言模型，在文本处理、代码生成、数学问题求解等领域表现出色。尤为值得关注的是，gpt-oss-120b在多项基准测试中的表现，媲美甚至超越了专有模型o4-mini。较小的gpt-oss-20b则与o3-mini性能相当，在AIME和HealthBench等测试中表现更佳。

　　在技术架构上，gpt-oss模型采用了混合专家（MoE）架构，通过交替使用密集注意力和局部带状稀疏注意力机制，实现了高效的推理和内存利用。模型还支持高达128000个token的上下文长度，相当于约300~400页的小说文本。

　　同时，模型采用了原生MXFP4量化技术，极大地降低了硬件门槛，使得开发者可以在更低的配置下运行模型。

　　在许可方面，gpt-oss系列模型采用了对企业友好的Apache 2.0许可协议。这意味着任何消费者、开发者或企业都可以免费下载、进行参数级微调，并将其用于商业服务或创收，而无需向OpenAI支付任何费用。

　　此外，模型支持本地运行，无需联网，可以有效满足金融、医疗、法律等对数据隐私有严格要求的行业需求。

　　gpt-oss使用的是OpenAI自定义的“OpenAI Model License 1.0”，其中包含了“毒丸条款”，禁止年度收入超过1亿美元或日活跃用户超过100万的商业实体，使用gpt-oss来开发与OpenAI核心产品竞争的服务。这一条款精准地将所有潜在的大公司竞争对手排除在外，同时又能让广大的中小开发者和研究者进入其生态，是一次重大的战略转向。

　　三家AI巨头在同一天集体发布新模型，这绝非偶然，意味着AI产业的竞争已进入一个全新的、更复杂的阶段。

　　从战略上看，谷歌着眼长远，以Genie 3推进世界模型研发，押注AGI未来；Anthropic深耕垂直变现，锚定编程这一高频、高付费场景，深挖商业护城河；OpenAI则以开源为饵，通过降低门槛吸引开发者，构建底层生态。

　　Anthropic在8月5日新闻稿中预告，未来几周内将发布“重大改进”。前一日，OpenAI高管也喊话：“重要的一周即将到来”，外界普遍猜测，GPT-5或将登场。

　　如需转载请与《每日经济新闻》报社联系。未经《每日经济新闻》报社授权，严禁转载或镜像，违者必究。

　　特别提醒：如果我们使用了您的图片，请作者与本站联系索取稿酬。如您不希望作品出现在本站，可联系我们要求撤下您的作品。

　　OpenAI重组计划被迫改变，将继续由非营利实体控制；苹果据称与Anthropic携手研发新AI平台全球科技早参

　　神秘女3.6亿元接手徐翔母亲股份！知情人：李蓉蓉非宁波海关下属企业中干，其自称找亲戚募的钱，被推为牵头人

　　特朗普最新采访曝光；官宣！公办幼儿园免一年保教费；上纬新材严重异常波动！上交所出手；特斯拉豪掷290亿美元股票留马斯克丨每经早参

　　免费学前教育细则来了！民办园参照同类型公办幼儿园免除水平专家：下一步重点是精准测算费用标准