解决方案

阿里云Qwen3正式发布 全面开源八大混合推理模型

阿里云Qwen3正式发布 全面开源八大混合推理模型

  • 发布:
  • 人气: 11
  • 评论: 0

应用介绍

  4月29日,阿里巴巴集团旗下阿里云宣布推出新一代AI大模型Qwen3,并同步开源全部8款混合推理模型。这是继Qwen系列前代产品后,阿里云在通用人工智能领域的重要技术突破,旨在为全球开发者、企业及研究机构提供更高效、灵活且低成本的大模型解决方案。

  此次开源的Qwen3系列包含两款MoE(Mixture-of-Experts)模型和六款Dense模型,参数规模从0.6B到235B不等,满足从终端设备到云端计算的多样化需求:

  所有模型均基于Apache 2.0协议开源,开发者可免费在魔搭社区、HuggingFace等平台下载商用,也可通过阿里云百炼直接调用API服务。个人用户可通过通义APP实时体验,夸克搜索即将全端集成Qwen3能力。

  Qwen3的核心突破在于引入“思考模式”与“非思考模式”动态切换机制。前者针对复杂问题(如代码生成、数学推理)启动深度分析,后者面向简单任务(如文本摘要)优先响应速度,用户可根据需求灵活调整“思考预算”,在成本与效果间实现最优平衡。实测显示,该机制使模型推理效率提升显著,同时保持输出稳定性。

  此外,Qwen3支持119种语言及方言,覆盖全球多数地区的使用场景,进一步推动多语言AI应用的普惠化。其开源生态兼容主流推理框架,推荐使用SGLang、vLLM等云端部署工具,或Ollama、llama.cpp等本地化方案,降低开发门槛。

  在代码、数学、通用任务等权威基准测试中,旗舰模型Qwen3-235B-A22B展现出顶尖水平,超越OpenAI o1、DeepSeek-R1等国际竞品。即便小型模型Qwen3-30B-A3B亦在特定任务中优于大参数模型,印证了阿里云“轻量化高性能”研发路线的可行性。

  阿里云首席技术官周靖人表示:“Qwen3通过混合推理架构与双模式机制,重新定义了大模型的成本效率边界。我们希望以全栈开源策略,构建开放的技术生态,助力全球AI创新。”

  Qwen3的开源标志着阿里云在AI基础设施领域的进一步开放。目前,魔搭社区已汇聚超20万开发者,此次开源模型将推动教育、医疗、金融等垂直领域加速智能化转型。企业用户可通过私有化部署保障数据安全,中小开发者亦可基于轻量模型快速构建应用。

  未来,阿里云计划持续迭代Qwen系列,拓展多模态能力并优化推理性能。用户可通过阿里云官网、魔搭社区或通义APP获取模型,即刻开启AI开发新体验。

相关应用