
AI时代数据不开放传统开源遇困探索高阶开放模式成关键
应用介绍
在全球科技飞速发展的今天,人工智能(AI)已成为各行各业的热议线CCF中国开源大会在上海召开,再次将开源与AI的结合推向了风口浪尖。此次大会汇聚了众多科技界精英,讨论了在AI时代,数据开放与开源面临的挑战与机遇。
大会上,宇树科技创始人王兴兴分享了他对具身智能的看法。他强调,具身智能的发展需要在未知环境中进行实时、多样化的动作生成。这一观点引发了与会者的深思,尤其是在当前机器人硬件已逐渐成熟的情况下,具身智能大模型的缺口却依然明显。他的期待是,能够迎来一个推动机器人领域发展的“ChatGPT时刻”。不过,王兴兴也指出,数据获取的困难成为制约这一进程的关键因素。
开源这一概念在大会中引起了广泛关注。开源不仅是共享代码的过程,更是一种合作与透明的精神。中国工程院院士郑纬民提到,AI大模型的生命周期中,数据获取和预处理的成本高昂,开源模式能够帮助小企业专注于模型的微调和推理,降低技术门槛。与此同时,中国科学院院士吕建也强调,开源能够汇聚全球开发者的力量,共同推动AI技术的进步。
然而,开源在AI领域的推进却遭遇了不少障碍。北京大学教授鄂维南指出,数据作为企业的核心资产,其价值正在日益凸显。公众对数据保护的意识增强,导致大量数据因安全考虑无法公开,这一现实困境使得AI开源的发展受到限制。梅宏教授进一步解释,即使大模型的参数公开,缺乏相同的训练数据也难以实现能力的复现和迭代创新。他呼吁,在AI时代,开源必须伴随数据的开放,否则将陷入“无米之炊”的困境。
面对这些挑战,专家们提出了构建更高维度的“开放”解决方案的重要性。开放数据的核心在于有条件共享,旨在释放数据的价值以支撑AI的训练与科研分析。例如,医疗数据在去除隐私信息后可以开放给科研使用,但需遵循严格的场景限制和脱敏处理原则。
大会上,专家们一致认为,开放不仅仅是开源代码的公开,更应包含标准、API和平台等多个维度。中国工程院院士陈左宁指出,设计精良的开放架构可能比完全公开的源代码更具意义。这样的架构可以让不同领域的创新者便捷接入,构建高效的创新生态。
此次大会由中国计算机学会主办,上海交通大学与CCF开源发展技术委员会承办,为业界提供了一个深入交流与合作的重要平台。在这个瞬息万变的时代,如何应对AI与开源的挑战,将决定未来科技发展的方向。开源的精神与数据的开放将继续引领科技的创新与发展,而在这个过程中,每一个参与者都将成为推动者。返回搜狐,查看更多