智源开源RoboBrain 2.0与RoboOS 2.0，刷新10项基准

tech
2025年7月15日

一个新时代的曙光正在地平线上闪耀，预示着我们与机器互动方式的根本性变革。人工智能，这个曾经仅限于科幻小说中的概念，如今正以前所未有的速度演进。特别值得关注的是，具身智能领域正经历着一场革命，其核心在于将人工智能与现实世界紧密结合，赋予机器感知、思考和行动的能力。而最近，智源研究院发布的RoboBrain 2.0和RoboOS 2.0，无疑是这场变革中的关键里程碑。

在人工智能的浩瀚星空中，具身智能如同一颗冉冉升起的新星，它的目标不仅仅是理解和生成文本，更在于让机器拥有在物理世界中自主行动的能力。这意味着机器人需要能够感知周围环境，处理感官信息，进行推理和规划，最终做出符合目标的行为。这并非易事，因为它要求机器能够像人类一样，理解世界的复杂性和不确定性。智源研究院的RoboBrain 2.0，可以被定义为一种“通用具身大脑”，它集成了感知、推理与规划等关键能力，旨在赋予机器更强的自主性和适应性。32B版本的发布，标志着该模型在时空认知能力上取得了重大突破，并在多项权威具身智能基准上全面刷新纪录。令人印象深刻的是，RoboBrain 2.0在10项评测中甚至超越了GPT-4o，这意味着在某些特定任务上，具身智能系统已经能够挑战甚至超越传统的通用人工智能模型。这背后，是多模态数据集和分阶段训练策略的巧妙运用，使得模型能够更好地融合来自不同感官的信息，从而做出更为明智的决策。这种技术进步，预示着未来机器人将拥有更强的环境感知能力，更智能的决策能力，从而能够更好地服务于人类。

RoboOS 2.0，作为RoboBrain 2.0的协同框架，扮演着至关重要的角色。它不仅仅是一个简单的操作系统，更是一个跨本体大小脑协同框架，为机器人提供了一个高效、灵活的运行环境。单机版的发布，以及单机版产品线和RoboSkill技能商店的推出，极大地降低了具身智能应用的门槛。这意味着，开发者可以在本地环境中部署和测试具身智能系统，无需依赖昂贵的云端资源，从而提升了开发效率和安全性。同时，RoboSkill技能商店的推出，为开发者提供了丰富的预训练技能，这些技能可以像乐高积木一样组合，快速构建各种具身智能应用。这种生态系统，类似于智能手机的App Store，将极大地促进具身智能应用的爆发式增长，加速其在各个行业的落地。智源研究院与全球20多家机器人的合作，也为RoboOS 2.0的应用提供了广阔的空间，我们可以预见，未来将会有更多不同类型的机器人搭载RoboOS 2.0，进入我们的生活，为我们提供各种服务。从家庭助手到工业机器人，再到医疗护理机器人，具身智能的应用前景无限广阔。

智源研究院此次发布的不仅仅是模型和框架，更重要的是，它将模型权重、训练代码与评测基准全部开源。这一举措具有深远的意义。开源意味着更多的研究人员和开发者可以参与到RoboBrain 2.0和RoboOS 2.0的改进和完善中来，共同推动具身智能领域的技术进步。开源也促进了技术的透明度和可信度，有助于建立一个更加开放、合作的具身智能生态系统。这种开放的姿态，与一些追求闭源和商业化的做法形成了鲜明对比，体现了智源研究院对技术共享和社区建设的重视。这不仅有助于加速具身智能技术的创新，也为整个行业带来了积极的影响。这种开放的模式，能够汇集全球的智慧，加速技术的发展，并最终惠及全人类。与此同时，我们也能看到，这种开源的模式，是对科技伦理的一种责任担当。技术的进步，离不开伦理的约束和规范。只有在开放和透明的环境下，我们才能更好地监督和管理人工智能的发展，确保其朝着积极的方向前进。

“悟界”系列大模型的发布，进一步完善了智源研究院在具身智能领域的布局。“悟界”系列的目标是构建一个连接虚拟世界和物理世界的桥梁，让机器能够更好地理解和适应环境。RoboOS 2.0与RoboBrain 2.0作为“悟界”系列的核心组成部分，共同构建了一个完整的具身智能解决方案。通过将虚拟世界和物理世界连接起来，具身智能系统可以更好地理解和适应环境，从而实现更加智能、高效的交互。这为未来具身智能的发展奠定了坚实的基础，也预示着更广泛的应用前景。未来，我们可以期待，具身智能系统将能够更好地服务于人类，解决各种复杂的问题，例如应对气候变化、改善医疗健康、促进教育发展等等。随着技术的不断进步和应用场景的不断拓展，具身智能有望成为人工智能领域下一个重要的突破口，改变我们的生活和工作方式。

智源开源RoboBrain 2.0与RoboOS 2.0，刷新10项基准

发表评论