智源“悟界”系列发布Emu3大模型新突破

tech
2025年6月8日

近年来，人工智能（AI）技术以惊人的速度发展，尤其是在大模型领域实现了突破性进展。作为中国人工智能研究的前沿阵地，北京智源人工智能研究院（BAAI）始终站在技术创新的最前沿。2025年6月6日，第七届北京智源大会上，智源研究院重磅推出了“悟界”系列大模型，这不仅继承了“悟道”系列的技术积淀，更标志着人工智能从以数字世界为主的认知方式，向多模态感知和物理世界的深入延伸，开启了人工智能技术和应用的全新篇章。

“悟界”系列大模型旨在打破虚拟与现实的界限，强化AI在复杂物理环境中的认知和交互能力，实现多模态感知与具身智能。其中，全球首个原生多模态世界模型Emu3、脑科学多模态通用基础模型见微Brainμ、具身大脑模型RoboBrain 2.0以及全原子微观生命模型OpenComplex2成为本系列的核心组成。它们的问世不仅反映了多学科交叉的技术融合，也为通用人工智能（AGI）铺设了坚实的基石。

Emu3作为全球首个原生多模态世界模型，其最大亮点是能够同时处理图像、视频和文本，构建了一个模态无关的统一表征空间。不同于以往依赖复杂扩散模型或组合架构的多模态方法，Emu3采用纯自回归的“下一个token预测”范式，让AI具备在不同数据类型间自由切换和无缝连接的能力。这一创新让人工智能能够“直观”地观察现实，跨越数字信息的界限，迈向真正面向物理世界的认知升级。由此，机器不仅能理解文字描述，也能同时捕捉图像和视频中的动态细节，极大丰富了AI的感知维度和表达能力。

脑科学领域的突破也在“悟界”系列中有所体现。见微Brainμ整合了多模态数据，建立了以脑科学为核心指导的多模态通用基础模型架构。这一模型不仅在神经科学和医学研究中具有深远意义，还为探索类脑智能系统提供了强有力的技术支持。通过吸收脑科学的最新研究成果，见微Brainμ有望帮助我们更深入理解人类智能本质，推动智能系统从模仿到类脑认知的进化。其在医疗诊断、疾病预测与生理机制解析等方面具备巨大潜力，体现了AI技术服务科学与健康的当代趋势。

具身智能的创新则体现在RoboOS 2.0和具身大脑大模型RoboBrain 2.0上。这些模型体现了AI在机器人领域实现“具身认知”的重要进展，即机器人不仅有限地执行指令，而是能够模拟生物智能的复杂协同机制，进行多层次的物理交互与适应。这对于推进机器人在复杂环境中的灵活操作、情境感知和决策制定具有里程碑意义。此外，OpenComplex2模型代表了多模态大模型技术在生命科学中的前沿应用。以全原子级别模拟微观生命结构，OpenComplex2不仅助力新疗法研发，还填补了人工智能在微观生命研究方面的空白，彰显智能技术在从宏观到微观层面渗透科学领域的趋势。

智源研究院院长王仲远指出，人工智能的发展正经历从数字世界的认知到物理世界的感知与交互的根本性转变。未来的AI必须突破数字与现实的隔阂，实现感知、认知和行为的无缝链接，才能迈向更高阶段的智能水平。“悟界”系列的发布不仅是技术层面的飞跃，也是推动AI深度赋能智能制造、医疗健康、智能机器人以及科学研究等多个领域的关键节点。特别值得一提的是，智源研究院坚持开源策略，促进全球科研和产业界联动合作，加速共建通用人工智能生态，这种开放共享精神为未来AI生态的可持续发展奠定了良好基础。

综合来看，“悟界”系列大模型从宏观到微观、从数字到实体、从单一模态到多模态的技术路径，极大丰富了人工智能的表现力和应用空间。Emu3、见微Brainμ、RoboBrain 2.0与OpenComplex2不仅代表了AI理论与技术的深刻突破，更是对未来实现类人智能、跨领域融合和多维度感知的积极探索。随着这些模型的不断完善与应用，人工智能在模拟生命、认知物理世界和推动社会发展中的核心作用将日益显现，引领人类迈向一个更智能、更智能化的未来。

智源“悟界”系列发布Emu3大模型新突破

发表评论