腾讯开源混元-A13B模型，可灵AI推视频音效功能

tech
2025年6月29日

近年来，人工智能领域的发展进入了一个全新的加速阶段，技术创新日益频繁，应用场景愈加丰富。尤其是在2024年6月27日这一天，众多科技公司的重大进展进一步彰显了AI技术的变革力量。以腾讯开源的混元-A13B模型和可灵AI的多模态视频音效功能为代表，这些突破不仅展现中国人工智能技术的实力，也为全球AI生态带来深远的影响。

首先，腾讯发布并开源了混元大模型家族的新成员——混元-A13B。该模型采用专家混合（MoE）架构，拥有高达800亿的总参数和130亿的激活参数，性能表现与当前顶尖开源模型平起平坐，同时在推理延迟和计算资源消耗方面显著优化。令人瞩目的是，混元-A13B对硬件的要求极低，即使是中低端GPU卡也能高效运作。这种高度可部署性的设计，大大降低了开发者及科研人员的使用门槛，意味着前沿大模型技术不再局限于大型科技公司和少数研究机构，而是向更广泛的社区开放。腾讯的开源策略不仅加速了人工智能的普及，也推动了开源生态系统的健康发展。未来，腾讯混元系列将继续推出不同规模和特色的模型，充分满足多样化的场景需求，成为推动行业进步的重要力量。

与此同时，可灵AI在多模态内容生成领域也带来了革命性的创新。该公司上线的“视频音效”功能实现了“所见即所听”的沉浸式互动体验，用户在生成视频的同时，系统能够智能匹配并同步生成立体声音效。这不仅极大地丰富了视频内容的表现力和感染力，也使视频创作过程更为便捷和高效。可灵AI依托自研的多模态视频生音效技术，推出了“视频生音效”模块，能够精准捕捉视频情境生成对应音效，让创作者专注于视觉效果创意，无需再为配音和音效烦恼。此外，可灵AI的2.1系列视频生成模型提升了效率，5秒短视频生成时间缩短至不足1分钟，大幅优化了创作周期。这些创新助力视频媒体、广告、娱乐等多个行业实现内容升级，推动数字媒体体验走向新的高度。

不仅如此，6月27日这一天，AI领域其他多项创新同样引人关注。Meta AI发布的LIGER混合检索模型，致力于提升计算效率和推荐系统的精准度，展现了AI在信息处理方面的新突破。Vibemotion AI推出一键生成动态视频工具，有效降低了视频制作门槛，使非专业用户也能轻松创建高质量内容。国内外大量涵盖AI绘画、文本生成、视频编辑等功能的工具纷纷出现，极大丰富了用户的选择空间。此外，专门的AI工具导航平台开始兴起，帮助用户快速筛选和定位最合适的AI资源，从而提升工作效率和生活品质。整个AI生态日益完善，为各行各业带来创新动力和发展新机遇。

可以说，6月27日标志着人工智能技术进入了一个全新的阶段。腾讯混元-A13B模型的开源使得高效、轻量级的大模型技术更加普及，打破了硬件和成本的双重瓶颈。可灵AI多模态内容生成的突破，则极大提升了数字内容创作的体验和效率，推动传统视频制作向智能化、自动化转型。同时，各类AI创新工具的涌现，正不断拓宽AI的应用边界。从信息检索到创意生成，从硬件适配到用户体验，AI技术正以前所未有的速度变革着社会运行机制。未来，随着更多技术细节的完善与开放，人工智能将不仅仅是工具，更将成为推动产业升级和生活方式变革的核心驱动力，深刻塑造我们的世界。

腾讯开源混元-A13B模型，可灵AI推视频音效功能

发表评论