《腾讯开源混元-A13B模型可灵新增视频音效功能》

tech
2025年6月28日

随着人工智能技术的迅猛发展，AI正逐渐渗透到各个行业和生活场景中，推动着数字化和智能化浪潮的不断加速。2024年6月27日，AI领域迎来了一系列具有标志性意义的进展，其中腾讯推出的开源轻量级混元-A13B模型以及可灵AI的“视频音效”功能，彰显了中国在AI核心技术创新和应用落地方面的实力，也揭示了未来人工智能发展的重要方向。

腾讯混元-A13B模型的发布，不仅技术指标令人瞩目，更代表着AI模型技术的一个重要突破。这款混合推理稀疏专家模型（MoE）总参数量高达800亿，然而其激活参数仅为130亿，这种设计使得模型在保持高性能表现的同时，大幅降低了推理延迟和计算资源消耗。尤其令人关注的是，混元-A13B能够在仅配备一张中低端GPU卡的硬件条件下运行，这极大地降低了人工智能技术的应用门槛。企业和开发者无需依赖昂贵的硬件设备，就可以利用这一强大模型开展各种创新型AI项目，促进技术的普及与多元化发展。腾讯将该模型开源于GitHub，推动开源社区的活跃与资源共享，有望加速国内外AI研发的协同进步。此外，混元模型家族计划未来推出更多规格及特色产品，进一步丰富AI生态，支撑自主创新与产业链升级。此举在助力国内科技自主可控、打造开放共赢生态体系层面，意义深远。

与此同时，可灵AI在视频生成领域同样带来了具有创新性的升级。其“视频音效”功能融合了自研多模态视频生音效模型Kling-Foley，能够实现视频画面与音效之间的帧级精确对齐，确保“所见即所听”的沉浸式体验。这意味着用户在生成视频内容时，不仅能够获得逼真的视觉效果，还能同步生成与画面动作、场景变化高度契合的立体声效，大幅提升用户体验和内容表现力。对于视频创作者而言，这种一体化的AI辅助生成工具大幅减少了制作复杂度，提高了效率和质量。此外，可灵AI凭借这项技术创新，在2025年AI视频生成领域脱颖而出，与即梦AI共同占据市场领先地位，显示出强大的竞争力和技术积累。视频生成与音效融合的突破，预示着未来影视、游戏、教育等多领域内容生产将迎来深刻变革。

当天，AI领域的其他重要动态同样耐人寻味。Suno宣布收购WavTool，加强AI音乐编辑能力，尽管伴随音乐版权讨论，但这一举措显示出AI在创意产业的渗透和价值挖掘潜力。Claude Artifacts上线的零代码AI应用构建平台，降低了开发门槛，让更多非专业用户参与到AI应用的设计与实践中来，推动智能化工具更广泛地服务于社会。同时，中国首个海洋智能开源大模型“沧渊”的问世，凸显了AI技术在海洋科学、环境监测等专业领域的重要推动作用。结合如AI工具箱导航这类集成丰富工具的平台，AI产品和服务的生态正愈加完善，助力跨行业数字化转型和智能升级。

整体来看，腾讯混元-A13B和可灵AI的技术突破，体现了中国AI从基础研发到应用创新的整体实力。模型设计上的“轻量化+高效能”理念，与视频生成中“多模态融合+真实体验”的应用诉求相辅相成，为未来AI技术走向更广泛、深入的落地产生积极示范。行业内不断涌现的新产品、新平台，也在持续扩充AI生态的边界，使得技术红利惠及更多用户和场景。随着硬件门槛的降低和多样化工具的普及，未来人工智能将不再是少数科技巨头的专属资源，而将真正融入千家万户的生产和生活之中，为社会带来前所未有的变革与机遇。

《腾讯开源混元-A13B模型 可灵新增视频音效功能》

发表评论

《腾讯开源混元-A13B模型可灵新增视频音效功能》