百度开源文心4.5系列，通义千问推出Qwen VLo多模态模型

tech
2025年6月30日

近几年，人工智能领域经历了飞速发展，尤其是在大模型技术方面的突破，为科技产业带来了翻天覆地的变化。作为推动这一变革的关键力量，大模型不仅提升了AI的理解与生成能力，也推动了应用场景的多样化和深度融合。近期，国内两大科技巨头百度和阿里云通义千问的重磅动作——百度开源文心大模型4.5系列，通义千问发布多模态生成模型Qwen VLo，标志着大模型技术迎来了更加开放和创新的新时代。

百度在6月30日宣布正式开源了文心大模型4.5系列，这一系列包含了多款模型，如47B和3B激活参数的混合专家（MoE）模型，以及0.3B参数的稠密型模型，总计10款模型同时开放API服务。此举大大打破了以往人工智能研发中对核心模型的封闭态度，更多开发者与科研人员得以直接参与文心大模型的优化与创新过程，这不仅加速了模型的技术迭代，更推动了其在诸多行业场景的落地应用。百度的开放策略彰显了其在AI领域的雄厚实力与战略眼光，也体现出其力图打造繁荣的开源社区和产业生态的强烈决心。此前，百度还宣布文心一言服务向用户免费开放，大幅降低了AI技术普及的门槛。

与此同时，阿里云旗下通义千问也在多模态大模型方向发力，6月27日正式推出了Qwen VLo模型，这是一款集视觉理解与文本生成于一体的多模态统一模型。Qwen VLo能“看懂”图像，并基于图像内容进行高质量文本创作，首次引入了由上到下、由左到右逐步清晰生成内容的机制，特别适合于需要精细文本生成的长段落创作。用户可通过Qwen Chat平台体验这一模型的强大能力。多模态模型的突破不仅丰富了人工智能的感知能力，也为视觉创作、内容生产带来了全新的玩法。除此之外，通义千问还发布了2.5版本，并开源了一个1100亿参数规模的大模型，持续推动行业普惠化发展。

百度与通义千问的开放举措并非孤例，腾讯最近发布的混元-A13B模型也体现了中国科技巨头在AI领域的深耕细作。越来越多的企业开始积极拥抱开源策略，形成了良性的技术互助生态。开源带来的不仅是技术的加速创新，更促进了产业链上下游的广泛合作，极大拓展了AI的应用边界。以阿里云百炼平台为例，它集成了通义系列及多家第三方大模型，构建了一站式模型服务与AI应用开发环境，有效降低了开发门槛与使用成本，推动AI应用向更多行业渗透。

整体来看，百度文心大模型4.5的开源以及通义千问Qwen VLo多模态模型的发布，昭示着国内大模型技术的成熟与日趋开放。未来的AI发展趋势将更加注重多模态融合和开源生态构建，推动技术向更智能、更具普惠性的方向迈进。随着技术壁垒被逐步打破，大模型将在医疗、金融、教育、文创等领域扮演更重要的角色，深刻改变人们的生产和生活方式。中国AI企业积极推进自主创新和产业协同，将为全球人工智能产业注入强劲动力，助力中国迈向世界科技创新的前沿阵地。

百度开源文心4.5系列，通义千问推出Qwen VLo多模态模型

发表评论