百度开源文心大模型4.5系列，通义千问推出多模态生成模型Qwen VLo

tech
2025年6月30日

近年来，人工智能领域尤其是大模型技术快速迭代，成为推动科技进步和产业变革的核心动力。进入2024年，国内科技巨头纷纷加速布局大模型市场，释放出强烈的创新信号。6月底，百度和阿里巴巴的两大重量级项目——百度文心大模型4.5系列开源以及阿里巴巴通义千问新型多模态生成模型Qwen VLo的发布，标志着中国大模型生态迈入一个全新阶段。这一系列举措不仅展示了中国在AI领域的技术实力，也为推动人工智能更广泛的应用奠定了坚实基础。

百度在6月30日正式开源了文心大模型4.5系列，涵盖了从0.3B至47B规模的多款模型，包括混合专家（MoE）架构和稠密型模型。此次开源的最大亮点是模型预训练权重和推理代码一并对外开放，不仅降低了AI研发的门槛，还极大地促进了科研人员和开发者对模型内核的理解与创新。文心大模型4.5系列在文本多模态基准测试中表现卓越，尤其在视觉感知能力上展现出突破，支持图像、视频等多模态数据的处理需求。这种综合能力使其在内容生成、智能问答、辅助决策等场景中具备极高的适用价值。更值得关注的是，百度同时提供了完善的使用手册与工具链，方便快速接入和部署，有助于构建更加开放和包容的AI生态系统。

与之相呼应的是，阿里巴巴旗下的通义千问在6月27日率先推出了多模态统一理解与生成模型Qwen VLo，开启了视觉与语言理解融合的新篇章。Qwen VLo通过创新的生成机制，实现了“从上到下、从左到右”渐进式文本生成，极大提升了长文本的连贯性和自然度，同时其强大的图像内容理解与生成能力赋予用户全新的多模态交互体验。该模型目前处于预览阶段，用户可通过阿里云AI平台体验其功能。依托阿里云庞大的数据资源和算力基础，Qwen VLo不仅支持多模态数据高效推理与应用开发，还实现了模型的高效训练与迅速部署。此外，通义千问还同步推出了轻量化混元-A13B模型，丰富了产品线，满足了多样化的市场需求。

从时间节点来看，Qwen VLo的推出稍早于文心大模型4.5系列开源，反映出阿里巴巴在多模态融合和生成方向上的积极探索和技术沉淀。而百度的全面开源策略则重点体现了推动开放生态、增强社区协同创新的决心。两大巨头的动作背后，是中国大模型市场日趋激烈和成熟的竞争格局。开源不再单纯是技术分享，更成为抢占未来AI话语权和产业链资源的重要手段。通过开放技术与生态，企业不仅能够吸引更多的开发者和合作伙伴，还能促使模型透明度和安全性得到提升，从而增强用户信任和行业推动力。

未来，随着硬件算力提升和算法持续创新，国内大模型将在多模态融合、个性化生成、跨领域迁移学习等方面爆发出更多潜力。百度和阿里巴巴的领先布局不仅将促进更多创新应用落地，也将推动行业不断扩大应用边界，从智能客服、医疗诊断到文创设计、自动驾驶等各行各业深刻变革。我们有理由相信，国产大模型生态的繁荣将为全球人工智能格局注入新活力，同时驱动技术红利向更广泛的社会生活和经济发展领域延展。

综上所述，百度文心大模型4.5系列的开源和阿里巴巴通义千问Qwen VLo的多模态突破，是当前中国AI领域风云变幻的重要标志。这不仅彰显了两大科技巨头在前沿技术上的实力与野心，也为全球大模型技术的变革注入了强大动力。随着生态的快速构建和应用的深入拓展，未来的智能世界将更加开放、多元且充满无限可能。

百度开源文心大模型4.5系列，通义千问推出多模态生成模型Qwen VLo

发表评论