vivo新模型登场：AI解析GUI界面能力升级

tech
2025年7月10日

人工智能的浪潮正以惊人的速度席卷全球，从云端到边缘，从科研机构到消费市场，无一幸免。特别是，随着智能手机的普及，如何将强大的AI能力无缝融入到我们日常使用的设备中，成为科技巨头们争相追逐的目标。这种趋势驱动着端侧AI模型的蓬勃发展，它们以更小的体积、更低的功耗，实现了在本地设备上运行AI任务的能力，极大地提升了用户体验，并保护了用户隐私。在这个变革的时代，vivo 推出了其最新的端侧多模态模型——BlueLM-2.5-3B，这款模型的发布不仅是vivo在AI领域持续投入的成果体现，也预示着移动端智能体验的新未来。

首先，BlueLM-2.5-3B 模型的发布代表着端侧 AI 技术的成熟。

传统的AI应用，尤其是大型模型，往往依赖于强大的云计算资源，这意味着用户在使用这些功能时，需要依赖网络连接，并可能面临延迟、隐私泄露等问题。而 BlueLM-2.5-3B 选择了“端侧”路线，这意味着它能够在智能手机本地运行，无需依赖网络连接，用户可以随时随地享受AI带来的便利。这款模型的核心优势在于其“小巧”和“强大”的完美结合。BlueLM-2.5-3B 的参数量仅为 2.9B，这在同类模型中是相当小巧的，例如对比 Qwen2.5-VL-3B，其体积缩小了22%以上。这得益于vivo在模型架构、训练策略上的不断优化，使得它能够在资源受限的移动设备上流畅运行。这种小巧的体积不仅降低了对设备硬件的要求，也大大降低了训练和推理的成本，使得更广泛的用户群体能够受益于AI技术。此外，端侧部署还意味着更好的用户隐私保护，用户的个人数据无需上传至云端进行处理，从而减少了数据泄露的风险。这种“小而美”的理念，是 BlueLM-2.5-3B 能够脱颖而出的关键。

其次，BlueLM-2.5-3B 在功能层面实现了重大突破。

它不仅仅是一个能够理解文本和图像的模型，更令人瞩目的是，它具备理解图形用户界面（GUI）的能力，这代表着AI在移动设备上的应用迈出了重要的一步。BlueLM-2.5-3B 由 ViT (视觉 Transformer)、Adapter 和 LLM (大型语言模型) 构成，这种结构使得它能够融合文本、图像和 GUI 元素的信息，从而实现更深层次的理解和交互。例如，用户可以通过语音或文字指令，要求模型执行特定的手机操作，比如“将照片中的人物移除”、“打开某个应用”等等。这就像手机拥有了“智能助手”，可以理解用户的意图，并自动完成相应的操作。尤其值得一提的是，这款模型在GUI理解方面进行了专门优化，这得益于大量中文应用截屏数据的训练。这意味着，它能够准确识别和理解手机屏幕上的各种元素，例如按钮、图标、文本框等，从而更好地响应用户的指令。这种能力极大地拓展了手机 AI 的应用场景，从简单的信息查询，到复杂的任务自动化，无所不能。为了更好地平衡效率和准确性，BlueLM-2.5-3B 还支持长短思考模式自由切换，并引入了思考预算控制机制，能够根据任务的复杂程度调整推理深度，从而在不同场景下实现最佳性能。

再次，vivo 在AI领域的全面布局，预示着未来移动体验的变革。

BlueLM-2.5-3B 仅仅是vivo在AI领域布局的一个缩影。近年来，vivo 持续深耕大模型技术，构建了蓝心大模型矩阵，涵盖了语言、图像、语音、多模态等多个领域。蓝心小V 作为系统级AI助手，已经深度融入到 OriginOS 4 中，具备自然对话、意图理解、智慧搜索等能力，为用户提供了更加智能、便捷的交互体验。vivo 还积极探索大模型在手机自动化技术中的应用，通过对屏幕 GUI 的多模态感知，实现对复杂语言结构的理解和解析，从而为用户提供更加个性化的服务。例如，vivo 可以利用 BlueLM-2.5-3B 帮助用户自动化地完成日常操作，例如智能回复消息、自动整理照片、智能生成视频等等，这些功能将极大地提升用户的使用效率。vivo 的 AI 战略还体现在其对安全和隐私的重视。通过在端侧部署模型，vivo 有效地保护了用户的数据安全，让用户在使用AI功能的同时，不必担心个人隐私泄露的风险。vivo 的持续投入和创新，不仅提升了自身产品的竞争力，也推动了整个行业的发展。我们可以预见，随着AI技术的不断进步，智能手机将变得更加智能、更加个性化，成为我们生活中不可或缺的助手。

总而言之，BlueLM-2.5-3B 的发布是vivo在人工智能领域取得的重要进展，也预示着未来移动体验的变革。它以其小巧高效、功能强大的特点，为用户带来了全新的智能体验。vivo 在AI领域的持续投入和创新，不仅提升了自身产品的竞争力，也推动了整个行业的发展。随着大模型技术的不断进步，AI 将会在智能手机中扮演更加重要的角色，为我们的生活带来更多便利和惊喜。未来已来，而vivo正引领着这场变革。

vivo新模型登场：AI解析GUI界面能力升级

发表评论