Archives: 2025年5月1日

苹果开放AI模型,引领创新浪潮

近年来,人工智能技术的迅猛发展正在深刻改变全球科技格局。各大科技巨头纷纷加码投入,争夺未来智能生态的制高点。在这场激烈的竞赛中,苹果公司作为行业领军者,于2024年全球开发者大会(WWDC)上宣布向第三方开发者开放其人工智能模型。这一战略不仅彰显了苹果在人工智能领域的新野心,更预示着智能应用生态将迎来前所未有的创新与变革。

苹果开放AI模型,将推动应用创新进入一个全新阶段。过去,苹果的人工智能技术多聚焦于内部优化,例如Siri智能助手和设备端的小型AI模块,功能较为有限且强调隐私保护。此次开放,意味着开发者可以基于苹果强大的“Apple Intelligence”系统以及相关大型语言模型,开发出更加多样化且智能化的应用场景。苹果特别强调端侧设备的本地化运行,优先开放轻量级模型,既能保障用户隐私安全,也提升了响应速度。这种设计有效避免了过度依赖云端服务器的弊端,同时降低了数据传输延迟。开发者将获得完善的软件开发工具包(SDK)和支持框架,充分利用苹果内置的高级AI能力,实现人机交互、内容生成和智能推荐等多样功能,从而极大丰富App Store的生态环境。

此外,苹果试图通过AI模型的开放实现智能生态系统的深度融合与统一体验。此次WWDC上,苹果还对iPhone、iPad和Mac操作系统进行了深度重塑,推出名为“Solarium”的项目,推动不同设备之间界面风格的统一和交互的协调。借助于开放的AI模型,开发者有机会设计跨设备的智能应用,打破设备壁垒,实现无缝联动和数据共享。例如,一款AI驱动的笔记应用不仅能在Mac上进行内容整理,还能在iPhone上快速检索和生成信息,大幅提升用户在工作和日常生活中的效率。苹果智能系统能够理解用户的个性化场景,提供更加精准的个性化服务,体现了AI赋能数字生活的深层价值。这种跨平台、个性化的创新将使苹果生态更具竞争力。

在市场竞争与隐私保护方面,苹果的AI战略展现出独到的平衡智慧。相比谷歌、微软等早已大规模拥抱云端AI运算,苹果更倾向于将AI计算力下沉至终端设备,减少对云端的依赖,从而最大程度保护用户隐私和数据安全。通过本地模型处理数据,苹果不仅提升了信息传输的效率,也强化了隐私防护。同时,苹果积极引入国内合作伙伴如腾讯、字节跳动等的AI技术,以提升国行iPhone的本地化适配能力,体现出其兼顾全球化战略与本土化需求的灵活应对。Apple Intelligence的发布,标志着苹果从主要依赖硬件创新,逐渐向软件智能化转型,这一转变无疑将重塑苹果生态的核心竞争力。

这项开放战略带来的机遇不可小觑。对于开发者而言,有机会充分利用苹果的先进AI技术打造差异化产品,抢占创新先机;对用户来说,未来的智能应用将在工作、娱乐及日常使用中提供更加智能和便捷的体验。此外,苹果此举也有望激发更多行业合作和生态共建,推动AI技术在端侧设备的深度应用,促进智能硬件产业链的繁荣。随着大量创新应用的涌现,苹果设备的市场吸引力和竞争力预计将大幅提升。

综合来看,苹果通过开放AI模型权限,正式开启了以“Apple Intelligence”为核心的智能新时代。从统一操作系统界面、推动本地模型落地,再到与国内外厂商的深度合作,苹果正稳步构建一个安全、智能且开放的生态体系。这不仅代表了技术发展的必然趋势,也为苹果持续保持行业领先地位奠定了坚实基础。未来,一个更加智慧、个性化的数字生活时代,正在悄然走近我们的生活。


飞书AI“知识问答”引领企业智库新潮流

随着人工智能技术的迅猛发展,企业数字化转型已成为提升竞争力的关键之举。在这一进程中,如何高效管理日益庞大的知识资产,成为推动业务创新和提升协同效率的焦点。飞书作为国内领先的智能办公平台,其旗下的AI产品“知识问答”顺势而生,致力于为企业构建动态且高效的知识管理体系,助力企业在数字化浪潮中实现智能升级与突破。

飞书“知识问答”通过深度学习和自然语言处理技术,有效整合企业内部多样化的知识资源。这些资源涵盖飞书云文档、本地文件、企业业务系统和消息记录等多个维度,实现了对知识的智能采集与动态更新。相较于传统静态的知识库管理,飞书“知识问答”让信息从被动储存转向主动流动,员工在面对业务、技术或流程问题时,能够迅速获得精准答案,大幅度缩短了信息搜索时间,降低沟通成本,极大地提升了日常办公的敏捷性与准确性。此外,该产品支持实时联网搜索与多格式文件解析,不论是文本、表格、PPT还是聊天记录,都能被智能识别与调用,确保答案的全面性与准确度。这不仅满足了企业知识形式复杂多样的需求,也适应了数据量激增的挑战。

数据安全性是企业在应用AI技术时尤为关注的领域,飞书“知识问答”以企业场景为核心,严格保障数据隐私。只有拥有相应访问权限的员工才能查询特定内容,符合企业对信息安全和隐私保护的高标准要求,增强企业在数字化转型过程中的信任感与合规性。这些优势使得飞书“知识问答”迅速赢得了众多企业的认可,成为打通信息孤岛、实现智能问答的关键利器,被誉为企业的“AI新员工”。

飞书在企业级AI应用落地方面积累了丰富的实战经验。通过不断更新和沉淀大型企业的AI应用案例库,飞书为产品、设计、运营和技术团队提供切实可行的实战路径与项目指导。例如,新大正物业通过飞书AI服务台,实现了自动总结归纳与知识管理的“去手工化”,提升了服务水平和管理效率;新能源企业新能德利用飞书构建了完善的知识管理体系,规范安全生产知识传承和客户设备审核,推动业务流程更高效透明。这些项目彰显了飞书AI产品与行业深度融合的实际成效,体现出其解决方案在垂直领域的广泛适用性和落地能力。

不仅如此,飞书还注重构建完整的AI生态体系,通过开源和飞书智能伙伴平台,企业能够根据自身特色灵活定制专属AI助手,实现知识库与业务应用的无缝对接。其低代码AI开发工具帮助知识密集型企业快速搭建符合内部需求的智能知识管理平台,极大降低了AI应用门槛,促进了人工智能与传统业务的深度融合。无论是推动敏捷项目管理,还是支持工业领域复杂研发,飞书均提供强有力的技术支撑,助力企业实现降本增效和创新能力提升。

当前,随着大模型能力的不断增强,企业对AI赋能的期待逐渐加大。然而,飞书CEO谢欣指出,绝大多数企业在拥抱AI的路上仍存在短板,尤其表现在数据治理、系统集成和人才能力方面。飞书“知识问答”的问世,为企业提供了一条可操作性强的智能升级路径,从基础知识整理到复杂智能问答,稳步推进企业迈入AI驱动的高效办公新时代。

总之,飞书“知识问答”依托深度整合企业数据资源、支持多格式解析和实时搜索技术,显著提升了企业知识管理的智能化水平。结合飞书更广泛的AI产品矩阵和丰富的行业实践,整体生态体系帮助企业高效应对数字化转型挑战,最大化知识资产的价值。未来,随着更多企业将AI深度融合于日常运营工作,基于飞书的智能知识问答工具无疑将成为数字化管理的核心利器,推动知识管理与业务创新的深度结合。AI正逐渐从概念走向真实的生产力,而飞书正以扎实的技术创新和场景落地力量,引领企业智能办公的未来方向。


魅族星纪AI眼镜:眼动追踪+智能识脸革新体验

近年来,随着人工智能(AI)和增强现实(AR)技术的迅猛发展,智能穿戴设备迅速成为科技行业的焦点。在这个大背景下,智能眼镜作为连接人类与数字世界的重要设备,正在经历从硬件单一功能向多场景生态系统的转变。国内智能眼镜领域的领军企业星纪魅族,持续深耕技术前沿,致力于将AI技术和智能眼镜深度融合,其最新发布的StarV下一代AI眼镜无疑成为行业关注的焦点,充分展现了智能穿戴设备向更高智能化与时尚化发展的趋势。

StarV下一代AI眼镜集成了多项技术创新,展现出智能穿戴的新高度。其中,眼球追踪技术尤为引人注目,用户只需通过简单的眼球动作就能完成接听或挂断电话,极大提升了使用便捷性与交互的自然感。此外,AI人脸识别带来了更强的安全保障和个性化体验,能够支持身份认证及界面智能切换。在日常应用中,拍照和扫码支付的加入进一步丰富了智能眼镜的功能,使其不仅是辅助工具,更成为满足用户多样化生活需求的智能终端。这样的设计显著拓宽了穿戴设备的应用场景,从通信延伸至生活服务,提升了整体使用价值。

外观设计方面,星纪魅族对时尚元素的注入同样令人印象深刻。StarV系列不仅注重技术创新,更追求产品美学的突破。优化的外观和轻便设计满足了现代消费者对舒适性和审美的双重需求。尤其是在2023年9月25日举行的星纪魅族AI生态发布会上,推出的StarV Air2 AR智能眼镜,以更精致轻巧的形态和全天候AI体验刷新了智能眼镜的使用标准。通过结合Flyme AIOS操作系统,这一系列产品实现了智能手机、AR眼镜与智能汽车的无缝连接,构建出覆盖多样生活场景的智能生态圈,打造出真正意义上的生态互联体验。

星纪魅族的发展战略不仅聚焦于硬件设备,还注重软硬件结合的生态构建。集团高管卢勇透露,未来AR眼镜将普遍实现“AI Always-On”,即人工智能功能持续在线,为用户提供实时、自然且流畅的服务。星纪魅族通过多年的技术积累,不断推进多模态交互技术的发展,融合显示、拍摄与AI处理能力,积极探索智慧互联的新范式。在汽车领域,星纪魅族携手汽车制造商推动智能座舱方案,致力于打造“手车互联”先行者的行业地位,扩展智能眼镜在车联网中的应用范围。这种跨行业生态的构建预示着智能穿戴设备将不再是孤立存在,而是成为更广泛场景中的关键交互入口,开启智慧生活新篇章。

用户体验的优化同样是星纪魅族持续关注的重点。眼球追踪技术除了用于交互控制外,还实现了拍照自动对焦和视觉疲劳监测功能,帮助用户保护视力健康。AI视觉技术支持的虚实融合及表情追踪功能,使得增强现实效果更为自然和沉浸。支付功能和安全认证的集成,提升了产品在日常生活中的实用性和安全感,增强了用户的使用黏性和满意度。由此可见,星纪魅族不仅注重技术的前沿探索,更关注技术与人文关怀的结合,努力构建一个智能且贴近用户需求的穿戴生态。

整体来看,星纪魅族StarV下一代AI眼镜代表着智能穿戴领域的新一轮升级,是技术与设计的完美融合。它突破传统智能眼镜功能的单一局限,强化了AI驱动下的人机交互体验,着眼于构建涵盖多终端、多场景融合的智能生态系统。随着技术成熟和用户需求多样性的不断提升,智能眼镜有望成为引领未来人机交互的核心入口,在教育、医疗、娱乐、办公等多个领域发挥广泛作用。星纪魅族紧抓技术变革的脉搏,推动智能穿戴设备从实验室走向普及,开启全民智能穿戴的新时代。StarV系列不仅是技术革新的结晶,更是智能生活方式变革的推动力量,未来在更多场景中的继续展现,让人充满期待。


英伟达发布Cosmos-Reason1,提升AI物理理解能力

近年来,人工智能技术取得了飞速发展,其应用领域也正从传统的数据处理与语言理解,逐渐向更接近现实世界的物理环境交互拓展。使AI模型不仅能够进行语言推理,还具备理解物理常识、具身推理及实际操作的能力,成为学术界和工业界共同关注的热点。英伟达最新推出的Cosmos-Reason1系列模型正是顺应这一需求应运而生,力图在机器人、自动驾驶等领域引领一次技术变革。

Cosmos-Reason1系列包含多个版本,主要有7B、8B和56B三种型号,均基于多模态大语言模型架构,能够同时处理视觉、语言等多种类型信息。其核心创新不仅在于结构设计,更在于训练机制和知识体系的构建。整个训练过程分为四个阶段:视觉预训练、通用监督微调(SFT)、物理人工智能监督微调和物理AI强化学习。通过这种层层递进的训练策略,模型不断增强对物理世界认知与推理的能力,为处理复杂的物理情景打下坚实基础。此外,针对物理认知中的知识组织,研究团队设计了“双本体”系统,将物理常识细化为空间、时间和基础物理三大类别,同时映射具体的具身代理,如人类、机械臂、人形机器人等的推理功能。这种设计,使得模型既拥有抽象的知识层面,又能结合个体动作功能进行长链式推理,生成符合物理规律的智能行为和决策,大大提升了AI对真实环境的适应性。

在技术架构方面,Cosmos-Reason1采用了创新的Mamba-MLP-Transformer框架。这一架构保留了Transformer擅长处理序列信息的优势,又突破了传统Transformer在连续空间数据处理上的局限,使模型能够更高效、准确地理解物理环境中的动态变化。例如,在视觉问答任务中,模型能够基于图像和视频内容准确分析情境,结合严格的物理推理,避免产生错误结论。公开数据表明,56B版本在物理常识基准测试中准确率达到约60.2%,超过了OpenAI的o1模型,而在具身推理任务中表现更为突出,平均得分达到63.7%,显示出该系列模型在物理环境认知上的领先优势。

除了模型本身,Cosmos-Reason1还构建了一个完整的生态系统。英伟达推出了“Cosmos”世界基础模型平台,支持文本、图像、视频等多模态数据的输入,并能生成高度逼真的虚拟世界模拟状态。这套平台不仅能辅助机器人和自动驾驶车辆实现复杂动态场景下的实时决策与环境理解,还为开发者提供丰富的开放模型资源,加速物理AI系统的研发进程。其开放架构和高度仿真能力,有效推动了智能设备在复杂多变的现实环境中的灵活互动,助力相关产业的技术升级。

在实际应用层面,Cosmos-Reason1展现出显著的现实价值。机器人领域借助这类具备物理常识与具身推理能力的模型,可以实现更精准的环境感知和动作规划,显著提高自动化作业的安全性和适应性。在自动驾驶领域,物理常识驱动的推理使得车辆能够更深入理解道路场景和动态变化,从而优化驾驶决策,增强行车安全。此外,Cosmos平台对多模态数据的高效处理及物理环境的精确模拟,也为科研人员在物理学研究、虚拟仿真和智能制造等多个领域提供了强有力的工具,推动了相关创新发展。

综上所述,英伟达的Cosmos-Reason1系列通过多模态学习框架、层次化本体设计及强化学习训练,显著提升了AI在物理世界中的推理与具身智能能力,突破了传统模型在现实环境理解与操作上的瓶颈。其背后的Cosmos平台为机器人、自动驾驶等行业注入了强大技术动力,推动了物理AI领域的快速进步。随着此类深度物理理解与推理能力大模型的不断成熟,未来AI将在更多实际应用场景中展现出更高的智能水准和实用价值,推动智能技术的丰富化与创新化,带来更加广泛而深刻的智能应用体验。


谷歌发布MedGemma AI,革新医疗图像分析

随着人工智能技术的飞速发展,医疗领域正经历着前所未有的深刻变革。尤其是在医学图像和文本分析领域,AI的广泛应用极大提升了诊断的精准度和效率,不仅减轻了医生的工作负担,也为患者带来了切实的健康福祉。2025年谷歌I/O开发者大会上,谷歌正式开源了其最新医疗AI模型MedGemma,基于其强大的Gemma 3架构,集成了多模态图像与文本的深度理解能力,被誉为医疗图像与文本分析的革命性工具。这一举措不仅推动了医疗AI的创新,也为全球医疗服务带来了新的希望。

MedGemma AI模型针对不同医疗需求,设计了两种主要配置:MedGemma 4B和MedGemma 27B。首先,MedGemma 4B版本拥有40亿参数,属于多模态模型的一员,专为处理多样的医疗图像数据而打造。它内置了谷歌自主研发的SigLIP图像编码器,经过大规模预训练,支持胸部X光、皮肤病学图像、眼科图像及组织病理学切片等多种类型的医疗影像。这款模型不仅能够快速、准确地完成图像分类任务,更具备生成结构化诊断报告的能力,为医生提供有力的诊断辅助。其对实时反馈的支持,使得4B模型在临床环境中更具操作便捷性,既适合部署于谷歌云的Vertex AI平台,也能在本地环境运行,满足医疗机构的不同实验或应用微调需求。

另一方面,MedGemma 27B版本拥有270亿参数规模,专注于医疗文本的深入理解和复杂的临床推理。该版本擅长处理电子健康记录、临床病例文本以及大量医学文献,能够辅助医生实现科学、精准的诊断决策。其强大的自然语言处理能力不仅提升了医疗文本自动解读的效率,还促进了智能问答系统的发展,为医生带来更为贴心的临床辅助功能。通过27B模型,医疗行业能够实现对海量文本信息的高效管理和利用,进一步推动数字化医疗的应用新高度。

除了强大的技术性能,MedGemma的开源属性极大地降低了医疗AI工具的研发门槛,拓宽了开发者和医疗机构的参与度。谷歌配套提供了详尽的技术指导和调优工具,便于模型的二次开发和个性化部署,使得不同医疗机构能够根据具体需求灵活调整和优化模型功能。与此同时,MedGemma深度融合图像和文本的多模态能力,推动了数据的协同分析,极大提升了诊断准确率和临床决策的科学性。这不仅代表了医疗AI技术的突破,也彰显了业界对未来智能医疗工具安全性、稳定性和易用性的期待。

在实际应用层面,MedGemma展现出广阔的发展前景。图像诊断方面,基于SigLIP编码器,模型能够精准识别常见及复杂病灶,显著加速胸透、皮肤病变筛查及病理切片分析流程。在文本处理方面,27B版本支持自动解读医嘱内容、病例摘要,并能为风险评估和治疗方案的制定提供辅助。多模态融合不仅避免了医务人员在图像和文本数据间的繁琐切换,还提升了综合诊断效率和判断准确度,有效推动了智慧医疗的实质落地。多家医疗机构和开发者投入到MedGemma生态建设中,持续通过数据积累和算法改进,推动模型性能不断攀升,促进全球医疗服务水平整体跃升。

谷歌此次发布的MedGemma模型代表了医疗AI领域的又一次质的飞跃。它运用先进的图像处理技术及深度文本理解,兼顾了大规模参数和灵活应用,成功打造出涵盖医学图像分类、诊断报告生成、临床文本分析和决策支持的全能AI引擎。凭借其媲美甚至超越临床医生的表现,MedGemma不仅有助于提高诊断准确率和效率,还能减轻医生的工作负荷,改善患者就诊体验。伴随着这一开源模型的普及,多模态智能医疗新时代已逐步走进现实,开启了医疗服务全新的发展篇章,助推全球医疗体系向更加智能、高效和人性化的方向演进。


多款AI应用因违规收集用户信息被通报

随着人工智能技术的飞速发展,AI应用已逐渐渗透进人们的日常生活。无论是智能聊天助手,还是功能多样的剪辑软件,都为用户提供了极大的便利。然而,技术红利背后隐藏的个人信息保护问题也开始浮出水面,引起了社会广泛关注。近期,国家网络与信息安全信息通报中心通报了应用宝平台上包括“智谱清言”、“Kimi”在内的35款移动应用存在违法违规收集和使用个人信息的行为,此事成为网络安全领域的热点话题。

这些被通报的应用类型多样,但尤以AI类产品为主,如“智慧AI聊天”、“虚拟恋爱AI”、“AI智能秘书”等。这些应用本意是通过智能技术提升用户体验,但实际操作中却存在超越用户授权范围收集个人信息的现象。例如,“智谱清言”在最新检测版本2.9.6中被发现收集的信息显著超出用户许可范围,“Kimi”则被指收集与业务功能无关的数据。这不仅对用户隐私构成侵犯,也明显违背了相关法律法规,对于消费者权益造成直接威胁。

违规行为具体表现多样,首先表现为应用在个人信息收集与使用的透明度严重不足。许多产品未按要求用结构化清单形式一一列明所收集信息类型及使用规则,让用户难以明确知晓自己的数据去向。这种模糊不清的处理方式易令人心生疑虑和不信任。其次,不少应用存在越权收集行为,包括采集未经过同意的数据,且涉及内容与其提供的服务功能无关。此外,还有应用在个人信息保护政策中故意淡化或隐瞒实际收集信息的范围,掩盖违规问题,进一步加剧了信息安全隐患。

违规问题不仅局限于AI应用,主流剪辑软件如“爱剪辑”、“妙剪”等同样被点名。这反映出部分移动互联网产品在追求市场扩张和用户增长的急切心态中,忽略了对用户个人信息安全的保护,甚至存在将用户数据用于商业营销和数据变现的现象。这类行为正在挑战现有监管体系的有效性,也触及了用户隐私保护的底线,令人担忧。

随着隐私泄露风险愈加突出,用户对于安装和使用此类应用的态度趋向谨慎,部分用户甚至开始主动回避新上线AI产品。面对这样的市场变化,行业内部亟需加强信息安全自律。企业应在产品设计和管理流程中注重用户数据保护,明确告知信息收集的具体目的和范围,确保用户充分知情并获得同意。同时,建立健全的数据安全技术防护机制,防止信息被滥用或泄露,提升整个生态的安全防护能力。

监管层面对信息安全问题的持续介入成为行业改进的重要推动力。此次公安部计算机信息系统安全产品质量监督检验中心与国家网络与信息安全信息通报中心的联合检测和公告,彰显了监管机构严厉打击违法违规收集个人信息行为的决心。随着技术手段和法规的不断完善,未来对类似违法行为的查处将更加严厉,促使整个行业向更规范、健康的方向发展。

人工智能技术的快速普及离不开社会对信息安全和隐私保护的强力支撑。唯有确保用户隐私得到有效保障,AI应用才能建立起信任基础,发挥其服务公众的潜力,实现可持续发展。此次通报的35款应用违规事件无疑是一记警钟,提醒业界和用户必须对个人信息安全承担起更多责任。展望未来,相关部门、企业与用户需要共同努力,打造一个更加透明、可信的数据使用生态,推动技术进步与伦理规范并重,实现人与技术的和谐共生。


面壁智能获数亿融资,加速AI赋能汽车业

近年来,人工智能技术,尤其是大模型领域的飞速发展,已经成为推动科技产业转型的重要动力。各种创新企业迅速活跃在资本市场和技术前沿,加速AI技术的落地应用。面壁智能作为一家专注于端侧AI及高效大模型研发的创新企业,凭借其独具特色的技术路线和商业潜力,吸引了大量投资者的关注,并完成了多轮亿元级别的融资。这不仅体现了资本市场对端侧大模型领域持续的热情,也反映了AI技术在汽车等关键产业的深度融合与广泛应用趋势,预示着智能化未来的发展潜力。

面壁智能自2022年成立以来,融资活动异常活跃。2023年4月,公司完成了由知乎和智谱AI联合投资的数千万元天使轮融资。随后,2024年4月,春华创投领投,北京市人工智能产业投资基金等多方跟投,融资规模迅速扩展到数亿元。2024年12月,面壁智能再次完成由龙芯创投、鼎晖百孚、中关村科学城基金和赛富投资基金联合领投的融资,金额同样在数亿元级别。此外,洪泰基金、国中资本、清控金信及茅台基金等知名机构也积极参与投资。如此频繁且规模庞大的融资动作,充分反映了资本市场对面壁智能技术实力和商业模式的高度认可,也展示了端侧大模型技术的市场吸引力。

面壁智能的核心竞争力在于其以“高效”为第一性原理,集中攻克大模型训练与推理效率瓶颈,打造技术壁垒并构建产品竞争优势。公司将大部分资金投入到底层算力提升和数据资源建设,吸引了一批业界顶尖人才,促进模型技术实现跨越式发展。CEO李大海提出,面壁智能目标是构建“端侧大脑”,实现千行百业的技术规模化落地,通过与产业链上下游密切协作,共同打造开放协同的生态体系,从而实现技术与产业的深度融合。具体而言,公司推出的“小钢炮超级助手cpmGO”是全球首个车载端侧智能助手,已正式应用于智能汽车领域,表现出较强的技术转化能力和市场前景。

不仅如此,面壁智能通过MiniCPM技术实现车载端侧AI的本地智能处理,涵盖语音识别、视觉感知以及车控推理等功能,大幅提升智能网联汽车的响应速度和隐私安全保障。这种纯端侧智能方案满足了智能汽车在算力与实时性方面的严苛需求,对自动驾驶、智能交互等高级功能的广泛普及具有重要推动作用。随着汽车、出行和制造等行业对AI技术需求的极速扩增,面壁智能借助其技术优势和雄厚资本,正在加速端侧AI解决方案的商业化进程,推动产业智能化升级,为智能行业的发展注入强劲动力。

综观当前局势,面壁智能凭借其独有的技术策略与产业布局,连续吸引龙芯创投、春华创投、洪泰基金、茅台基金等多家顶级资本关注,累计融资额度达数亿元。大模型技术从理论研究快速向实际应用转变,推动了企业加紧构筑技术壁垒并扩展产业生态,尤其是在智能汽车领域的深耕日益显著。面壁智能的成长轨迹不仅彰显中国AI原创企业的创新活力,也反映出投资方对端侧智能未来商业价值的持续期待。未来,随着端侧AI的广泛普及和技术不断提效,面壁智能有望成为推动各行各业智能升级的重要推动力量,引领大模型技术迈向更高效、更普及的新时代。


百度李彦宏:未来五年培养千万人才助推AI发展

近年来,人工智能(AI)技术的迅猛发展,正在深刻改变科技行业格局,并成为推动社会经济转型的核心力量。作为中国科技领域的重要引擎,百度在AI人才培养方面的持续投入备受瞩目。2024年,百度创始人李彦宏宣布,在成功提前完成2020年提出的五年培养500万AI人才目标后,将启动“百度人才培养星河计划”,未来五年再为社会培养1000万名AI人才。这一大胆而远大的计划,不仅展现了百度对构建AI生态系统的深刻理解,也体现了中国在全球科技竞争中抢占先机的雄心和战略视角。

百度为何如此重视AI人才培养?首先,AI技术的发展离不开高素质的专业人才。人才既是推动技术创新的重要驱动力,也是企业持续发展的根基所在。李彦宏多次强调,在全球AI竞争加剧的背景下,构建庞大且高质量的AI人才库,是掌握技术话语权、夺取未来科技制高点的关键。回顾过去,百度在2020年提出“5年培养500万AI人才”的目标,仅用四年时间便超额完成,彰显了其在人才培养领域的深刻布局和强大执行力。这一成功经验为新一轮人才培养计划奠定了坚实基础,也映射出中国科技产业对人才红利的深切认知。

“百度人才培养星河计划”不仅是数量上的扩充,更强调体系化和高质量发展。为了实现未来5年培养1000万名AI人才的目标,百度采取了多渠道、多模式的创新举措。首先,百度将开放21000个实习岗位,尤其针对高校学生提供切实的实践机会。实习生们将能够参与到百度核心产品研发当中,提升实际操作能力和创新意识,打通理论与实践的桥梁。其次,该计划推出了三大实习专项,聚焦AI基础研究、大模型技术应用及产业落地。这种跨学科的培训模式有助于培养学员解决复杂问题的能力,促进他们综合素养的提升。最后,百度整合了丰富的内部技术资源和生态资源,推动校企深度合作,实现教育链、产业链与创新链的有机融合,从而为整个AI产业的发展注入源源不断的动力。

AI人才的培养不仅影响科技创新,还对未来社会和产业变革具有深远意义。随着自动驾驶、智能医疗、智慧金融、智能制造等领域的快速商业化,专业AI人才的需求急剧增长。百度的计划助力缓解行业人才短缺,促进技术创新与应用落地,加速数字经济发展。同时,广泛的人才储备也激发创新文化建设和创业生态繁荣,催生新兴企业和创新项目,推动经济结构优化升级。此外,人才规模的扩大还将降低AI技术的门槛,实现技术普惠,使人工智能更好地服务于普通民众与社会治理,促进社会生产力整体跃升。

百度此次提出的“人才培养星河计划”,是在总结前期成功经验基础上的进一步升级。通过搭建更开放、更系统、更前瞻性的培养平台,百度既展现了作为全球科技巨头的战略远见,也为中国AI产业的持续发展和科技实力提升增添了强劲动力。随着人才数量和质量的提升,人工智能必将深度融入社会经济的各个层面,推动中国科技创新迈入新阶段。同时,这一宏大的培养蓝图也有望引领更多企业、高校共建协作,为全球AI生态贡献中国智慧与力量。百度的努力正成为中国乃至全球科技竞赛中一股不可忽视的强大推动力,预示着AI领域未来将迎来更繁荣、更具包容性的时代。


智元机器人灵犀X25.22发售,三款10万起!

随着人工智能技术的迅猛发展,智能机器人已逐步从实验室的概念走向市场的实际应用,成为科技与日常生活深度融合的重要标志。中国智元机器人公司近期推出的双足人形机器人“灵犀X2”,计划于2025年5月22日正式开售,瞬间引发业界和公众的广泛关注。这款机器人不仅代表了智能机器人商业化的重要进展,更预示着未来智能设备将在更多生活场景中发挥不可替代的作用。

机械设计与运动表现的突破

灵犀X2由智元机器人旗下的X-Lab团队研发,拥有28个自由度,体重约33.8公斤,身高1.3米,机械结构上摒弃了传统并联设计,使动作灵活且丰富多变。搭载的小脑控制器Xyber-Edge、域控制器Xyber-DCU以及智能电源系统Xyber-BMS,构成了机器人强大的硬件基石。这些优势使得灵犀X2能够完成跳舞、奔跑,甚至踩滑板车和骑自行车等高难度动作,灵动性媲美生物体,极大地提升了其在复杂运动任务中的适应能力。这种赋予机器人“身躯”自由的设计,打开了运动智能的新局面,也为日后多样化的服务场景奠定了坚实基础。

多模态交互与智能感知技术

除机械硬件之外,灵犀X2集成了智元启元大模型GO-1及其多模态交互系统“硅光动语”,具备毫秒级的反应速度。它不仅能通过面部表情和语音语调精准识别用户情绪,还能自主发起语音交流,体现出近乎“内心独白”的交流模式。这种多模态交互技术极大提升了机器人的社交智能,使人与机器的沟通更自然、流畅。智元机器人联合创始人彭志辉(稚晖君)通过视频展示了灵犀X2新增的功夫动作和反应速度的显著提升,令众多网友大加赞赏。可以预见,灵犀X2的智能交互不仅适应商业导览、娱乐演出等场景,也为未来陪伴机器人在康养、教育等领域提供了强有力的技术支撑。

多版本产品与市场应用布局

灵犀X2面向小尺寸室内人形机器人市场,首批推出三种版本:基础的交互版、探索版X2 Pro以及旗舰版X2 Ultra,价格区间介于10万元至30万元之间,满足科研、商业和高端应用的多层次需求。灵犀业务部总裁魏强表示,灵犀X2不仅在演出展览和导览市场潜力巨大,更可作为康养陪伴机器人,推动智能化升级。智元机器人已开放官网预定,启动合作伙伴招募,预计首批出货量将达数百台。未来,面向家庭和个人用户的四足机器人产品也将于今年第二季度上市,持续丰富产品线,构建更加完善的智能机器人生态。

灵犀X2具备运动智能、交互智能和作业智能三大能力,依托多模态学习算法和情感计算引擎,不仅能完成复杂物理任务,还能支持零样本泛化,实现无需额外训练即可适应新任务和多机协作,这大大增强了其实用性和适用场景的多样性。该机器人被业内誉为“具身智能”领域迈向量产和场景落地的重要标志,必将在推动整个智能机器人行业进步方面发挥示范作用。

灵犀X2突破了传统机器人因高昂成本和单一功能导致的局限,以先进的运动系统设计、多模态智能交互技术和灵活作业能力,为智能机器人商业化提供了切实可行的解决方案。随着5月22日的正式开售,这不仅展示了智元机器人在研发与商业化上的综合实力,也为智能机器人深入人们的日常生活创造了契机。展望未来,随着灵犀X2及后续产品的普及,智能机器人将在服务、娱乐、教育、医疗等多个领域扮演越来越重要的角色,助推智慧社会的全面到来。


SAG-AFTRA状告Epic侵权指控虚拟达斯维达

随着人工智能技术的快速发展,其在娱乐产业中的应用日益广泛,从电影特效到虚拟偶像,AI正以前所未有的方式改变着创作和生产模式。然而,技术进步带来的不仅是效率和创新,同时也引发了关于劳动权益与伦理的激烈讨论。最近,Epic Games旗下热门游戏《Fortnite》引入AI合成的达斯·维达配音,激起了演员工会SAG-AFTRA的强烈抗议,掀起了一场关于AI替代真人配音演员的争议。这一事件深刻反映了人工智能对传统娱乐行业劳动关系的冲击与挑战,值得我们深入剖析。

Epic Games通过与第三方技术公司Respeecher合作,使用大量詹姆斯·厄尔·琼斯——这位已故传奇演员的原声音频,训练生成了达斯·维达的AI声音。这种技术创新极大增强了《Fortnite》的沉浸感,使玩家能够与经典角色进行互动,提升了游戏体验的丰富度和趣味性。然而,很快就出现了令人担忧的问题:玩家可以驱使AI角色使用粗俗和侮辱性的语言,给游戏的社区管理带来了严重挑战。Epic不得不紧急推送补丁,限制AI角色的言语内容,显示出AI语音合成在技术控制和社会接受度之间还存在诸多难题。

更为根本的争议则源于Epic未与代表游戏配音演员的演员工会SAG-AFTRA进行协商便擅自启用AI合成声音。SAG-AFTRA认为,这不仅触及了版权和使用许可,更直接侵犯了工会成员的谈判权利和劳动权益。工会以Epic所属的子公司Llama Productions“未善意协商”为由,向国家劳动关系委员会提起不公平劳动行为投诉,反映出演艺行业对新兴技术取代人类工作存在深切担忧。SAG-AFTRA明确指出,任何通过AI复制或合成演员声音的行为,都应在工会谈判框架内进行,以保护演员的工作权利与经济利益。这不仅是版权问题,更是劳工保护机制的重要体现。

此次事件还引发了娱乐产业及相关法律界关于人工智能技术应用和劳动关系的广泛反思。AI在创作领域的影响早已超越声音合成,还包括图像生成、动作捕捉等多方面应用,这些技术为内容创新带来巨大突破,但同时也可能导致传统岗位大幅减少。如何在推动技术创新的同时妥善保障劳动者权益,成为亟需解决的难题。同时,《Fortnite》作为全球热门跨平台游戏,其市场影响力极大,Epic Games的做法和相关仲裁结果将成为行业的风向标。众多业内专家和法律学者开始倡导完善集体谈判机制,明确AI生成内容的知识产权归属与劳动法律责任,力求形成新形势下科技与劳动的和谐共处范式。

从这起争议中可以看到,人工智能不仅挑战了传统的创作模式,也深刻冲击了现有的劳动法律和行业规范。保护创作自由与激发创新活力的同时,如何合理保障演员及其他劳动者的权益,已成为各方必须直面的核心课题。未来,游戏厂商、工会、法律机构乃至公众都应积极参与这场关于技术进步与劳动保护之间平衡的讨论,共同推动建立一个既尊重创新精神又维护劳动公正的生态体系。只有这样,娱乐产业才能在AI时代实现可持续健康的发展,既让技术成为创作的助力,也让劳动者的尊严和利益得到应有保障。