人工智能技术的飞速发展正以前所未有的速度重塑着各行各业,而支撑这些先进模型的背后,是对于强大且高效基础设施的迫切需求。虽然对复杂AI模型的开发受到了广泛关注,但将这些模型实际部署应用,即AI推理,往往面临着巨大的挑战。传统的数据中心在应对推理的计算需求时显得捉襟见肘,导致部署时间过长、成本居高不下。这种现状推动了AI基础设施领域的创新,各公司纷纷寻求简化流程,加速生成式AI能力的落地。
SambaNova Systems公司便是这一领域冉冉升起的一颗新星。该公司由Sun/Oracle和斯坦福大学的资深人士于2017年创立。最近,SambaNova推出了SambaManaged,这是一个交钥匙AI推理解决方案,旨在解决对更快、更高效部署的关键需求。这一方案以其惊人的快速部署时间——仅仅90天——而脱颖而出,与传统实施方案通常需要的18到24个月相比,这是一个巨大的进步。SambaManaged是一个模块化产品,专为快速集成到现有数据中心基础设施而设计,最大限度地减少了对现有设施进行大规模修改的需求。这使得企业能够快速建立AI推理服务,而不会对其当前运营造成重大中断。
SambaManaged的核心价值在于它能够帮助企业快速部署最先进的生成式AI。在当今竞争激烈的环境中,企业越来越依赖AI来获得竞争优势,这一点尤为重要。除了部署速度,SambaNova还强调其平台的性能。Artificial Analysis的独立基准测试表明,SambaNova拥有目前最快的AI推理平台。为了展示这一能力,SambaNova Cloud服务能够以每秒461个tokens的速度运行Meta的Llama 3.1模型(700亿参数版本),以每秒132个tokens的速度运行4050亿参数版本。这种速度的实现得益于一个专为企业级AI构建的平台,这与传统的以GPU为中心的方法有所不同。该公司的SN40L RDU是一个关键组件,旨在扩展agentic AI,并满足任何规模的组织的需求。这种对性能的关注也延伸到了其云产品,提供免费、开发者和企业级别,使更广泛的用户可以访问。
SambaNova的战略不仅仅是提供一个更快的解决方案。该公司正积极通过战略合作伙伴关系扩大其影响力。与软银公司的合作包括在日本软银的AI数据中心内托管SambaNova Cloud,为该地区的开发者提供超快的AI推理服务。此外,通过Inference Providers与AWS Marketplace和Hugging Face等平台的集成,展示了其对可访问性和与现有AI开发工作流程无缝集成的承诺。与Hugging Face的合作旨在实现AI模型的高效部署和扩展,以用于实际应用。然而,前进的道路并非一帆风顺。SambaNova最近进行了重组,裁员15%以将其精力重新集中在推理、微调和云服务上,这标志着该公司向这些核心领域的战略转变。尽管如此,该公司仍然得到了包括贝莱德在内的巨额投资的支持,并继续将自己定位为不断发展的AI基础设施领域的领导者。
人工智能推理芯片及平台的竞争格局日益激烈。除了SambaNova之外,英伟达(Nvidia)凭借其强大的GPU产品线,长期占据着市场主导地位。英伟达的GPU在AI训练和推理方面都表现出色,拥有成熟的软件生态系统和庞大的用户群体。然而,英伟达的GPU价格相对较高,且功耗较大,对于某些特定场景而言,可能并非最优选择。
Cerebras Systems是另一家值得关注的AI芯片制造商。Cerebras以其晶圆级芯片(Wafer Scale Engine,WSE)而闻名,该芯片集成了大量的计算核心和内存,能够处理超大规模的AI模型。Cerebras的WSE在某些特定任务上展现出了卓越的性能,尤其是在处理大型语言模型和科学计算方面。不过,Cerebras的芯片成本极高,部署和维护也较为复杂,主要面向大型科研机构和云计算提供商。
Groq是一家专注于AI推理的初创公司。Groq的芯片架构采用了独特的张量流处理器(Tensor Streaming Processor,TSP)设计,能够实现极高的计算效率和低延迟。Groq的芯片在推理性能方面具有显著优势,尤其是在处理实时视频分析和自然语言处理等任务时。Groq正在积极与各行业合作伙伴合作,推动其芯片在实际应用中的落地。
SambaNova Systems的优势在于其软硬件一体化的解决方案,以及对快速部署和易用性的重视。SambaNovaManaged的90天快速部署周期,对于希望快速部署AI推理服务的企业而言,具有很强的吸引力。SambaNova还积极拓展合作伙伴关系,通过与软银、Hugging Face等公司的合作,进一步扩大其市场影响力。
SambaNova Systems正在解决与AI推理相关的挑战方面取得重大进展。SambaManaged的推出,以及其高性能云平台和战略合作伙伴关系,为寻求快速部署和扩展生成式AI能力的企业提供了一个引人注目的解决方案。该公司对速度、效率和可访问性的承诺,以及对专用硬件和软件堆栈的关注,使其成为释放人工智能全部潜力的竞赛中的关键创新者。虽然来自英伟达等老牌企业以及Cerebras和Groq等新兴芯片制造商的竞争依然激烈,但SambaNova的独特方法和可证明的性能优势表明,它有能力在塑造AI基础设施的未来方面发挥关键作用。
发表评论