Neocloud(新兴云) 市场现状性能专精,这正日益成为一些人所谓的“多计算策略”的重要组成部分。总的来说,这意味着企业使用超大规模数据中心处理通用工作负载,使用 Neocloud 进行模型训练,并使用边缘基础设施进行推理。

从本质上讲,Neocloud 是新一代云基础设施提供商,专为满足 AI 的计算需求而构建。与服务于各种企业工作负载的传统超大规模云(例如亚马逊云服务 (AWS)、微软 Azure 和谷歌 GCP)不同,Neocloud 专注于以 GPU 为中心的计算,并针对 AI 的训练、微调和推理进行了优化。
这种专业化反映了企业计算向高度并行处理的转变,尤其是在大型语言模型和其他机器学习工作负载方面。在这些应用中,GPU 提供了通用 CPU 所不具备的性能优势。
由于高端 GPU 短缺、采购周期长以及本地硬件成本不断攀升,对新型云的需求日益增长。这些趋势使得许多组织陷入了内部资源有限和公有云 GPU 实例成本高昂的困境。Neocloud 提供商旨在通过提供优化的 GPU 可用性、灵活的定价模式以及专注于 AI 性能的基础设施来填补这一空白。
Neoclouds市场将走向何方?
根据Mordor Intelligence 最近的一份报告,受 GPU 容量需求激增、生成式 AI 工作负载需求增长以及对传统超大规模 AI 基础设施成本结构的不满所驱动,新云正在进入高速增长阶段。
Mordor预测,未来几年,Neocloud 领域将保持强劲的两位数复合年增长率,其中生成式 AI 训练和推理工作负载是主要驱动力。该报告强调,由于GPU稀缺、价格波动和性能不稳定,企业和 AI 原生初创公司都在寻求超大规模云服务的替代方案。
据 Mordor 称,对高密度 GPU 集群(尤其是围绕 NVIDIA 最新加速器构建的集群)的需求已经超过了供应,这为能够聚合、优化 GPU 基础设施并将其专用于 AI 用例的专业云提供商创造了机会。
Neocloud 产品与超大规模云服务提供商有何区别?
当然,超大规模数据中心提供商也提供 GPU 实例。那么,neocloud 服务有何特别之处呢?
首先,新云不提供通用的计算服务,而是专注于高性能 AI 集群和特定工作负载的基础设施调优。
它们提供大规模 GPU 资源、AI 优化网络(例如 InfiniBand 和高吞吐量东西向流量设计)、裸机和近裸机性能选项,以及针对 AI 训练周期量身定制的灵活定价模式。
其次,Neocloud 提供商主要在价格和专业化方面展开竞争。在这方面,超大规模云服务提供商的定价模式通常包含企业和 AI 公司未必需要的抽象层和高级服务。相反,新型云服务提供商则强调更低的 GPU 小时费率、透明的定价、专用基础设施模式以及更低的出口流量和网络费用。
Neocloud 如何支持企业从多云向多计算策略的转变
过去十年间,随着云服务的爆炸式增长,企业纷纷采用多云战略,以降低对单一供应商的依赖,同时提升灵活性、弹性和成本控制。通过将工作负载分布在多个云平台上,企业可以避免被单一供应商锁定,并协商更优惠的价格,同时为特定工作负载选择最佳服务。
类似地,Neocloud 提供性能专精,这被纳入了所谓的“多计算策略”中。本质上,企业正在将不同的 AI 相关工作负载迁移到能够紧密匹配这些工作负载的计算、速度和成本要求的服务提供商。一般来说,这意味着他们使用超大规模数据中心处理通用工作负载,使用 Neocloud 进行模型训练,并使用边缘基础设施进行推理。
人们对多计算方案日益关注的原因之一是训练和推理的经济效益正在出现分化。推理工作负载,尤其是在企业级 AI 应用中,正成为当今许多企业的主要成本中心。因此,企业正在更加密切地关注推理的单次计算成本、实时 AI 系统的延迟要求以及混合部署模型。
结语
受生成式 AI 、GPU经济效益和企业性能需求的推动,Neocloud 市场正在快速扩张。对企业而言,关键在于 AI 基础设施的专业化正在重塑云战略。能够将基础设施战略与 AI 工作负载设计相结合的企业,将更有利于从云演进的下一阶段中获取价值。
作者:Salvatore Salamone
原文:https://www.rtinsights.com/real-time-analytics-news-for-the-week-ending-february-28/
本文来自作者投稿,版权归原作者所有。如需转载,请注明出处:https://www.nxrte.com/zixun/65291.html