通信运营商正不断演进其云基础设施战略,以满足AI发展的需求

Omdia近期针对通信运营商中的高级运营、IT及CTO决策者开展了一项调研,重点了解其不断演进的云与AI基础设施偏好,尤其是在支持通信云(telco cloud)中的AI/ML能力方面。本博客基于该调研结果,总结了运营商如何调整其云基础设施战略,以应对当前及未来的AI工作负载,并把握新兴市场机遇。

云基础设施将持续演进,以支持AI/ML能力部署及外部市场机会

随着AI逐渐成为提升运营效率与创造新收入机会的关键推动力,通信运营商正加速将AI/ML能力整合进其云环境中。参与Omdia最新“通信云与厂商认知调查”的运营商中,大多数(70%)表示,在云基础设施决策中,对AI/ML工作负载的支持能力已成为关键考量因素。

这一变化主要源于先进AI应用场景(包括生成式AI与预测分析)的快速普及,而这些应用需要更强大的计算资源与更复杂的基础设施支撑。

图1:支持AI/ML训练与推理工作负载正逐渐成为通信网络云基础设施决策中的关键因素,您对此的认同程度如何?

通信运营商正不断演进其云基础设施战略,以满足AI发展的需求

这些AI/ML训练与推理能力的需求,主要来自多个应用场景,包括网络运营与管理、业务保障、资源与基础设施优化(如AI-RAN)、能源效率提升、客户体验管理与分析,以及业务增长相关机会。

不同AI/ML工作负载对硬件平台具有不同计算需求

为了应对AI工作负载对算力的高强度需求,通信运营商正逐步突破传统基于CPU的系统架构,转向采用专用硬件平台。GPU、DPU与NPU正在成为其硬件平台选择中的核心组成部分。

在同一项调研中,58%的受访者表示正在采用或考虑采用GPU,而超过半数的受访者则将DPU与NPU纳入AI处理/推理能力建设方案中。

这些专用架构针对并行处理与高性能计算进行了优化,因此非常适合AI训练与推理任务。

图2:您正在部署/考虑通过哪些方案,为通信云基础设施增加AI处理/推理能力?(请选择前三项)

通信运营商正不断演进其云基础设施战略,以满足AI发展的需求
来源:Omdia《2026年通信网络对云和AI基础设施的偏好》

然而,硬件选择并非易事。通信运营商必须在成本与性能之间进行谨慎权衡,同时综合考虑计算强度、时延敏感性以及安全性等关键工作负载需求。当AI被直接嵌入网络设备时,这一战略决策会变得更加复杂,因为硬件方向往往由厂商合作关系预先决定。

在AI-RAN部署中,AI通过频谱效率优化、波束赋形、流量管理以及定位服务等方式提升网络性能,而硬件方向主要由设备厂商主导。Ericsson 采用专用ASIC,将AI直接集成进其自研芯片,并通过高度精简的模型实现纳秒级至微秒级推理速度,以满足实时无线控制需求。这种方案能够提供极强的确定性性能与较低运营成本,但也意味着较高的前期投入以及更强的厂商绑定效应。

相比之下,三星与Nokia则采用软件定义方式,基于商用现货服务器(COTS)与多元硬件合作伙伴开展部署,包括英特尔(Intel)、英伟达(NVIDIA) 以及 AMD。

对于许多其他应用场景,例如 Mavenir 推出的网络侧AI语音服务,其可提供实时通话翻译与摘要功能,则会基于现有承载云原生IMS核心网的CPU基础设施进行优化,以支持AI模型推理能力。

通信运营商现有云基础设施选择使其在AI就绪方面具备显著优势

Omdia认为,随着行业从训练大型语言模型(LLMs)逐步转向以推理(inferencing)为核心的阶段,通信运营商正处于能够充分把握AI基础设施机会的有利位置。这一转变带来了显著的复杂性,要求系统具备分布式架构、复杂的资源编排能力、多租户支持以及强大的工作负载隔离能力——而这些正是通信运营商长期积累深厚能力的领域。

Omdia的调研数据显示,大多数通信运营商决策者倾向于将RAN与核心网云化,从而构建覆盖中心云、区域云与边缘云的分布式云架构。这种基础设施布局天然支持在不同部署场景下运行多样化的AI工作负载。

通过在网络的多个层级合理部署计算资源,运营商能够灵活应对不同AI应用在时延、带宽以及计算能力方面的差异化需求,从而更好地满足多样化AI场景的要求。

图3:哪种基础设施在性能与总体拥有成本(TCO)之间的组合最优,适用于承载以下网络功能?

通信运营商正不断演进其云基础设施战略,以满足AI发展的需求
来源:Omdia《2026年通信网络对云和AI基础设施的偏好》

此外,通信运营商对Kubernetes在容器化网络功能(CNFs)中的采用,为AI推理能力提供了关键优势。他们在管理CNFs过程中所积累的高级资源编排能力,可以直接迁移到AI工作负载所需的复杂编排需求中。这一经验使得运营商能够高效应对AI推理所要求的动态资源分配与调度问题。

在多厂商环境中长期运行,也使通信运营商在工作负载隔离方面积累了丰富经验,而这一能力在AI推理阶段变得尤为关键。与通常为单一大型任务分配整组GPU集群的LLM训练不同,推理场景往往需要多个应用同时共享计算资源,同时仍需维持严格的安全边界。

通信运营商基于Kubernetes与虚拟化工具所构建的复杂资源编排体系,使其能够应对企业在实际应用中常见的挑战,例如在内部部门或不同应用之间共享GPU资源,而无需额外开发定制化编排平台。

SK Telecom 等运营商已成功展示出,通信企业如何利用既有经验与资产来构建并运营大规模AI基础设施。SK Telecom展示了如何借助既有虚拟化技术栈,实现更高的GPU资源利用率,同时保持工作负载隔离,并将性能损耗降至最低。

这一能力解决了AI基础设施中的关键挑战:在最大化昂贵GPU投资回报的同时,确保多个工作负载能够在共享硬件上安全、高效地并存运行。

本文作者:Inderpreet Kaur,资深分析师,通信运营商

版权声明:本文内容转自互联网,本文观点仅代表作者本人。本站仅提供信息存储空间服务,所有权归原作者所有。如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至1393616908@qq.com 举报,一经查实,本站将立刻删除。

(0)

相关推荐