通信运营商正不断演进其云基础设施战略，以满足AI发展的需求

Omdia近期针对通信运营商中的高级运营、IT及CTO决策者开展了一项调研，重点了解其不断演进的云与AI基础设施偏好，尤其是在支持通信云（telco cloud）中的AI/ML能力方面。本博客基于该调研结果，总结了运营商如何调整其云基础设施战略，以应对当前及未来的AI工作负载，并把握新兴市场机遇。

云基础设施将持续演进，以支持AI/ML能力部署及外部市场机会

随着AI逐渐成为提升运营效率与创造新收入机会的关键推动力，通信运营商正加速将AI/ML能力整合进其云环境中。参与Omdia最新“通信云与厂商认知调查”的运营商中，大多数（70%）表示，在云基础设施决策中，对AI/ML工作负载的支持能力已成为关键考量因素。

这一变化主要源于先进AI应用场景（包括生成式AI与预测分析）的快速普及，而这些应用需要更强大的计算资源与更复杂的基础设施支撑。

图1：支持AI/ML训练与推理工作负载正逐渐成为通信网络云基础设施决策中的关键因素，您对此的认同程度如何？

这些AI/ML训练与推理能力的需求，主要来自多个应用场景，包括网络运营与管理、业务保障、资源与基础设施优化（如AI-RAN）、能源效率提升、客户体验管理与分析，以及业务增长相关机会。

不同AI/ML工作负载对硬件平台具有不同计算需求

为了应对AI工作负载对算力的高强度需求，通信运营商正逐步突破传统基于CPU的系统架构，转向采用专用硬件平台。GPU、DPU与NPU正在成为其硬件平台选择中的核心组成部分。

在同一项调研中，58%的受访者表示正在采用或考虑采用GPU，而超过半数的受访者则将DPU与NPU纳入AI处理/推理能力建设方案中。

这些专用架构针对并行处理与高性能计算进行了优化，因此非常适合AI训练与推理任务。

图2：您正在部署/考虑通过哪些方案，为通信云基础设施增加AI处理/推理能力？（请选择前三项）

然而，硬件选择并非易事。通信运营商必须在成本与性能之间进行谨慎权衡，同时综合考虑计算强度、时延敏感性以及安全性等关键工作负载需求。当AI被直接嵌入网络设备时，这一战略决策会变得更加复杂，因为硬件方向往往由厂商合作关系预先决定。

在AI-RAN部署中，AI通过频谱效率优化、波束赋形、流量管理以及定位服务等方式提升网络性能，而硬件方向主要由设备厂商主导。Ericsson 采用专用ASIC，将AI直接集成进其自研芯片，并通过高度精简的模型实现纳秒级至微秒级推理速度，以满足实时无线控制需求。这种方案能够提供极强的确定性性能与较低运营成本，但也意味着较高的前期投入以及更强的厂商绑定效应。

相比之下，三星与Nokia则采用软件定义方式，基于商用现货服务器（COTS）与多元硬件合作伙伴开展部署，包括英特尔（Intel）、英伟达（NVIDIA）以及 AMD。

对于许多其他应用场景，例如 Mavenir 推出的网络侧AI语音服务，其可提供实时通话翻译与摘要功能，则会基于现有承载云原生IMS核心网的CPU基础设施进行优化，以支持AI模型推理能力。

通信运营商现有云基础设施选择使其在AI就绪方面具备显著优势

Omdia认为，随着行业从训练大型语言模型（LLMs）逐步转向以推理（inferencing）为核心的阶段，通信运营商正处于能够充分把握AI基础设施机会的有利位置。这一转变带来了显著的复杂性，要求系统具备分布式架构、复杂的资源编排能力、多租户支持以及强大的工作负载隔离能力——而这些正是通信运营商长期积累深厚能力的领域。

Omdia的调研数据显示，大多数通信运营商决策者倾向于将RAN与核心网云化，从而构建覆盖中心云、区域云与边缘云的分布式云架构。这种基础设施布局天然支持在不同部署场景下运行多样化的AI工作负载。

通过在网络的多个层级合理部署计算资源，运营商能够灵活应对不同AI应用在时延、带宽以及计算能力方面的差异化需求，从而更好地满足多样化AI场景的要求。

图3：哪种基础设施在性能与总体拥有成本（TCO）之间的组合最优，适用于承载以下网络功能？