如何监控正确的 VoIP 和 UC 的 KPI?

您的网络可能处于“在线”状态,但用户体验却依然糟糕。通话中断、音频卡顿和视频延迟等问题,往往在用户开始投诉之前,传统监控工具都无法察觉。关键在于了解哪些性能指标能真正反映实时通信的质量。

如何监控正确的 VoIP 和 UC 的 KPI?

在本文中,我们将详细解析对 VoIP 和统一通信(UC)至关重要的关键绩效指标(KPI),并介绍如何利用这些指标来确保始终如一的高质量体验。

网络监控是每位管理员的核心职责,但针对 VoIP 和 UC 等实时服务,仅关注运行时间的传统方法已不再足够。这些服务对性能波动极为敏感,这意味着仅靠可用性无法保证服务质量。要维持高质量的用户体验(QoE),必须监控正确的 KPI。

MSP:一种独特的视角

托管服务提供商 (MSP) 在监控 VoIP 和 UC 环境时面临着额外的挑战。MSP 不仅要管理单个网络,还要负责维护多个客户环境中的服务质量,而这些环境的网络往往并非由他们完全控制。

在统一通信即服务 (UCaaS) 部署中,终端通过公共互联网连接到云托管平台,因此性能受多种外部因素影响。因此,MSP 必须超越设备和服务的可用性,关注端到端性能。在这些环境中,基于 KPI 的监控对于保持语音和视频质量的稳定性至关重要。

虽然这里讨论的原则具有广泛的适用性,但它们对于负责在多样化和分布式网络中提供可靠通信服务的 MSP 来说尤其相关。

为什么传统的网络监控不足以应对挑战

传统的监控工具通常侧重于设备和服务的可用性,往往只呈现简单的运行/停止状态。虽然这种方法很有用,但它对影响实时服务的性能问题提供的信息有限。

拥塞、路由效率低下以及DNS、NTP或 DHCP 等支持服务的延迟等问题,即使不触发可用性警报,也会降低性能。对于 VoIP 和 UC 等对时效性和一致性要求极高的场景,即使系统看起来运行正常,这些问题也会严重影响用户体验。

现代网络监控方法

对实时服务进行有效监控需要识别性能下降的迹象。这包括跟踪延迟、抖动、丢包以及其他影响服务质量的指标。

诸如合成监控之类的技术有助于模拟真实用户流量,并在问题影响用户之前发现它们。此外,监控服务质量 (QoS) 行为、网络路径和应用层性能可以更全面地了解服务的交付方式。

这种多层方法对于维持可靠的 VoIP 和 UC 性能至关重要。

VoIP 和 UC 的区别

VoIP 和 UC 流量的行为与典型的数据流量不同。这些应用依赖于实时媒体流和信令交换,而这两者都对延迟、抖动和丢包非常敏感。

由于此类流量是通过尽力而为的IP网络传输的,因此即使是轻微的性能问题也可能导致明显的性能下降。所以,要保证服务质量,就需要同时监控网络性能应用程序行为。

VoIP 和 UC 的 KPI

实时服务需要以用户体验为中心的指标,而非通用的网络统计数据。其目标不仅是确认服务可用,更是要确保服务从用户角度来看运行良好。

延迟、抖动、丢包率和平均意见得分 (MOS) 等核心 KPI 仍然至关重要,因为它们直接影响用户体验质量 (QoE)。然而,其他指标可以更深入地了解服务性能,包括:

  • 呼叫建立成功率(CSSR)
  • 通话掉线率
  • 往返UC提供商的时间(RTT)
  • RTP 流质量指标
  • QoS队列性能和DSCP验证

下表概述了这些 KPI 、它们衡量的内容以及它们最适用的时机。

KPI测量的是什么为什么这对实时通信至关重要最主要的用途
延迟(端到端延迟)数据包从源头到目的地的传输时间高延迟会导致通话和会议中的对话延迟和糟糕的用户体验。VoIP 和 UC
抖动数据包到达时间的变化抖动过大会导致音频断断续续、缓冲和视频流失真。VoIP 和 UC
丢包未能到达目的地的数据包百分比丢包率高会导致音频失真、语音生硬和视频卡顿。VoIP 和 UC
平均意见得分(MOS)综合感知通话质量它提供了一个以用户为中心的质量指标,该指标来源于延迟、抖动和丢包。VoIP 和 UC
呼叫建立成功率(CSSR)成功建立通话或会话的百分比CSSR 可以识别影响会话启动的信令或连接问题。VoIP
通话掉线率意外终止通话的频率高掉线率表明网络路径或会话处理不稳定。VoIP
往返UC提供商的时间(RTT)网络响应时间至云端 UC/UCaaS 平台该指标有助于管理员检测广域网、互联网服务提供商或云路径的性能问题。UC(主要),VoIP(基于云)
RTP 流质量指标实时媒体流质量(序列错误、抖动缓冲事件)这些指标直接反映了语音和视频媒体传输的健康状况。VoIP 和 UC
QoS队列性能流量优先级队列的行为和丢包情况QoS 确保语音和视频流量比尽力而为流量获得适当的优先级。VoIP 和 UC
SIP响应时间信号交换所需时间(例如,从 INVITE 到 200 OK)该指标用于检测呼叫/会话建立延迟和信令基础设施问题。VoIP
抖动缓冲丢弃率由于延迟变化过大,抖动缓冲区丢弃的数据包高值表示严重的抖动和实时流稳定性下降。VoIP 和 UC
带宽利用率(每个应用程序)UC/VoIP流量消耗的带宽量高利用率有助于识别语音和视频工作负载的拥塞和容量规划问题。VoIP 和 UC
单向延误单向数据包延迟(端点之间)与单独使用 RTT 相比,该数值能更准确地反映实时语音质量。VoIP 和 UC
终端性能指标(CPU、Wi-Fi质量)用户设备和终端的健康状况和连接性即使网络状况良好,终端性能差也会降低通话和会议质量。UC

虽然更传统的网络 KPI(例如延迟和丢包)对于 VoIP 和 UC 都至关重要,但现代 UC 环境还需要应用和体验级别的指标(例如 MOS、RTP 质量和到 UCaaS 提供商的 RTT),以实现对实时通信性能的真正端到端可见性。

UC监测中经常出现疏漏

UC 监控中一个常见的疏忽是仅依赖正常运行时间和基本设备状态,而忽略了以质量为中心的 KPI。采用这种方法,即使用户遇到语音和视频质量差的问题,服务看起来仍然正常运行。

另一个常见的疏忽是只监控内部网络,而忽略了从最终用户到 UCaaS 提供商的端到端路径。由于大多数 UC 平台都是基于云的,性能下降通常发生在广域网 (WAN) 或互联网路径上。此外,忽略双向性能和终端状况会导致故障排除不彻底。

结论

对于托管服务提供商 (MSP) 和网络管理员而言,成功的定义不再是服务是否可达,而是通信是否保持清晰、稳定和可靠。有效的统一通信 (UC) 监控需要以经验为导向,并辅以合适的关键绩效指标 (KPI) 和能够反映服务实际交付方式的策略。

原文:https://info.teledynamics.com/blog/stop-guessing-monitor-the-right-voip-and-uc-kpis

本文来自作者投稿,版权归原作者所有。如需转载,请注明出处:https://www.nxrte.com/jishu/65790.html

(0)

相关推荐