内存价格、WebRTC 与语音 AI 的未来

原文:Memory prices, WebRTC and the future of Voice AI
作者:Tsahi Levent-Levi,发表于:https://bloggeek.me/memory-prices-webrtc-voice-ai/

一场悄无声息的危机正在上演:AI 正在吞噬全球所有的内存,推高价格高达 6 倍,迫使 WebRTC 和语音 AI 重新思考自己的运营方式。

内存。 在 WebRTC 应用中,没人会第一时间想到内存。至少一开始不会。直到我和我的”电脑专家”聊了一通之后,我才开始重新审视这个问题,尤其是在 2026 年的当下,尤其是当价格正在飙升的时候。

我尝试深入研究 WebRTC,看看它能把我引向何方。

核心要点:太长不看版

  • AI 正在显著推高内存价格,影响 WebRTC 和语音 AI 的功能。
  • 2026 年内存价格因 AI 公司抢购大部分可用产能而暴涨 3–6 倍。
  • WebRTC 应用需要越来越多的内存,尤其是在高分辨率和新编码器下;优化已成必要之举。
  • 语音 AI 在云端继续飞速发展,设备端处理则面临内存约束。
  • 长期来看,产能改善、内存优化和需求增长将共同塑造科技的未来。

2026 年的内存价格

今年一月,我儿子跑来跟我抱怨,说他的电脑太慢了。在他看来,”慢”的标准是《博德之门》(Baldur’s Gate)跑不动。我打电话给信任的电脑专家,他建议我升级 CPU 和 GPU,其他部件(原装机是他几年前卖给我的)暂时不动。

我问他是不是等几个月,等一块全新的 NVIDIA 显卡出来更好。他说:“现在就买。” 于是我当天就下单了。两天后,我带着电脑去做升级。结果同款显卡在两天内涨了 50%……那次购买真是及时。

又过了一个月,我再次去找他处理别的事。闲聊中,他告诉我,内存和存储的价格已经暴涨,现在的价格是两个月前的 3 到 6 倍

他原本计划从地下室办公室搬到一个真正的办公空间。现在他改变了方案,继续租用地下室,”上楼”住进自己的房子,然后把仓库和合伙人分着用。

他的未来是在收缩规模。他在市场上摸爬滚打了 20 年,他的判断是这样的:

  • 由于价格暴涨,未来 PC 采购将进入困难时期
  • 这意味着生意会更少
  • 很多门店将会破产关门
  • 他正在收缩规模,目的是活下去,等到市场回升的那一天
  • 他的时间表是熬过接下来的两年。可能不需要两年,但目前他按两年来做打算

据说大型消费品牌已经丢失了与存储和内存供应商的长期合同。一些品牌宁可违约(附带相应的罚金),也要把货全卖给 AI 厂商和 IaaS 超大规模云商,因为后者直接买断了他们全年的库存,甚至买断了未来的供货。

这件事将影响到每一个人。这让我想到它将如何影响 WebRTC 和语音 AI 的未来。我相信它一定会。

内存价格数据一览

内存价格、WebRTC 与语音 AI 的未来

上图显示了计算机内存(DDR5-5200 32GB 型)平均价格的变化。

DDR5 于 2020 年 7 月发布。图中所见的下行趋势,在稳定在 100 美元左右之后,按预期本该继续走低,直到被 DDR6 取代(但 DDR6 尚未到来)。然而,AI 的出现将所有产能转向了自身的内存需求,RAMmageddon(内存末日)。我们看到了一把”曲棍球杆”,从 2025 年中期开始急剧上扬,正在成为一个严峻的问题。

以下是目前的现状:

  • 恐慌性抢购:当价格在三月中旬突破 400 美元大关时,系统集成商和个人装机者开始恐慌性抢购,将渠道库存一扫而空。月底平均价格达到了 445 美元
  • 产能高度集中:三星和 SK 海力士几乎全部产能都用于满足 AI 加速器订单的 HBM3e/HBM4。没有行业信号表明在 2026 年第三季度之前会恢复大规模消费级 DDR5 生产。
  • 二级市场波动:445 美元是现货在售商品的零售均价。而在 eBay 等二级市场上,高性能套装(6400MHz 及以上)经常超过 600 美元

新闻中的内存与价格

这篇文章我想写已经想了很久了。所以我把每天在 Feedly 上的阅读清单里加了一栏,专门收集相关的片段和新闻。以下是其中几条——让你知道这不是空穴来风(如果你近三四个月没买过设备的话):

消费设备:供货紧张和”内存短缺”已经到了极其严重的地步,Phison CEO 警告这可能**“扼杀产品和公司”。消费市场已经有实例可循:[Valve 的 Steam Deck OLED 因”内存、存储和 RAM 危机”而断货。此外,零部件产能不足,可能是谷歌 Pixel 10a 据报道“和 Pixel 9a 是同一款手机”**的原因——暗示产品因零部件约束而停滞。

存储行业:短缺延伸到了存储组件,西数报告其“HDD 产能已全部用尽”。固态硬盘(SSD)短缺影响如此深远,以至于索尼关闭了几乎整个记忆卡业务。

企业影响:大型科技公司也在报告财务压力。例如惠普表示,DRAM 和闪存价格上涨是其 2026 年第一季度业绩的一个因素。综合性新闻报道则持续确认着“内存价格上涨”的模式。

这场市场转变意味着,行业再也不能指望新设备拥有更好的内存了。在 WebRTC 和语音 AI 中优化内存使用,现在已是燃眉之急。

WebRTC 与语音 AI 中的内存使用

WebRTC 是个内存消耗大户。 尤其在使用视频通道的情况下。

视频编码器和解码器在媒体处理流水线中消耗大量内存——需要保存编码后的比特流(通常每秒几兆比特甚至更多,双向都是如此)。还要保存编码前的原始视频帧和解码后的视频帧——即视频编码器输入和输出的数据。

复杂的编码器往往有跨帧依赖,可能需要”记住”不止一帧才能正常工作。

抖动缓冲器(Jitter Buffer) 存储已接收的数据包,直到它们可以被处理并播放给用户。

所有这些缓冲和处理都需要占用用户设备上的内存。

  • 视频分辨率越高,需要的内存越多。
  • 帧率越大,需要的内存越多。
  • 使用越新的编码器,需要的内存越多。
  • 会议规模越大,需要的内存越多(通常如此)。

一般来说,随着时间推移,WebRTC 实现需要的内存越来越多,因为我们要求它们做的事越来越复杂。这种情况只有在进行了优化工作后才会改善——就像疫情时期 Google 对 WebRTC 做的那样。

对于我们这个行业呢?

内存价格上涨,意味着我们不能假设未来一两年的设备会有更好的内存表现。 我们需要利用现有条件,比以往更加注重内存使用的优化

WebRTC、视频会议与对更高质量的追求

当我刚进入视频会议这个行业的时候(那是很久很久以前的事了……27 年前,谁在数呢),达到 VGA 分辨率都是一项艰巨的挑战。那时候我们用的是专用硬件,运行实时操作系统。

时间快进到今天,视频会议跑在任何你能想到的设备上,运行在任何操作系统上。我们瞄准的分辨率从 720p 起跳,但在屏幕共享中轻松达到 4K 和 5K。

对于云游戏,我们要的是 1080p,甚至 4K。

还有人在谈 8K(谢天谢地,我们这行还没到那个程度)。

我们想要更高的分辨率、更高的帧率,永无止境地追求更好的媒体质量。

这种趋势会停下来吗?总有一天会的。但不是现在。

不过事情是这样的:在 2026 年乃至 2027 年,也许是时候在现有分辨率和码率下榨取更多的媒体质量了。 这样才能把更好的体验带给现有的和低端的设备。

而一个令人信服的理由就是:新设备可能不会拥有更高的内存规格。它们甚至可能内存更少——只是为了控制成本。

语音 AI:久违的超级增长

语音 AI 不会为任何人停下来。

如果你从 WebRTC 一诞生就开始关注它(大约 15 年前),你可能回想不起来有什么事能与之相比。

WebRTC 刚发布时,确实有兴奋、有炒作、有增长。但语音 AI 让 WebRTC 那些早期的日子看起来像过家家。这个领域有太多厂商在开发突破性的技术,日新月异的节奏之快,让人几乎不可能跟上。

所有语音 AI 和视频 AI(虚拟形象和数字人)目前都运行在云端,消耗着惊人的 GPU 和内存资源。这种趋势只会加速、只会增长。从某种意义上说,我们是在火上浇油 🔥

而且,这不会因为内存短缺而停下来。 请记住,所有这一切美好都在云端发生,而不是在设备上。无论产出什么,都随时在所有设备上运行。

从这个角度来说,我们不需要为了支持这个语音 AI 的新世界而升级设备……我们只需要一个更强大的云。而这个云,正是那个把未来几年可用内存产能全部买断的云……

我们近期的未来

是时候看看接下来会发生什么了。这一切对于我们这些试图打造下一代 WebRTC 应用的普通人意味着什么?在不远的将来,这会如何影响我们?

以下是我对这场讨论的两点思考。

WebRTC:只能一步步来

我们已经看到 Zoom 在视频会议领域向高端加倍投入。它发布了一个增强媒体附加组件(Enhanced Media Add-On),包括:

  • 更高帧率:1080p60fps 的参会者视频流
  • 更高码率:提升参会者视频流质量
  • 1080p 内容共享,60fps:更流畅的共享体验
  • 高带宽模式:将客户端下行从 30Mbps 提升到 100Mbps
  • 高质量视频布局:在 4K 显示器上显示 Gallery 视图

所有这些好东西都需要……更多的内存。尤其在需要处理这些数据的客户端设备上,但不仅限于客户端。

Google? 你现在经常可以在 Google Meet 会议中找到 1080p 视频分辨率了,比起”过去”的 720p 有了提升。

对于我们其他人? 我会说,把精力集中在 1080p 以下的分辨率,并在 AV1 视频编码上加倍投入,这就是我的建议。

原因如下:

  • 更高的分辨率需要更多资源。虽然很棒,但在 2026 年,我不确定基础设施的额外成本是否值得。
  • 你的用户不太可能像过去 5 年那样频繁升级设备。 预计到今年年底,他们的能力与现在基本持平。
  • AV1 是视频编码的未来。它需要更低的码率,但比起旧编码器,对编解码的内存压力更大。
  • 这是你可以真正提升质量的方向,是高清分辨率做不到的, 也是我在 2026 年会把精力投入的地方。

语音 AI:保持云端工作负载

对于语音 AI,我们将看到更多相同的模式:技术进步和采用的巨大飞跃。

我们将开始看到在边缘(设备本身)运行语音 AI 的实验。不把语音推向云端,而是尝试在设备上直接进行语音转文字处理。这将与引入直接语音到语音模型的多模态 LLM 趋势相悖。

哪一种会胜出?云端。至少目前是这样。

要在设备上运行这类模型,需要进一步优化和缩小模型规模。但同时也需要设备有更多内存 👉 2026 年做不到。

长期展望

从长远来看,有三件事将会发生。它们很重要,但都需要时间才能成熟:

  1. 产能将会增加。 这意味着供给增加,价格将回落到合理水平。预计至少需要两年。我的电脑专家就是这么估计的,他是市场上最厉害的,我信他。
  2. 内存使用的优化。 AI 占用大量内存。让它少占内存很重要。Google 已经在这个方向上了,这意味着其他公司也在投入资源。
  3. 需求增长。 语音 AI 才刚刚起步。随着部署规模扩大,需求会增加,云端对内存的需求也会增加。这已经在价格中有所体现,但可能还需要进一步调整。

常见问题

问:为什么 2026 年内存价格上涨得这么厉害?

答:由超大规模云商和 GPU 厂商领导的 AI 公司,正在抢购所有可用的内存产能用于 HBM 和高带宽芯片。三星和 SK 海力士将几乎全部产能转移到 AI 级内存,导致消费级 DDR5 严重短缺。价格在短短几个月内暴涨了 3 到 6 倍。

问:内存如何影响 WebRTC 视频质量?

答:更高的视频分辨率、像 AV1 这样的新编码器、更大规模的视频会议,都需要设备端更多的内存。抖动缓冲器、原始视频帧和编码比特流都会消耗内存。当设备无法升级时,开发者需要在现有约束内进行优化。

问:语音 AI 会从云端转向设备端吗?

答:2026 年不会。在设备上运行语音到语音模型需要大量内存和处理能力。随着内存价格攀升,设备升级正在放缓。云端语音 AI 短期内仍将是主导,这进一步加剧了同一条内存供应链的需求压力。

为低中端设备的性能做好平衡

以下是我认为你在考虑媒体质量和优化时应该关注的重点:

今年,如果你不是只面向高端设备,就瞄准低中端的性能表现。假设用户不会换机,也不会主动升级,除非迫不得已。

此时此刻,比以往任何时候,你都应该考虑如何利用现有条件,并为它做好优化。

本文来自作者投稿,版权归原作者所有。如需转载,请注明出处:https://www.nxrte.com/jishu/webrtc/66254.html

(0)

相关推荐