技术文章
-
H.265、AV1 和 H.264 视频编码对比:X265性能太差, LibAOM可用于生产
都2023年了,AV1编码的性能如何了?是否已经适用于生产环境?另外,H.265相对于H.264真的能够节省一半的带宽吗? 本文内容来自公众号 PixPark 的分享原文:http…
-
报告|端到端可视性打造出色连接体验
如今,三股大趋势已经让企业传统的网络运维模式难以为继。 首先,云已成为新的数据中心,工作负载从本地迁移到混合云和多云架构。其次,互联网已成为新的网络,并支撑着穿越不同网域的企业连接…
-
主机拥塞控制 | SIGCOMM2023
研究问题:系统和网络社区的传统观点是拥塞主要发生在网络结构内。然而,高带宽访问链路的采用和主机内资源相对停滞的技术趋势导致了主机拥塞的出现,即支持 NIC 和 CPU/内存之间数据…
-
OpenGL ES 图像基本处理:腐蚀、膨胀、边缘检测
前文我们详细讲了图像锐化的基本原理,本文再介绍一下图像基本处理之腐蚀、膨胀和边缘检测,它们在图像处理和计算机视觉领域有着广泛的应用。 图像腐蚀(Image Erosion):用于缩…
-
什么是图像锐化?OpenGL ES 如何实现图像锐化?
什么是图像锐化? 图像锐化是一种图像处理技术,其目的是增强图像中的细节和边缘,使图像看起来更加清晰。这一过程通常涉及到突出图像中的高频信息,特别是强调像素之间的灰度变化。 通过增强…
-
用 FFmpeg 释放 Rails 中的富媒体功能: 开发人员工具包
在不断发展的网络开发过程中,多媒体内容占据了核心地位。Ruby on Rails 开发人员经常面临将复杂的视频和音频处理功能集成到应用程序中的挑战。这时,功能强大的多媒体处理工具 …
-
DeepSVC:适用于机器和人类视觉的深度可扩展视频编码 | ACM MM 2023
本文主要讨论了端到端的视频编码方法,旨在同时满足机器视觉和人类视觉需求。本文提出了一种名为 DeepSVC 的深度可扩展视频编解码器,它支持从机器视觉到人类视觉的三层可扩展性。在编…
-
Flutter 中的 Socket 通信:构建实时应用程序
本文将探索使用 Flutter 强大的套接字编程功能构建实时应用程序的复杂性。揭开客户端之间无缝数据交换背后的秘密,并了解如何创建动态、响应式应用程序,以实现实时更新和同步体验。 …
-
将 HDR 视频引入 Reels 的技术挑战和优化实践
在过去一年中,Facebook 和 Instagram 的视频基础架构团队发现上传到我们应用程序的 HDR 内容数量大幅增加,每天都有数百万 HDR 视频上传。因此,我们一直在努力…
-
大饼 AI 变声怎么样?如何集成大饼 SDK 实现 AI 变声
大饼 AI 变声简介 大饼 AI 变声是市面上一款非常优秀的变声产品,是实时通话中的“柯南变声领结”,完美重现目标角色的音色与韵律,一键变声明星、游戏角色,同时保留用户的语速、情感…
-
如何在 Jitsi Meet 中启用转录功能
本文将介绍如何在 Jitsi Meet 中启用转录功能。 安装和配置 要通过转录安装和配置 Jitsi Meet,请执行以下操作: 1. 根据文档安装 Jitsi Meet。 2….
-
Meta 如何增强 WhatsApp 通话的安全性
隐私和安全是 WhatsApp 的核心。除了通过端到端加密保护个人消息外,WhatsApp 还赋予用户控制自己隐私设置的权力:从您分享的内容、您在网上的显示方式,到谁可以联系您或将…
-
RTMP直播协议深度解析:从保姆级入门到高级优化!
涉及到RTMP直播协议,了解其工作原理和优化技巧对于提升直播质量和用户体验至关重要。在这篇详细剖析的文章中,我们将深入探讨RTMP直播协议的各个方面,以及实际开发中遇到的一些情况,…
-
基于差分隐私的梯度稀疏赋能通信高效联邦学习系统设计与优化 | 南京理工大学李骏等
研究意义 联邦学习(Federated Learning)可在无需共享原始数据的情况下实现分布式客户端协作训练机器学习模型而得到广泛关注。然而,该架构中上传本地模型仍然有泄露客户端…
-
面向平台的智能客服系统之实践演进之路
一、前言 一直以来,面向运营使用的活动平台,在运营使用过程中会偶发出现一些疑难问题,比如运营对某个组件功能的使用有疑问,或者线上的活动表现不符合预期,运营期望产研协助排查。面对这些…
-
2024 年 WebRTC 趋势和预测
本文分享译自 bloggeek博客创始人 Tsahi Levent-Levi。以下是 2024 年的 WebRTC 趋势和预测。它们延续了我们在 2023 年看到的趋势,但也有一些…
-
音频文件格式–celt
CELT介绍 CELT 是一种开放、免版税的有损音频压缩格式,也是一种免费软件编解码器,具有特别低的算法延迟,适用于低延迟音频通信。这些算法是公开记录的,并且可以不受软件专利限制地…
-
WebRTC是什么?WebRTC技术原理详解
WebRTC(Web Real-Time Communication)是一种连接世界的革命性技术,它为通信和直播行业带来了巨大的提升。通过WebRTC,我们能够实现实时的音视频通信…
-
通过贝叶斯隐式表征来压缩数据 | NeurIPS 2023 Spotlight
论文摘要 在数字世界里,很多常见的数据类型都可以看作是一种特殊的连续函数形式,表征为隐式表征。例如,图像可以表征为将每个像素位置映射到对应RGB色值的连续函数。从这个角度出发,我们…
-
通过高斯-拉普拉斯-逻辑混合模型和串联残差模块学习的图像压缩 | TIP 2023
最近,基于深度学习的图像压缩方法取得了显着的成就,并在 PSNR 和 MS-SSIM 指标方面逐渐优于包括最新标准通用视频编码 (VVC) 在内的传统方法。学习图像压缩的两个关键组…