按时间归档:2023年06月
-
AVS3:跨分量预测TSCPM
两步跨分量预测模式(TSCPM,Two Step Cross-component Prediction Mode)通过探索不同分量之间的线性关系去除分量间冗余。TSCPM分为两个步…
-
强化学习驱动的低延迟视频传输
随着视频会议、视频直播的流行以及未来AR/VR业务的发展,低延迟视频传输服务被广泛使用,但视频质量(QoE)还不能满足用户要求。那么近年来新兴的AI神经网络是否能为视频传输带来智能…
-
WebRTC 真的免费吗?运行 WebRTC 应用程序的成本
WebRTC 真的免费吗?它是开源的,并因此而被广泛使用。但是,当涉及到运行和托管你自己的WebRTC应用程序时,它并不免费。 如果你是 WebRTC 的新手,那么建议从这里开始 …
-
uniapp如何实现CDN直播(uniapp音视频开发系列7)
ZEGO uniapp实时音视频 SDK 支持将音视频流转推到 CDN(Content Delivery Network,内容分发网络),转推 CDN 指的是将音视频流从 ZEGO…
-
什么是 CDN RTMP 流媒体?CDN RTMP 流媒体原理及好处
什么是 CDN RTMP 流媒体? 作为一种在线音频和视频的传播方法,CDN RTMP流媒体已经大大普及了。它的延迟很低,因为它使用RTMP来实时传输音频、视频和数据。这种功能使它…
-
Apple 将 iPhone 变身为会议室摄像头
Apple 公布了通过与 Apple TV 集成将 iPhone 转变为微型摄像头的计划。 在 WWDC 上推出的这一功能利用了 Apple 的 Continuity Camera…
-
深度视频预编码 | TCSVT 2019
本文提出了一个深度视频预编码框架,其核心预编码组件包括一个级联结构的降尺度神经网络,在视频编码期间,传输之前操作。这与每个可独立解码的流段的预编码模式选择算法相结合,该算法根据场景…
-
即构科技自研仿真人 助力“一带一路”咖啡文化经贸
咖啡是世界上最受欢迎的饮料之一,也是交易量最大的农产品之一。近年来,中国才逐渐融入成为全球咖啡潮流的一部分。人均咖啡消费量从2018 年的 6.2 杯,上升到 2022 年的 12…
-
OpenGL Shader 常用的二维矩阵变换
2D Matrices 二维矩阵 平移 之前的章节我们学习了如何制作一些图形 – 而如何移动它们的技巧则是借助移动它们自身的参考坐标系。我们只需要给 st 变量加上一…
-
如何利用通信API和SDK实现更强大的应用
在今天这个快节奏的数字时代,有效的沟通是成功的商业运作和客户参与的核心所在。为了使开发人员能够将通信功能无缝集成到他们的应用程序中,通信 API 和 SDK 的出现已被证明是一种游…
-
VoIP QoS是什么意思?如何设置VoIP QoS
什么是VoIP? VoIP(网络电话)已经成为今天几乎所有企业的一个重要组成部分。许多组织选择使用VoIP,因为与传统的PBX座机相比,成本明显降低。还有机会利用许多功能,包括先进…
-
Weave 推出用于无缝远程通信的软电话
远程工作是改变了各行各业的游戏规则,小企业主越来越多地寻求从不同地点接听电话的自由,无论是多个办公地点、他们的家,还是在移动时。这种转变是由为客户提供无缝体验和优先考虑灵活性的愿望…
-
如何应对联络中心坐席不接受新技术
根据2023年Gartner的研究,45%的联络中心座席现在正积极避免使用新工具和技术。 这一统计数字表明,座席人员已经厌倦了学习和遵循新的系统和工作方式。尽管他们的效率可能会…
-
喊出元宇宙的那个男人依旧乐观
对元宇宙感到困惑是可以的。悲观主义者可以指出Meta在过去一年中,试图让我们相信我们都将居住在这个身临其境的3D世界的努力。乐观者可以指出Meta周四宣布推出的售价499美元的全新…
-
PPIO王闻宇:深度解读苹果首款MR眼镜及其对元宇宙技术路线的启示
图片来源于苹果官网 前言:在过去的一系列文章中,我一直将元宇宙视为我们这个时代的”登月工程”。为了实现真正的全身心沉浸式体验,未来必须有多项关键技术取得突破…
-
让文物“活”起来,火山引擎视频云三维重建技术揭秘
中国历史悠久,文化底蕴深厚,文物数目众多,文物作为前人智慧的结晶,其文献价值不言而喻。古籍是记录中华文明的重要载体,也是流传至今的宝贵文化遗产,文物保护也是一项长期重要的基础工作。…
-
中国信通院和华为等产业伙伴联合发起新通话产业发展合作倡议
[中国,北京,2023年6月5日] 在第三十一届中国国际信息通信展览会期间,由中国信息通信研究院和中国通信企业协会主办、华为承办的新通话产业发展论坛在北京国家会议中心成功举行。在本…
-
Bark:一种GPT风格的TTS
大家知道,我们一直在探索在FreeSWITCH里实现ASR和TTS的各种方案。这一次,我们遇到了Bark。 一、Bark介绍 Bark是一个GPT风格的模型。因此,它能在生成音频过…
-
面向流媒体的确定时延传输:从QUIC出发,走向未来
QUIC(Quick UDP Internet Connections)是Google设计的一套可靠UDP传输协议,旨在为HTTP提供一个安全、可靠、高效和低延时的通信基础。QUI…
-
Align your Latents:高分辨率视频合成与潜在扩散模型 | CVPR2023
潜在扩散模型 (LDM) 可实现高质量图像合成,同时通过在压缩的低维潜在空间中训练扩散模型来减少计算量。将 LDM 应用于高分辨率视频生成是一项特别耗费资源的任务。本文首先仅在图像…