技术文章
-
Webrtc中如何确定通常意义上说的M108,M90是指什么
Webrtc中如何确定通常意义上说的M108,M90是指什么
-
Debian11系统下编译WebRTC M108 带H264硬件编码支持
执行命令. 首先vim ~/.bashrc中增加PATH内容。将Depot_tools目录增加进去。(当然还有Ninja目录)→因为GN命令就在这里 . 其次,设置set DEPO…
-
webrtc中如何使用自定义视频源
在WebRTC中默认提供2种视频源捕获器。分别是DesktopCapturer和 VCMCapturer, 即桌面捕获器和摄像头捕获器。 DesktopCapturer 目前可以多…
-
扩散视频自编码器:通过解纠缠视频编码实现具有时序一致的人脸视频编辑 | CVPR 2023
受人脸图像编辑方法的启发,相关研究将这些方法扩展到人脸视频编辑任务,所面临的主要挑战之一是编辑帧之间的时间一致性。为此,本文提出了一种基于扩散自编码器的新型人脸视频编辑框架,该框架…
-
音频“扩容”?4K超高清电视转播环绕声信号如何制作
2021年12月,央视杯2021中国男子手球超级联赛决赛阶段的比赛,在安徽合肥体育中心体育馆举行。安徽有“手球之乡”的美誉,当地许多中小学也成立了手球队伍。手超联赛首次落户合肥,正…
-
DMTet:一个用于高分辨率三维形状合成的混合表示方法 | NeurIPS 2021
摘要:我们引入了DMTet,一个深度的三维条件生成模型,可以使用简单的用户指导(如粗糙体素)合成高分辨率的三维形状。它通过利用一种新颖的混合三维表示方法,融合了隐式和显式三维表示的…
-
哔哩哔哩视频云画质与窄带高清AI落地实践
视频赛道卷到下半场,一定会面临体验与成本的对抗,尤其是在行业大环境“过冬”的背景下,想要在有限带宽下获得最佳的画质观感变得异常具备挑战性。从视频云业务场景的视角来看,如何有效解决c…
-
多链路传输技术在火山引擎 RTC 的探索和实践
传统的数据传输方式大多是利用一个链路、选择设备的默认网卡进行传输,使用这种方式实现实时音视频通话时,如果默认网络出现问题(如断网、弱网等),用户的通信就会发生中断或者卡顿,影响用户…
-
Tambur:将 streaming codes 应用视频会议场景进行丢包恢复 | NSDI 2023
数据包丢失降低了视频会议的用户体验,在重传时间过长的通信场景中,恢复丢失数据包的标准方法是前向纠错(FEC)。用于实时应用的传统 FEC 方法在突发丢包的情况下效率很低。然而,突发…
-
什么是V4L2框架?V4L2代码开发流程v4L2应用开发学习!
一、什么是V4L2框架? V4L2英文全称是Video for Linux2,它是专门为视频设备设计的内核驱动。在做视频的开发中,一般我们操控V4L2的设备节点就可以直接对摄像头进…
-
QUIC 桥接支持 MQTT 5.0|NanoMQ Newsletter 2023-05
五月初夏,NanoMQ 项目在发布了 0.18 版本后,聚焦于用户需求的开发和社区发现的漏洞问题的测试修复。即将于近期发布的 0.19 Beta 版本中将推出动态桥接功能和对桥接主…
-
C++ 和机器学习:使用 C++ 执行 ML 任务的简介
C++ 和机器学习:使用 C++ 执行 ML 任务的简介 介绍 C++ 是一种高性能编程语言,非常适合机器学习( ML ) 任务。尽管它在 ML 中可能不像 P…
-
机器视觉检测中的分辨率,精度,公差的关系
本文为大家详细介绍:分辨率,精度,公差的关系,从而指导选型。 分辨率(Resolution) 比如我要看的产品大小是30mm*10MM,使用200万像素(1600pixel*120…
-
vivo互联网视频播放体验优化的探索与实践
随着vivo互联网在视频业务领域的不断扩展,在多样化的业务场景下,如何提升每个用户的视频播放体验,保障最优的播放流畅度和清晰度,vivo互联网技术团队做了很多尝试与突破。LiveV…
-
C++ Lambda 表达式的原理、语法和应用场景
C++ Lambda 表达式是 C++11 标准引入的一项强大功能,它允许开发者以简洁、优雅的方式创建匿名函数对象。 本文将深入探讨 C++ Lambda 表达式的原理、语法和应用…
-
OpenGL Shader 中的随机与噪声
一、随机(random) 说到随机函数,JavaScript 中有 Math.random(),PHP 中有rand(),在图形绘制时,随机也无处不在。《The Book Of S…
-
AI绘画:Stable Diffusion
随着人工智能技术的迅猛发展,AI绘画技术也越来越成熟,并在各种行业中得到广泛应用。AI绘画是人工智能技术和美术设计的结合,利用机器学习和深度学习等算法对图像进行分析和生成,为美术设…
-
uniapp如何实现横屏竖屏切换(uniapp音视频开发系列5)
本文是uniapp音视频开发系列的第5篇,本文分享在视频采集过程如何实现固定竖屏、固定横屏、横屏竖屏切换等功能。 用户使用移动设备进行直播或视频通话时,可以采用不同的视频采集方向,…
-
ktv的评分系统准确吗?是谁在KTV里偷偷给我们打分
爱唱歌的你,是否曾经怀疑过,KTV里到底是不是有一群评委蹲在某个角落,随机地给你出分。要不然为什么每次你在KTV里唱得风生水起或者声泪俱下时,却总被打分系统打击得体无完肤?一度飙高…
-
学习和评估文本到图像生成的人类偏好
近几年,自回归模型和diffusion模型等文生图(text-to-image)模型经历了快速发展,但生成结果仍不完美。现有的文生图模型生成内容,存在一些比较明显的问题,包括但不限…