技术文章
-
音频编码入门丨音视频基础
对音频或视频进行编码最重要目的就是为了进行数据压缩,以此来降低数据传输和存储的成本。 拿音频来举例,一路采样率为 44100 Hz,量化位深为 16 bit,声道数为 2 的声音,…
-
Window 下编译和配置 FFmpeg 和 LibX264
Windows 平台下 FFmepg 和 LibX264 库的编译,长期以来都是在 Mac 平台下做开发,切换到 Windows 平台下还是踩了不少坑。 参考了网上很多编译文章,质…
-
什么是WebGPU?如何写一个WebGPU
一、什么是WebGPU 1.1 WebGL的恩怨情仇 先跟大家分享一波科技圈的八卦,感受一下WebGL是多么的不容易吧。 OpenGL由Khronos Group组织在1992年的…
-
Web3赋能新商业模式
编者按:互联网行业的迅猛发展带动了音视频技术的进步,一些新鲜术语也随之进入音视频赛道。一股Web3热潮正席卷而来,相比元宇宙、NFT、虚拟人这些更为火热的概念,Web3到底是什么意…
-
苹果又推出空间音频新专利,继续发力空间音频领域
苹果近日获得了一项专利,涉及计算机化数据处理系统和音频处理方法,特别是空间音频处理。 更具体地说,该专利涵盖了“空间音频缩混”及其可用硬件。未来的高清电视和流媒体服务(如Apple…
-
音视频问题汇总–0值“dc”的AVI文件
年底了,要汇总一下整个年度的一些基本情况,在做整理时又重新认识了一个bug。当时处理时候肝了一个晚上,加班到夜里11点才搞定,感觉挺有意思的,已经加入到自己的错题集了,今天和大家一…
-
电话机器人团队DDD实践
DDD是一套方法论,一套思想。种类繁多的元模型和名词概念。其本质都是指导思想对应的解决方案“之一”,初学者容易被表象所困。应始终清醒保持认知“DDD各种元模型都是为解决实际开发中某…
-
Vulkan 在 FFmpeg 中的支持
周末时候看到一篇推送说 FFmpeg 升级到 5.0 版本了。 其中提到 FFmpeg 引入了 Vulkan 驱动的新滤镜,用于视频水平、垂直翻转。 看到 FFmpeg 引入了 V…
-
根据采样频率计算音频时长
基础知识: 采样频率是指将模拟声音波形进行数字化时,每秒钟抽取声波幅度样本的次数。 正常人听觉的频率范围大约在20Hz~20kHz之间,根据奈奎斯特采样理论(只有采样频率高于声音信…
-
Android秀场直播功能实现流程
秀场直播既可以实现单人视频直播,也可以邀请观众上麦、进行多人连麦互动,是社交直播常见的一种场景。在上文我们分享了秀场直播demo源码,可以很直观体验到秀场直播的功能。今天我们基于A…
-
秀场直播demo源码(跑通体验)
秀场直播场景为社交娱乐模式下的视频互动场景,场景支持多人视频连麦互动,更容易吸引用户参与连麦互动,提升用户的消费意愿及粘性。 本次分享的源码为秀场直播体验 App Android …
-
FFmpeg配合zmq实现动态处理filter
在视频会议场景,或者导播场景,经常会遇到画面的位置动态调整,镜头调整等功能需求,好多人在使用FFmpeg的时候喜欢用API自己写一遍对应的功能,但是实际上ffmpeg的filter…
-
深入理解FFmpeg AVBPrint
在FFmpeg的基础库中,有一个可以支持Buffer空间动态扩容的功能支持,在C99之前的C语言支持动态扩容相对比较麻烦,这个AVBPrint可以提取出来单独使用,比较方便,下面详…
-
全面保障企业VoIP入网的安全就靠这7个关键性设计
SBC的重要意义 会话边界控制器(Session Border Controller,简称SBC)。 作为NGN/IMS以及企业音视频系统中重要的网元,SBC帮助企业和VoIP服务…
-
IM即时聊天系统发送文件语音视频的两种方式
一般情况发送消息,把消息通过流发送给接收方{“MessageBody”: “消息内容”},但是作为聊天系统这样发送消息存在两个问题:…
-
使用 Go webRTC 从零搭建功能齐全的视频会议应用程序
由于大流行的原因,Zoom 等视频会议工具在全球范围内变得非常流行。在本教程中,我将指导您使用 Golang 创建一个视频会议应用程序。 可以在此处找到带有注释的完整代码https…
-
WebRTC信令服务器实现
WebRTC音视频通信过程 信令服务器server 如果没有安装socket.io ,执行下面命令安装一下: socket.js 的内容如下: 运行 node server.js …
-
FreeSWITCH在视频会议中的实践经验
编者按:视频会议已成为日常办公不可或缺的一部分,为远程交流的人们提供了许多便利。本次RTSCon 2022会议,由RTS社区和LiveVideoStack音视频技术社区联合出品,很…
-
什么是V4L2框架?V4L2基本开发流程
一.什么是V4L2框架? V4L2英文全称是Video for Linux2,它是专门为视频设备设计的内核驱动。在做视频的开发中,一般我们操控V4L2的设备节点就可以直接对摄像头进…
-
直播延时优化丨音视频工业实战
直播播放延时,指的是从主播推流一帧画面到用户观看到这帧画面之间的时间差。字节跳动曾经提供过一份数据来说明直播延时对用户的影响:对比直播延时在 15s 和 5s 时,用户观看延时更低…