技术文章
-
音视频激荡40年:从9英寸的黑白电视,到4.56亿人的直播狂欢
当人类优渥于一种状态,总有想象力来冲破平衡。阿里云打造的《云想之力》系列报道旨在探索云计算大背景下爆发的应用场景和新兴技术,以想象的高维碰撞之力,窥探 ” 云 R…
-
从0学CV:深度学习图像分类模型综述
图像分类是计算机视觉基本任务之一。顾名思义,图像分类即给定一幅图像,计算机利用算法找出其所属的类别标签。 图像分类的过程主要包括图像的预处理、图像的特征提取以及使用分类器对图像进行…
-
FFmpeg中FF_DYNARRAY_ADD向动态数组中追加元素分析
想动态数组中增加元素的实现是一类常见的需求,但是在C99之前并不存在动态数组一说,都是需要预先设置好内存空间,然后再设定好的空间内操作数组,但是FFmpeg中早就已经实现了动态数组…
-
ffmpeg向H264中添加SEI自定义信息的两种方式
在编解码的场景当中,经常会遇编码数据中带上自定义的内容信息,这些信息可以保存在SEI中。那么如果用FFmpeg操作简单的来说应该是什么样的呢? 下面从命令行和API使用两种方式分别…
-
Android音视频开发:MediaCodec API详解
MediaCodec 可以用来获得安卓底层的多媒体编码,可以用来编码和解码,它是安卓 low-level 多媒体基础框架的重要组成部分。那为什么不选择FFmpeg来做视频编解码,由…
-
XR 与 3GPP 演进下(XR 关键推动因素)
XR 将成为决定我们当今和未来几年与数字世界关系的下一代计算平台。XR 将影响人们娱乐、工作和联系的方式。XR 将影响消费者生活、工业和制造业垂直领域、教育、应急响应和医疗保健的方…
-
H.264 视频编码的基本概念、编码工具、编码流程及码流结构
跟音频编码一样,视频编码最重要的目的也是为了进行数据压缩,以此来降低数据传输和存储成本。 以一路分辨率 720×1280(常说的 720P),帧率为 30 fps 的视频…
-
畅直播SDK简介(一个SDK覆盖直播全场景)
产品简介 畅直播提供极致直播体验(秒开优化、流畅度提升、超高清画质)、行业领先服务保障(自研 CDN 容灾)的一站式直播解决方案。 通过 All-in-One 的 SDK,一次流畅…
-
Java Socket实现多人聊天室
Java小练手项目:用Java Socket实现多人聊天室,聊天室功能包括传输聊天内容或者文件。相比于其它的聊天室,增加了传输文件的功能供参考。 模块拆解 分成服务端和客户端两部分…
-
0到1基于WebRTC搭建一个视频会议
先请出我们今天的主角 – WebRTC,它是由谷歌推广的实时音视频技术栈,是音视频领域搜索热度最高的技术。它有多重身份,既是W3C的标准,也是一个开源项目,还有一个对应…
-
前端WebRTC开发入门(内附JS+Html代码演示)
在前端领域,WebRTC是一个相对小众的技术;但对于在线教育而言,却又是非常的核心。网上关于WebRTC的文章很多,本文将尝试以WebRTC工作过程为脉络进行介绍,让读者对这门技术…
-
使用 React 和 Node.js 构建简单的语音通话应用程序:分步指南
随着基于语音的通信的日益普及和先进技术的可用性,现在只需几行代码就可以构建语音呼叫应用程序。在本教程中,我们将使用 React 和 Node.js 构建一个简单的语音通话应用程序。…
-
webrtc难吗?为什么仍然难以使用 WebRTC 进行构建
WebRTC 是一个用于 Web 的开放框架,可在应用程序和浏览器中启用实时通信 (RTC) 功能。2021年,WebRTC终于正式标准化。如今,WebRTC 无处不在,并且在各种…
-
音频编码入门丨音视频基础
对音频或视频进行编码最重要目的就是为了进行数据压缩,以此来降低数据传输和存储的成本。 拿音频来举例,一路采样率为 44100 Hz,量化位深为 16 bit,声道数为 2 的声音,…
-
Window 下编译和配置 FFmpeg 和 LibX264
Windows 平台下 FFmepg 和 LibX264 库的编译,长期以来都是在 Mac 平台下做开发,切换到 Windows 平台下还是踩了不少坑。 参考了网上很多编译文章,质…
-
什么是WebGPU?如何写一个WebGPU
一、什么是WebGPU 1.1 WebGL的恩怨情仇 先跟大家分享一波科技圈的八卦,感受一下WebGL是多么的不容易吧。 OpenGL由Khronos Group组织在1992年的…
-
Web3赋能新商业模式
编者按:互联网行业的迅猛发展带动了音视频技术的进步,一些新鲜术语也随之进入音视频赛道。一股Web3热潮正席卷而来,相比元宇宙、NFT、虚拟人这些更为火热的概念,Web3到底是什么意…
-
苹果又推出空间音频新专利,继续发力空间音频领域
苹果近日获得了一项专利,涉及计算机化数据处理系统和音频处理方法,特别是空间音频处理。 更具体地说,该专利涵盖了“空间音频缩混”及其可用硬件。未来的高清电视和流媒体服务(如Apple…
-
音视频问题汇总–0值“dc”的AVI文件
年底了,要汇总一下整个年度的一些基本情况,在做整理时又重新认识了一个bug。当时处理时候肝了一个晚上,加班到夜里11点才搞定,感觉挺有意思的,已经加入到自己的错题集了,今天和大家一…
-
电话机器人团队DDD实践
DDD是一套方法论,一套思想。种类繁多的元模型和名词概念。其本质都是指导思想对应的解决方案“之一”,初学者容易被表象所困。应始终清醒保持认知“DDD各种元模型都是为解决实际开发中某…