技术文章
-
字节跳动将音乐检索速度提高8倍,多篇论文入选语音顶会
智东西 6 月 1 日报道,近期,字节跳动火山语音团队的最新音乐检索系统 ByteCover2 入选了国际语音技术领域顶会 ICASSP 2022。 该系统主要面向音乐信息检索(M…
-
作业帮实时音视频ZRTC演进之路
背景介绍 作业帮实时音视频ZRTC经过流媒体技术团队的持续打磨和优化,已在大规模复杂的生产环境稳定运行3年以上,不仅有力地支持了作业帮丰富多彩的互动课程类型,同时也积累了丰富和宝贵…
-
如何将直播扩展到100,000及以上观众
本次研讨会有4位工业界的专家参与,探讨了在针对大规模观众的网络直播框架中所需要注意的环节以及技术挑战,这其中除了包括了分发、CDN部署,还包括传输之外的不同环节等的技术考虑。 我们…
-
Android NDK 直播推流与引流
阅读本文大概需要 3.39 分钟。 本篇介绍一下直播技术中推流与引流的简单实现。 1. 流媒体服务器测试 首先利用快直播 app (其他支持 RTMP 推流与引流的 app 亦可)…
-
视频编码中的自适应拉格朗日乘数
在过去的十年中,在 per-clip 而不是 per-genre 优化转码参数方面取得了重大进展。在我们最近的工作中,我们展示了速率控制压缩中拉格朗日乘数的每个剪辑优化,它在使用 …
-
MediaCodec API,完成音频 AAC 硬编,5.0异步处理及 AudioRecord 录音
AAC硬件编码文章有几篇,但是都是同步实现,这里采用异步实现,代码Kotlin。 虽然代码是kotlin写的,但是思路上面的按照java能复制出来 最后我会把代码上传到github…
-
SRS:直播和WebRTC服务器的负载均衡问题
当我们的业务超过单台流媒体服务器的承受能力,就会遇到负载均衡问题,一般我们会在集群中提供这种能力,但实际上集群并非是唯一的实现方式。有时候负载均衡还会和服务发现等时髦词汇联系起来,…
-
Android OpenSL ES 音频采集与播放
本篇详细介绍一下基于 Android OpenSL ES 实现音频的采集与播放。 1. OpenSL ES 是什么? OpenSL ES 是一个针对嵌入式系统的开放硬件音频加速库,…
-
音视频开发进阶课程|第一讲:音频要素
为了帮助开发者更好地理解音视频概念,进行音视频应用开发,ZEGO 即构科技联合内部音视频开发专家打磨了本套《音视频开发进阶》课程,帮助大家轻松入门并可以自己动手开发音视频 App!…
-
屏幕内容压缩失真的多假设超分
基于多假设的预测已被反复证明在提高预测精度和增强编码性能方面是有效的。这篇论文将多假设的原理引入压缩失真屏幕内容图像的超分辨率任务。训练时,输入多个 LR 低分辨率图像块,包括当前…
-
OpenGL ES 文字渲染方式有几种?
在音视频或 OpenGL 开发中,文字渲染是一个高频使用的功能,比如制作一些酷炫的字幕、为视频添加水印、设置特殊字体等等. 实际上 OpenGL 并没有定义渲染文字的方式,所以我…
-
AVS视频编码标准的演变:20年来的创新与发展
20世纪90年代至21世纪初,MPEG和VCEG等国际标准工作组制定了系列视频编码标准,如MPEG-1,H.261,MPEG-2/H.262标准等。 1 研究意义 在这些编码标准中…
-
RIST 同步多流传输解决方案
许多应用程序需要同步内容解码,更具体地说,有许多视频源(通常是摄像机),它们的内容需要使用编码器传输到同等数量的远程解码器。在解码器,播放需要同步——在解码器中一起到达的帧需要在解码器中一起出来。本文说明了一种基于 RIST 的解决方案。
-
声学黑洞为木质天花板带来更好的降噪体验
Empa目前正在完成对木质建筑隔音的研究。利用20世纪90年代的物理理论和数字化工具,一个研究小组开发了由实木面板制成的新地板材料,这些面板具有所谓的声学黑洞。这个想法来自Demp…
-
在 Symfony 6 中使用 HTTP 基本认证
HTTP 基本身份验证是一种用于限制对网页的访问的简单身份验证技术。用户应使用 Web 浏览器中的对话框提供用户名和密码。 本教程提供了如何在 Symfony 6 应用程序中使用 …
-
基于标准 WebRTC 低延迟直播的开源实践
自上世纪末,流媒体直播技术兴起以来,伴随着网络基础设施的发展脚步,直播也同频共振般地起势。而近年来 AI、云计算、音视频等技术日趋成熟,以及新冠肺炎疫情带来的“宅经济”刺激,使直播…
-
MediaCodec 编码结合 FFmpeg 封装流
在 Android 平台上合成视频一般使用 MediaCodec 进行硬编码,使用 MediaMuxer 进行封装,但是因为 MediaMuxer 在某些机型上合成的视频在其他手机…
-
移动端超分面临的挑战和即构超分技术
超分辨率(Super Resolution,SR)是从给定的低分辨率(Low Resolution, LR)图像中恢复高分辨率(High Resolution,HR)图像的过程,是…
-
使用 PHP 和 python 向 MQTT 代理发布消息
MQTT 协议使用发布/订阅模型。客户端可以向代理发布消息,其他客户端可以订阅该消息的主题。本文分享如何使用 PHP 和 python 向 MQTT 代理发布消息,其中包含如何将消…
-
AliAGC 自动增益控制算法:解决复杂场景下的音量问题
音视频会议,直播连麦以及短视频已经成为人们工作、教学以及娱乐的一部分,其背后都离不开音视频实时通信等关键技术的广泛应用。音频方面,可预见的是客户业务形式的多样性,环境的复杂性,以及…