技术文章

实时音视频

2024年全球互联网通信云(IM+RTC)行业研究报告

全球互联网通信云(IM+RTC)丨研究报告核心摘要：最新动态从应用场景上看：社交娱乐场景融合加速，游戏和社交是场景融合的主要阵地。从开发者需求上看：1）开发者出海加速，面临…

实时互动
2024年3月27日
WebRTC

实现 WebRTC 的可观测性

WebRTC 解决方案中经常被低估的一个方面是媒体质量监控。我们需要记住，我们构建实时解决方案不仅仅是为了进行音频和视频通信，而是为了提供尽可能好的体验。为了确保做到这一点，我们需…

webrtc学习和实践
2024年3月26日
实时音视频

视频黑屏是什么原因？视频黑屏的解决方法

视频黑屏是音视频应用中一个表示视频无法正常播放或显示的现象。视频黑屏也是实时音视频开发中的一个常见问题。本文将专注于 “视频黑屏” 这一问题，详细分析可能导致此问题的原因，并为开发…

ZEGO即构科技
2024年3月26日
即时通讯

10 分钟了解 WebSocket

什么是 WebSocket WebSocket 是一种通信协议，允许客户端和服务器之间通过单个 TCP 连接进行实时数据传输。 WebSocket 就好比您与好友之间畅通的电话线。…

mazhu
2024年3月26日
技术文章

FunASR 升级第三代热词方案

在使用语音识别服务进行语音转文字的过程中，大多数情况下模型能正确地预测高频词汇，但是对诸如人名地名、命名实体等词频较低或与用户强相关的词汇，模型往往会识别为一个发音相近的其他结果，…

大厂Animal
2024年3月26日
技术文章

如何克服现场制作中的 5G 容量和延迟问题

将 5G 用于现场制作的主要考虑因素是什么？DPP 的技术专家战略家 David Thompson 为您介绍采用 5G 时的关键要点和潜在隐患。 5G 和向无线制作的过渡被誉为有可…

茉莉
2024年3月26日
技术文章

使用 C++ 和 OpenGL 创建 3D 渲染引擎的分步指南

在计算机图形世界中，3D 渲染引擎发挥着至关重要的作用，让虚拟世界栩栩如生。如果您是一名崭露头角的游戏开发人员或图形爱好者，希望深入了解三维渲染世界，那么创建自己的渲染引擎将是一次…

图像处理
2024年3月26日
技术文章

实时传输协议 (RTP)收发流程概览-1

因为现在主流的IP网络部署使用SIP协议比较多，因此RTP和SIP应用相对比较紧密。很多时候，我们花费大量时间讨论SIP协议和传输等问题，没有太多关注RTP流的处理。这里，我们单纯…

mazhu
2024年3月26日
实时音视频

什么是音画不同步？音画不同步怎么处理

音画不同步是许多开发者经常遇到的一个棘手问题。当音频和视频数据不完全同步时，使视频播放显得非常不自然，观众会有很差的观看体验。因此，了解其原因并掌握相应的解决策略显得尤为重要。什…

ZEGO即构科技
2024年3月25日
技术文章

音频开发中常见的音频卡顿/杂音类型

在音视频开发的世界中，音频卡顿/杂音是一个常见而又棘手的问题。当我们追求高品质的音频流、实时通信或音乐应用时，这个问题就会频繁出现。杂音是主观体验的概念，技术上常称为音频卡顿，“…

音频技术
2024年3月25日
即时通讯

使用 Golang、Fiber/Websockets 实现简单的群聊功能

本文基于 Golang + WebSocket 实现简单 “群组 “聊天功能，许多其他文章都使用一个简单的聊天示例来探讨 WebSocket。但是，有时一个…

IM开发老王
2024年3月25日
技术文章

使用 OpenSIPS 3.5 构建 IMS – S-CSCF（第 1 部分）

OpenSIPS 3.5 开发计划的主要重点是促进和提供所需的工具，以构建稳健、可投入生产的行业级 IMS 解决方案。为此，我们一直在开发 OpenSIPS 3.5 的新特性和功能…

mazhu
2024年3月25日
技术文章

ViT-Adapter: 密集预测任务的ViT适配器

本项研究为 Vision Transformer（ViT）设计了一种简单但功能强大的密集预测任务适配器。与最近将视觉特定感应偏差纳入其架构的先进变体不同，普通 ViT 由于先验假设…

AIGC
2024年3月25日
技术文章

HQoS和QoS是什么？HQoS和QoS的区别

作为网络从业者或者学习者，大家对QoS肯定不陌生，但是HQoS，您有听过吗？本文，就带大家了解一下HQoS，分析一下HQoS和QoS区别。 HQoS和QoS的基本概念 QoS（Qu…

mazhu
2024年3月25日
技术文章

如何混音？音频混音入门指南

混音是一个在音乐行业之外鲜为人知的过程。即使是音乐超级爱好者，他们往往知道自己喜爱的唱片制作人的名字，却很少知道是谁混音的。那么，这个过程到底是什么呢？你能自己完成吗？从哪里开始？…

音频技术
2024年3月24日
WebRTC

AV1 终于在 WebRTC 上起飞了？

AV1 在 Chrome 浏览器中可用已有几年，但还没有任何大型 WebRTC 服务使用它。几个月前，我们还在 Google Meet 中看到了一些 AV1 实验的迹象，但看起来还…

webrtc学习和实践
2024年3月22日
即时通讯

用 Laravel 和 Pusher 创建聊天室

在数字时代，实时网络应用改变了我们与技术和人与人之间的互动方式。从即时聊天系统到即时内容更新，用户现在都希望能在指尖进行无缝、即时的交流。本教程将使用 Laravel 和 Push…

IM开发老王
2024年3月22日
技术文章

Android OpenGL 实现“人像背景虚化”效果

手机上的人像模式，也被人们称作“背景虚化”或 ”双摄虚化“ 模式，也称为 Bokeh 模式，能够在保持画面中指定的人或物体清晰的同时，将其他的背景模糊掉。突出画面的主体部分，主观上…

字节流动
2024年3月22日
技术文章

x264 如何提升 1‰ 的转码性能

在8K视频编解码特别是解码部分，我做了一些优化工作，转码速度提升了50%以上。专家们评价曰：“主要围绕算法并行度的优化，属于算法性能优化的常规手段，在创新性和技术难度方面的体现较为…

编解码
2024年3月22日
技术文章

在 iOS 上使用 FFmpegKit 采集实时摄像机和音频流

在多媒体处理领域，FFmpeg 是一款功能强大、用途广泛的工具。对于希望在其应用程序中利用 FFmpeg 功能的 iOS 开发人员来说，FFmpegKit 提供了一个方便的封装器。…

FFmpeg笔记
2024年3月21日