技术文章

技术文章

社交直播多级缓存一致性解决方案-缓存管道

背景介绍 1. 2021年开始，社交直播活动中台因为需要支持的产品越来越多，优化过程中发现对于很多读场景来说中心缓存的读取已经成为了性能瓶颈，所以大量业务场景开始采取二级缓存方案…

大厂Animal
2023年9月14日
技术文章

萤石开放平台JS SDK全新支持H.265解码

H.264作为视频画面最常用的编码格式，几乎所有播放器都支持该格式。近年来，视频应用需求高速增长，对视频编解码技术的能力要求也持续提升。升级版编码格式—H.265的出现，帮助开发者…

厂商动态
2023年9月14日
即时通讯

使用 SignalR 和 .NET MAUI 的实时聊天应用程序

实时应用程序的主要特点之一是能够向用户提供即时反馈。这类应用程序的例子包括消息应用程序、视频会议应用程序、协作编辑工具和实时数据仪表板。聊天应用程序是实时应用程序中最受欢迎的例子…

IM开发老王
2023年9月13日
实时音视频

音视频开发之AudioEngine音频引擎

Audio Engine是一种数字信号处理器（DSP），用于将音频信号从一种形式转换为另一种形式。它通常被用于音频系统中，以处理音频信号，例如将模拟信号转换为数字信号，进行音频压缩…

RTC观主
2023年9月13日
技术文章

Qt V4L2摄像头编程

V4L2（Video for Linux 2）是一个用于Linux操作系统的视频捕捉和输出框架。它提供了一组API和驱动程序接口，用于与摄像头设备进行交互和控制。如果你想进行V4…

码农突围
2023年9月13日
实时音视频

音视频开发之提取与解码(音视频基础知识)

提取与解码是两个很常见的概念，比如在自然语言处理中就有提取与解码，它们的英文名叫Extractor与Decoder。 Extractor和Decoder是自然语言处理领域中的两个重…

RTC观主
2023年9月13日
技术文章

FFmpeg macOS硬件转码近似最优解

FFmpeg上的硬件加速涉及以下三块： hwcontext在硬件解码、硬件编码、硬件filter之间起到配置硬件、维护上下文、支持多种硬件加速API之间互操作的作用。如果不注意hw…

FFmpeg笔记
2023年9月13日
技术文章

什么是人工智能语音发生器?人工智能语音发生器的工作原理和优势

随着越来越多的公司利用语音技术创造高效的客户服务体验和令人难忘的互动，语音技术也变得越来越流行。在当今的数字环境中，人工智能通常为语音技术提供动力，使计算机能够理解有声语言并作出反…

音频技术
2023年9月13日
技术文章

什么是ROIP网关？ROIP网关的特点和功能

ROIP（Radio over Internet Protocol）网关是一种用于将无线电通信（如对讲机、无线电台）与互联网或IP网络集成的设备或系统。ROIP网关的主要功能是将传…

RTE基础设施
2023年9月13日
技术文章

VoIP 路由及其对通话质量的影响

网络电话（VoIP）彻底改变了企业的通信方式。通过将语音呼叫转换成数据包并在互联网上传输，VoIP 提供了一种灵活、经济高效的通信解决方案。这项技术的一个重要组成部分是 VoIP …

茉莉
2023年9月12日
技术文章

D3T:Deadline-aware的实时视频流传输控制框架 | ICNP 2021

近年来，实时应用程序的截止日期要求迅速增加（例如云游戏、云虚拟现实、在线会议）。由于网络条件的多样性，满足这些应用程序的截止日期要求已成为研究的热点之一。然而，当前的方案主要关注提…

视频技术
2023年9月12日
实时音视频

Android录制视频，软编实现音视频的录制

软编实现音视频录制前言之前的硬编我们可以基于 Android 官方提供的 MediaCodec 来实现编码，基本上可以做到一边录制一边编码并封装为MP4文件。速度肯定是更快的…

字节流动
2023年9月12日
实时音视频

音视频面试题集锦 2023.09

下面是 2023.09 月音视频面试题集锦的几条干货精选： 1、PCM 音频数据是怎么组织的？ 1）数据生成模拟数据 → 采样 → 量化 → 编码 → 数字信号 2）数…

RTC观主
2023年9月12日
实时音视频

音视频学习–Raw格式引起的图像问题

您是否曾经尝试解决一个小问题却发现自己意外地解决了一个更大的问题？问题背景最近研发小伙伴在预研新的产品，在系统正常运行起来之后，发现一个奇怪的问题：从图片来看，可能是图像处理过…

MediaStack
2023年9月12日
技术文章

2D 特征跟踪 – 第 1 部分：检测

交通图像上检测到的关键点你是否曾经想过手机是如何在视频中跟踪你的脸部随着你移动的呢？或者自动驾驶汽车如何保持对道路上其他车辆的跟踪？所有这些惊人的成就都是通过2D特征跟踪实现的，…

图像处理
2023年9月12日
技术文章

利用潜空间屏蔽技术提升机器的神经图像压缩能力 | TCSVT 2022

这篇文章主要介绍了一种基于深度学习网络的图像压缩框架，该框架并不把提升人类视觉质量作为最终目标，而是面向进行计算机视觉任务的机器并进行进行端到端的训练，最终得到了优于标准VVC的图…

图像处理
2023年9月12日
即时通讯

如何使用 Next.js 、Typescript 和 Socket.io 构建简单的聊天应用程序？

要使用 Next.js、TypeScript 和 Socket.IO 制作一个简单的聊天应用程序，可以按照以下步骤操作： 1. 在终端运行以下命令，创建一个新的 Next.js 项…

IM开发老王
2023年9月12日
实时音视频

Flutter直播示例源码及运行指引

本文分享即构Flutter直播示例源码，此示例源码向用户展示了 SDK 中的初始化、登录房间以及基础推拉流等功能。通过顺序阅读快速开始章节中的文档并参考示例代码，相信用户也能快速让…

ZEGO即构科技
2023年9月11日
技术文章

西工大 ASLP 实验室在 WeNet 中开源基于 CPPN 的神经网络热词增强语音识别方案

语境偏置（Contextual biasing）旨在将语境知识集成到语音识别（ASR）系统中，以提高在相关领域词汇（俗称“热词”）上的识别准确率。在许多ASR场景中，待识别语音中可…

音频技术
2023年9月11日
即时通讯

了解 HTTP 方法、Webhooks、Websockets 以及 HTTP 流实时通信的局限性

在网络开发领域，对网络通信的基本了解非常重要。HTTP 方法、webhooks 和 websockets 都是值得关注的核心概念。在本文中，我们将深入探讨这些概念，并通过实际案例来…

IM开发老王
2023年9月11日