技术文章
-
什么是AI视频压缩?AI视频压缩的原理及未来
AI 视频压缩是一场充满潜力并得到大型科技公司支持的 AI 革命。事实上,H.265 和 ProRes 等现代视频编解码器现在正受到由 AI 支持的新型智能视频压缩的挑战。这些 A…
-
WebM 格式:定义、优势以及 WebM 与 MP4的区别
什么是 WebM 格式? WebM 是一种免版税的开源媒体文件格式,用于存储音频和视频内容。它由 Google 于 2010 年创建,基于 Matroska 格式。WebM 专为现…
-
一种符合视频压缩标准的嵌入视频分析元数据的方案
如果您正在从事视频分析(基于计算机视觉或深度学习),并希望学习一种更简单的方法来查看结果(注释或推理元数据),那么这篇文章就是为您准备的。它介绍了一种符合标准的方法,可在不改变像素…
-
掌握多云和边缘数据同步:使用 KubeMQ Java SDK 的零售业用例
探索 KubeMQ 的开源 Java SDK 如何为希望跨复杂的多云和边缘环境管理数据的企业提供强大的解决方案。
-
什么是视频字幕?视频字幕常见格式和最佳实践
视频字幕是视频中对话、音效和其他音频元素的文本版本。它们通常与视频一起显示在屏幕上,旨在让更多观众(包括失聪或听力障碍者、非母语人士或喜欢关闭声音观看视频的人,即静音视频)更容易观…
-
IBM 发布 PowerLM-3B 和 PowerMoE-3B:利用 30 亿个参数和先进的 Power 调度器革新语言模型,实现高效的大规模 AI 训练
IBM 推出 PowerLM-3B 和 PowerMoE-3B 标志着 IBM 在提高语言模型训练效率和可扩展性方面取得了重大进展。IBM 基于创新方法推出了这些模型,这些方法解决…
-
GStreamer 和 WebRTC HTTP 信令
我们中的 WebRTC 开发者应该还记得我们了解 WebRTC 的第一件事,那就是它是媒体和数据点对点通信的规范,但它没有规定如何进行信令传输。 或者更简单地说,如果你想在网络上给…
-
在 React Native 和 React.js 中掌握套接字监听器
在当今快节奏的实时应用程序世界中,套接字监听器已成为构建动态和交互式用户体验的重要工具。无论是聊天应用程序、实时通知系统还是实时源,套接字侦听器都能在服务器和客户端之间实现无缝的双…
-
M4A 格式是什么?M4A 、MP3 和 WAV 的对比
MPEG-4 Audio(简称 M4A)是 Apple 推出的一种音频文件格式,可以存储多种音频内容类型,包括歌曲、有声读物和播客。它将音频数据保存在 MPEG-4 文件中,并使用…
-
将视频转换为任意格式的 5 种方法
什么是视频格式? 视频格式是用于在计算机系统上存储数字视频数据的文件格式。常见的视频格式包括 AVI、MP4、MOV 和 WMV。您选择的视频格式会影响视频的质量、压缩率以及与播放…
-
OpenSIPS 3.6 中的 Amazon SQS 事件
Amazon Simple Queue Service(SQS)是一种完全托管的消息队列,适用于微服务、分布式系统和无服务器应用程序。通过 SQS,您可以发送、存储和接收消息,从而…
-
一文讲清楚 Vulkan 描述符集
Vulkan 描述符集 Vulkan 中,描述符(Descriptor)是一种用于在着色器中访问资源(如缓冲区、图像、采样器等)的机制或协议。 每个描述符对应一个资源,代表 GPU…
-
哔哩哔哩直播通用奖励系统揭秘
本文将介绍 B 站直播奖励系统的技术架构,从需求分析到实现细节,全面解析其背后的技术方案。
-
PTS、Timebase和编码器码率控制
1. Timestamp 音视频处理离不开时间戳timestamp的概念: 从采集、前处理、编码、封装传输、解封装、解码、后处理和播放,时间戳流转如下: 1.1 PTS的首要作用是…
-
如何使用 Node.js、FFmpeg 和 Next.js 构建全栈视频流平台:综合指南
创建视频流平台是一个令人兴奋而又充满挑战的项目。最近,我将 Node.js 与用于后端处理的 FFmpeg 和用于现代前端的 Next.js 整合在一起,开始了这一旅程。在本文中,…
-
FFmpeg 与 GStreamer 综合比较
说到多媒体处理,有两家巨头往往脱颖而出: FFmpeg 和 GStreamer。两者都是强大的多媒体框架,用于处理音频和视频内容,但它们有不同的方法、用例和优势。了解它们的区别有助…
-
WebRTC 和 AI 语音转文本技术如何改变在线交流方式
WebRTC 正在改变我们的在线互动方式。它允许我们在网络浏览器之间直接共享音频、视频和数据,而无需额外的服务器。这项技术令人兴奋的新功能之一就是语音转文本(STT)。 此功能可将…
-
结合YOLOv8和OpenCV WeChat QRCode打造一款二维码识别器
二维码(QR Code)在现代生活中有广泛应用,从支付系统到信息传递,它们无处不在。本文提出了一种如何识别二维码的方法,主要贡献在于优化处理分辨率较高的图像时,由于二维码在整张图片…
-
什么是视频文件格式?常见的视频文件格式有哪些
什么是视频文件格式? 视频文件格式是一种用于在计算机上存储数字视频数据的结构。格式定义了视频数据的压缩和解压缩方式,使其可以在各种媒体播放器和设备上播放。不同的格式更适合特定类型的…
-
什么是服务器到服务器 (S2S) 通信?
了解服务器到服务器 (S2S) 通信的主要方面,包括协议、安全措施和潜在挑战,从而更好地理解其在当今数字领域中的作用。