技术文章
-
HiNeRV:基于分层编码神经表示的视频压缩 | NeurIPS 2023
本文提出了一种名为 HiNeRV 的神经表示模型用于视频压缩。HiNeRV 将轻量级层与新颖的分层位置编码相结合,采用深度卷积、MLP 和插值层来构建具有高容量的深而宽的网络架构。…
-
使用 Django Channels 和 Redis 构建实时聊天应用程序
简介:实时聊天应用程序彻底改变了在线交流,为用户提供了即时互动和协作。在本综合教程中,我们将指导您使用 Django Channels 和 Redis 创建一个实时聊天应用程序。D…
-
如何使用 ffmpeg 从 pdf 文件导出图片
最近遇到一个特殊的需求,要把pdf文件中的插图调整一下。解决的思路是设法把pdf文件的每页导出为单独的图片,待图片修改完成后再重新组合为一个pdf文件。本文记录如何使用ffmpeg…
-
小程序即时通讯(ZIM) 2.14 版本发布,新增合并转发,好友管理等多项功能
近日,ZIM(即构即时通讯产品) 2.14 版本发布,涉及Android、iOS、Native、Web、小程序,Flutter等平台,本文分享下小程序端即时通讯新增功能,如下: 1…
-
一口气搞懂所有 YUV 格式图像的 OpenGL 渲染(收藏)
OpenGL ES 渲染 NV21、NV12、I420、YV12、YUYV、UYVY、I444 本文主要讲解常见的几类 YUV 格式图像渲染方式,如果对 YUV 格式不是很熟悉的同…
-
Golang 基于 Gorilla WebSocket 开发简单的聊天应用程序
Gorilla WebSocket 是 Go 编程语言(Golang)的一个流行 WebSocket 库。它为在 Go 语言中处理 WebSocket 连接提供了一种简单高效的方法…
-
大模型推理框架RTP-LLM对LoRA的支持
01 引言 LoRA(Low-rank Adapter)在大模型(如GPT-3,LLama, Qwen等)中,是一种重要的微调技术。该技术通过在不改变预训练模型参数的同时,添加低阶…
-
IM专题:服务化架构IM系统(4)— 红包
在 IM 系统中,“红包” 是一种很常见的应用。在前面的文章 (见IM专题:IM需求分析模型)中,我们曾分析过,“红包” 属于扩展功能需求,“消息” 属于基础功能需求,红包功能的实…
-
OpenGLES 3D 模型
OpenGLES 3D 模型本质上是由一系列三角形在 3D 空间(OpenGL 坐标系)中构建而成,另外还包含了用于描述三角形表面的纹理、光照、材质等信息。 构建一些规则的 3D …
-
WebRTC 测试对整个开发生命周期的影响
在产品开发生命周期中,WebRTC 应用程序与其他应用程序并无不同。尽管如此,了解 WebRTC 及其生命周期可以极大地帮助我们满足 WebRTC 测试需求。 描述产品开发生命周期…
-
用 Python 制作实时 WebSocket 聊天应用程序
实时聊天应用简介 在联系日益紧密的数字世界中,实时通信已成为我们相互交流的主要方式。无论是工作还是社交,一个高效、无缝的聊天应用程序是我们即使相隔万里也能保持联系的工具。Pytho…
-
用 Go 构建实时 HTTP 音频流服务器指南
有时,我会偶然发现一些网络广播电台,这些电台播放的音乐种类繁多,但往往被主流流媒体平台所忽视。由于经常能发现意想不到的好曲目,我越来越喜欢这种音频消费模式。一般来说,虽然像 Ice…
-
如何正确配置 SRT 协议流媒体的编码设置和延迟
SRT(安全可靠传输)协议在互联网直播视频流方面越来越受欢迎。它提供低延迟、高质量的视频传输,并得到流行流媒体软件的广泛支持。不过,为了确保最佳的流媒体体验,在使用 SRT 时正确…
-
什么是移动直播?移动直播的好处和工作原理
数字时代改变了我们的内容消费习惯,而直播的迅速崛起一直处于这场革命的最前沿。直播视频内容已成为在线消费最流行的视频内容类型之一,无论是出于娱乐目的还是出于功能目的。根据 Stati…
-
2024 年 WebRTC API 格局
本文来自 webrtc-developers 博客,作者 Olivier Anguenot 关于 WebRTC API 情况的海报更新。 作者用浏览器中最新的 API 更新了海报,…
-
音频编解码器有哪些(音频编解码器哪个好)
当您考虑在线流媒体内容时,您可能会把注意力集中在视觉方面,如高比特率或最新的编解码器,但这只是获得卓越视频体验的一半。任何流媒体视频的音频质量都会影响您的客户是否能度过一个愉快的电…
-
通过任务关系建模的多智能体策略迁移 | 秦熔均、陈烽、王同翰、章宗长、张崇洁、俞扬等
研究意义 近些年来,深度强化学习在许多应用领域当中展现出了巨大的发展潜力,例如在围棋和电子游戏当中取得了巨大成就,它已然是人工智能研究领域用于建模人类决策智能的重要方法。除了单个个…
-
AAC高级音频编码是什么?AAC规格、格式分类及处理流程
AAC高级音频编码是什么? AAC(Advanced Audio Coding),中文名是高级音频编码。它是由Fraunhofer IIS、杜比实验室、AT&T、索尼等公司…
-
Upscale-A-Video: 实时视频超分辨率的时间一致扩散模型
基于文本的扩散模型在生成和编辑方面取得了显著的成功,显示出利用扩散模型先验生成性增强视觉内容的巨大前景。然而,由于对输出保真度和时间一致性的高要求,将扩散模型应用于视频超分辨率仍具…
-
关于苹果 AV1 支持您需要了解的一切
苹果公司宣布 iPhone 15 Pro 和 15 Pro Max 将配备专用的 AV1 硬件解码器,成为首批正式支持 AV1 编解码器的苹果设备,这在视频编码和流媒体界掀起了轩然…