技术文章
-
音视频入门很难?可能是你姿势不对
关于我 擅长安卓开发、音视频开发、Opengl渲染等,目前从事视频剪辑软件开发。 关于未来,目前我比较感兴趣的一个领域是Ros机器人,平时有空也会了解一下相关的知识,欢迎感兴趣的童…
-
WebRTC与RTSP:物联网决定视频流未来的关键协议
一、引言 随着智能摄像机在全球范围内的普及,视频数据的收集与传输已成为关键的通信手段。这种趋势不仅限于安全监控,而是扩展到了多个领域,如远程工作、在线教育和数字娱乐。这推动了全球视…
-
MQTT是什么?MQTT 的用途和使用案例
MQTT 是什么?有什么用途 MQTT 是一种轻量级消息传递协议,通常与物联网设备一起使用,其设计旨在提高能效并将带宽消耗降至最低。 MQTT 协议在 TCP/IP 上运行,基于无…
-
基于应用识别和感知优化的5G服务质量保障方案研究
摘 要:首先,对5G智能核心网网元NWDAF和UPF赋能,多网元联动形成能力底座,然后基于AI和大数据分析能力,对业务流量进行应用识别和感知优化,实现移动网数据业务的动态GBR保…
-
最适合流媒体的视频编解码器是什么?
保持视频质量始终是视频流媒体面临的一项挑战。直播的成功和观众的参与度取决于流媒体的质量。影响流媒体质量的技术因素有很多。视频压缩技术或编解码器是主要因素之一。目前有多种编解码器,如…
-
WebRTC 协议综述及其重要性
WebRTC 已经走过了漫长的道路。它于 2011 年由谷歌推出,2013 年首次在跨浏览器上实现。直到 2021 年,WebRTC 1.0 才正式发布,使其成为一项标准! 在技术…
-
AI + WebRTC 产品开发成功蓝图
人工智能驱动的 WebRTC 应用程序或任何产品成功的背后是什么?为了展示人工智能和 WebRTC 的威力,以及创建优秀产品背后的步骤,我们组建了一个全明星内部团队,创建了一个随身…
-
FLATTEN: 针对文本到视频一致性编辑的光流引导注意力机制
文本到视频编辑任务中的一个主要挑战是确保编辑后视频的帧间一致性。最近的研究致力于将文生图扩散模型应用于视频编辑任务,通过将U-Net中的2D空间注意力机制扩张为3D时空注意力机制。…
-
需要考虑用开源媒体服务器替代 Twilio 视频吗?
在其业务模式或业务通信中使用实时视频的许多公司今年都将面临一个类似的问题:在 Twilio Video 生命周期结束之前,我有哪些替代方案?这是一个很好的问题,应该仔细研究。像这样…
-
DiffusionGPT:大规模语言模型驱动的文本到图像生成系统
扩散模型为图像生成领域开辟了新途径,导致开源平台上共享的高质量模型激增。然而,当前的文本到图像系统仍然存在一个重大挑战,通常无法处理不同的输入,或者仅限于单一模型结果。目前的统一尝…
-
IM专题:服务化架构IM系统(5)— 优雅上线
在 IM 的服务化架构体系中,很多功能(如用户登录、状态同步、消息收发、联系人管理、系统消息等)逻辑的设计与实现,与分层架构 IM (见IM专题:分层架构系列合集)中的设计与实现非…
-
HiNeRV:基于分层编码神经表示的视频压缩 | NeurIPS 2023
本文提出了一种名为 HiNeRV 的神经表示模型用于视频压缩。HiNeRV 将轻量级层与新颖的分层位置编码相结合,采用深度卷积、MLP 和插值层来构建具有高容量的深而宽的网络架构。…
-
使用 Django Channels 和 Redis 构建实时聊天应用程序
简介:实时聊天应用程序彻底改变了在线交流,为用户提供了即时互动和协作。在本综合教程中,我们将指导您使用 Django Channels 和 Redis 创建一个实时聊天应用程序。D…
-
如何使用 ffmpeg 从 pdf 文件导出图片
最近遇到一个特殊的需求,要把pdf文件中的插图调整一下。解决的思路是设法把pdf文件的每页导出为单独的图片,待图片修改完成后再重新组合为一个pdf文件。本文记录如何使用ffmpeg…
-
小程序即时通讯(ZIM) 2.14 版本发布,新增合并转发,好友管理等多项功能
近日,ZIM(即构即时通讯产品) 2.14 版本发布,涉及Android、iOS、Native、Web、小程序,Flutter等平台,本文分享下小程序端即时通讯新增功能,如下: 1…
-
一口气搞懂所有 YUV 格式图像的 OpenGL 渲染(收藏)
OpenGL ES 渲染 NV21、NV12、I420、YV12、YUYV、UYVY、I444 本文主要讲解常见的几类 YUV 格式图像渲染方式,如果对 YUV 格式不是很熟悉的同…
-
Golang 基于 Gorilla WebSocket 开发简单的聊天应用程序
Gorilla WebSocket 是 Go 编程语言(Golang)的一个流行 WebSocket 库。它为在 Go 语言中处理 WebSocket 连接提供了一种简单高效的方法…
-
大模型推理框架RTP-LLM对LoRA的支持
01 引言 LoRA(Low-rank Adapter)在大模型(如GPT-3,LLama, Qwen等)中,是一种重要的微调技术。该技术通过在不改变预训练模型参数的同时,添加低阶…
-
IM专题:服务化架构IM系统(4)— 红包
在 IM 系统中,“红包” 是一种很常见的应用。在前面的文章 (见IM专题:IM需求分析模型)中,我们曾分析过,“红包” 属于扩展功能需求,“消息” 属于基础功能需求,红包功能的实…
-
OpenGLES 3D 模型
OpenGLES 3D 模型本质上是由一系列三角形在 3D 空间(OpenGL 坐标系)中构建而成,另外还包含了用于描述三角形表面的纹理、光照、材质等信息。 构建一些规则的 3D …