技术文章
-
坐席辅助系统中语音与文本的碰撞
编者按:在贷后催收行业中,每个公司每天的录音量可达上万小时,因此语音识别功能对其非常重要。今天LiveVideoStack大会邀请到了洞听智能的张玉腾老师,为我们介绍在坐席辅助系统…
-
揭秘!虚拟偶像 A-SOUL 联手 NVIDIA Omniverse Enterprise 跨次元拜年幕后
伴随春节的临近,来自各个领域的拜年祝福多了起来,大家纷纷通过视频、直播的方式传递心意。近期,一则极具特色的跨次元拜年视频引起关注,正是来自国内超人气虚拟偶像组合 A-SOUL 联合…
-
WebRTC——连接现代世界的技术
近几年,被认为是正常的工作条件和要求的许多方面都发生了变化;见面的次数变少了,去办公室变得可有可无(或者根本就不存在),而拥有完全远程工作的选择成为一种必须,至少对于所有可能这样做…
-
WebRTC在web上如何支持H265
由于H265受版权的影响,浏览器都不愿意支持,所以webrtc不能实现H265的解码播放。但是工作中需要h265去解决带宽问题,所以要解决浏览器不支持H265播放。从度娘上了解,可…
-
IM 1对1聊天系统架构和存储如何设计
在众多的软件中,聊天功能是不可或缺的一个功能模块,或是用户和用户,或是用户和客服,都需要一个能够即时沟通的功能。 那么一个IM(InstantMessaging)的1对1聊天系统架…
-
IM专题:IM 需求分析模型
需求是驱动软件架构和功能实现的源动力,把握住需求则把握住了软件架构的方向! IM 系统的每一项功能,理解很容易,但是数量繁多;作为 IM 系统的业务架构师,怎样对其进行有效的分类和…
-
IM技术专题设计
在上一篇短文中,提到【IM系统技术专题】,该技术专题初步规划的大纲如下: IM系统模型分析 IM系统需求分析 IM系统单体架构分析与核心逻辑实现 IM系统分层架构分析与核心逻辑实现…
-
了解新技术之 Web 3.0 vs Web 4.0 vs Web 5.0?
“万维网(WWW)”是互联网最广为人知的术语之一,指的是基于技术网络的人与人之间的互动。 “技术社会系统”也被称为增加人类理解、交流和合作的系统,通过声明“共同认知”对于交流和合作…
-
利用ffmpeg合并与分离音频和视频
一、当视频文件中没有音频时 将audioname音频与videoname视频替换 二、当视频包含音频时 用audioname音频替换videoname中的音频 说明: videon…
-
体积视频:3D 捕捉技术在体育和娱乐中受到青睐
在近年来冲击电影和广播制作行业的新技术和新技术的爆炸式增长中,“体积视频”一词可能尚未达到对 VR 或 AR 等的一般形象或理解。但随着 2019 年以来体积项目流量的增加,以及一…
-
在树莓派上安装 Websocat
WebSocket 是基于 TCP 的双向通信协议。Websocat是一种能够从命令行使用 WebSocket 客户端或服务器的工具。它可以在客户端模式下运行并连接到 WebSoc…
-
WebSocket 回声客户端
WebSocket是一种通过TCP的双向通信协议。WebSocket在客户端和服务器之间提供了一个持久的连接。这意味着他们双方可以在任何时候发送数据。 回声客户端连接到回声服务器并…
-
使用nginx和ffmpeg搭建HLS流媒体服务器
如何使用nginx和ffmpeg搭建HLS流媒体服务器 目录 最近研究HLS流媒体协议,需要临时搭建HLS服务器,这里记录下搭建的过程(操作系统:CentOS Linux rele…
-
使用nginx临时搭建rtmp服务器
由于需要研究rtmp协议交互方式及报数据格式,使用nginx临时搭建一个rtmp服务器,主要通过nginx的rtmp扩展模块实现接收RTMP推送的音视频流,同时提供RTMP拉流服务…
-
Ffmpeg编码实战!
一. 读取YUV文件并编码成H264的DEMO介绍: 本次的DEMO是通过读取YUV文件,并利用FFMPEG编码成H264格式并输出到文件上面,保存的格式是·xxxx.h264的文…
-
基于Transformer的图像变化监测
现代变化检测通过深度卷积强大的判别能力取得了显着的成功。然而,由于场景中物体的复杂性,高分辨率遥感变化检测仍然具有挑战性。具有相同语义概念的对象可能在不同的时间和空间位置表现出不同…
-
Android实现屏幕共享功能(基于即构屏幕共享SDK)
屏幕共享功能简介 屏幕共享是指在视频通话或互动直播过程中将屏幕内容以视频的方式分享给其他的观众,以增强互动体验,提高沟通效率。 屏幕共享在如下场景中应用广泛: 示例源码下载 请参考…
-
利用WebTransport进行现场视频流注入
编者按:通过网络支持的实时音视频通话已成为人们日常生活和办公中必不可少的一部分,对于音视频领域的网络技术要求也越来越高。对此,LiveVideoStack特别邀请到了来自美国Par…
-
WebRTC ICE 交互流程介绍
在 WebRTC P2P 打洞原理 中,我们大致了解了 P2P 的打洞原理。但实际情况比理论要复杂得多。经典的 NAT(NAPT)可分为完全圆锥型、受限圆锥型、端口受限圆锥型和对称…
-
小布助手:业界首个基于对话音频的小样本语音合成技术实践
01 背景 传统基于神经网络的语音合成方法TTS已成为主流,技术相对也比较成熟,但是需要大量发音人的原始录音数据,制作成本相对较高。因此,少量语音样本的自定义TTS技术是语音合成领…