按时间归档:2023年
-
基于多任务学习的保留背景音的语音转换 | ICASSP2023
在影视、有声书内容中,背景音是一种表现丰富的艺术形式。语音转换(Voice Conversion)如能将源说话人语音转换成目标说话人语音的同时,保留源语音中的背景音,将会提供更沉浸…
-
如何处理计算机视觉和深度学习中的图像数据
在过去几年从事多个计算机视觉和深度学习项目之后,我在这个博客中收集了关于如何处理图像数据的想法。对数据进行预处理基本上要比直接将其输入深度学习模型更好。有时,甚至可能不需要深度学习…
-
什么是LUT滤镜?如何在Opengl中使用LUT滤镜
什么是LUT滤镜 从今天开始我们开始进入Opengl ES的滤镜专题,提到滤镜就不得不提用得最多的LUT滤镜了。 LUT全称LookUpTable,也称为颜色查找表,它代表的是一种…
-
复活RTMP:和OBS支持RTMP HEVC新标准
OBS 29.1支持RTMP的HEVC,所以你现在可以用OBS和SRS做HEVC的直播了。 现在,RTMP支持HEVC出新标准了,详见Enhanced RTMP。这个标准定义了一个…
-
低延时音视频技术在OPPO云渲染场景的应用
本文主题是低延时音视频技术在 OPPO 云渲染场景的应用与实践。 主要包括以下内容: 1. 云渲染场景的传输需求及挑战 2. RTC 和云渲染业务的结合 3. 低延时串流技术探索 …
-
智能眼镜可识别无声语言指令
一款名为EchoSpeech的低功耗可穿戴设备只需要几分钟的用户训练数据,就可以识别命令,并在智能手机上运行。 信息科学博士生Ruidong Zhang是“EchoSpeech: …
-
使用 JavaScript 和 Nodejs 搭建 webrtc信令服务器(webrtc入门一)
由于 WebRTC 入门学习的信息比较杂乱,我决定创建一个教程。希望它对任何想尝试 WebRTC 的人都有帮助。 虽然 WebRTC 不是一项新技术,但它在不断发展。WebRTC …
-
即构科技获“最受欢迎虚拟人AI引擎提供商奖”,ZEGO Avatar商业化落地价值广受市场认可
近日,由全球新经济产业第三方数据挖掘和分析机构艾媒咨询主办的“2023年中国虚拟人产业大会暨AIGC创新发展论坛”在广州召开。数百名行业精英领袖、资深分析师、虚拟人项目主理人、高校…
-
声网与Google正式达成联合商业计划,共同助力企业出海
4月6日,声网与 Google 正式签署联合商业计划(Joint Business Plan),本次联合商业计划将充分发挥 Google Ads&nb…
-
使用扩散模型实现基于文本的图像编辑 | CVPR 2023
在本文中,作者提出了 Imagic,能够将复杂的文本指导的语义编辑应用于单一真实图像,同时保留其原始特征。与以前的工作不同的是,此方法只需要一张输入图像和一个目标文本,不需要任何额…
-
腾讯云音视频与SRS开源生态
自由与开源软件的理念,从不解、争议、接受到如今如火如荼,经历了长期的历程。国内开源软件起步较晚,但进展迅速。腾讯经过几年的开源协同运动,也取得了不少成绩。其中,腾讯云音视频在FFm…
-
ChatGPT等AIGC如何移动边缘部署?南洋理工最新《 在移动网络中释放边云生成AI的力量:AIGC服务》综述其技术体系
人工智能生成内容(AIGC)是一种使用人工智能算法创造性地生成、操作和修改有价值和多样化数据的自动化方法。本文重点研究了ChatGPT和Dall-E等AIGC应用在移动边缘网络(m…
-
Omdia市场分析: 边缘计算对制造业、零售业和金融业的影响
边缘计算技术的出现能够支持业务转型,使云端数据处理更靠近用户。各行各业的企业都在考虑并采用边缘计算解决方案来实现实时业务流程自动化,同时获得关键洞察来改善业务运营活动。 大多数企业…
-
苹果专利通过包含确定虚拟听觉环境的传感器来推进空间音频的发展
美国时间4月6日,美国专利商标局公布了 Apple 的一项与空间音频相关的专利申请。该专利深入研究了从 AirPods 到 AirPods Max 再到 XR 耳机等设备中的先进传…
-
联络中心的 7 个生成式 AI 用例
生成式 AI 的兴起有望改变游戏规则。有些人甚至将其比作互联网、智能手机和云的黎明。 然而然而,炒作并没有消退。如果有的话,技术供应商正因其带来的创新潜力而变得更加兴奋。 联络中心…
-
微软通过新的电子邮件 API 扩展其 CPaaS 平台
微软已将电子邮件 API 添加到其 CPaaS 平台 Azure 通信服务中。 CPaaS 允许企业使用随时可用的 API 将实时通信渠道注入在线或应用内客户旅程中。 现在,Mic…
-
intoPIX与Panasonic Connect合作,启用新的JPEG XS相机进行实时视频制作
2023年4月6日 – intoPIX,轻量级低延迟压缩解决方案的领先供应商,今天自豪地宣布与Panasonic Connect合作,将其JPEG XS技术整合到他们的…
-
Ateme 推出虚拟休息室解决方案
视频传输解决方案的供应商 ATEME 推出了新的虚拟休息室解决方案。这一创新解决方案旨在为远程活动和虚拟会议提供高质量的视频观看体验。 虚拟休息室解决方案包括各种适合举办虚拟活动的…
-
Intigral 选择 VisualOn 来优化 VoD 网络的带宽成本和视频质量
2023年4月5日-NAB 2023,视频流解决方案供应商 VisualOn 宣布,Intigral 选择 VisualOn Optimizer来优化 CDN 带宽和存储成本,同时…
-
NVIDIA 赋能 Cyanpuppets 打造实时 2D 视频生成 3D 骨骼 AI 转换模型
青色木偶科技 Cyanpuppets 致力于 AI 图像算法技术和实时渲染平台工具,是一家以卷积神经网络和深度神经网络算法为核心,打造自研 AI 模型架构、实现虚拟与现实世界驱动协…