按时间归档:2022年
-
AI音视频技术在金融场景下的应用实操
摘要:AISummit全球人工智能技术大会上,中关村科金副总裁、金融事业部总经理邓江带来了主题演讲《AI音视频技术在金融场景下的应用实操》,从应用、技术、作用与价值三个层面来介绍音…
-
AI时代的视频云转码移动端化——更快、更好,更低,更广
这是我第二次在LiveVideoStackCon分享,第一次时本人肚子还没有这么大,疫情三年肚子长大了,但我们的模型会变得越来越小、越来越快、效果越来越好,这就是“更快、更好、更低…
-
WebRTC 源码分析 (一) Android 相机采集
在 WebRTC Android 中,已经兼容了 Camera 和 Camera2 原生 API 的相机采集,所以我们不必再单独实现一套采集功能。不过我们可以根据 RTC 的抽象…
-
FFmpeg时间戳
FFmpeg内部有多种时间戳,基于不同的时间基准。理解这些时间概念,有助于通过FFmpeg进行音视频开发 在我看来,FFmpeg有两个时间基准:AV_TIME_BASE和AVStr…
-
快手推出“快手虚拟演播助手” 支持多平台推流直播
近日,快手技术团队在2022世界人工智能大会上宣布推出“快手虚拟演播助手(Kuaishou Virtual Studio,KVS)”。 KVS集成3D虚拟人和虚拟场景的一站式能力,…
-
字节跳动公益平台上线“DOU爱公益日”,以短视频和直播连接善意
在第七个中华慈善日来临之际,多家互联网平台发起公益日活动。继腾讯“99公益日”、阿里巴巴“95公益周”后,字节跳动公益平台首次发起“DOU爱公益日”主题活动,提出“开心做好事”的公…
-
基于 AI 的媒体编码
MPAI(MOVING PICTURE, AUDIO AND DATA CODING BY ARTIFICIAL INTELLIGENCE)是一个国际化的非盈利性质的组织,主要的研…
-
边缘云技术创新 让“云”无处不在
5G时代来临,万物智联已经走入大众生活,对计算结构提出了全新要求。随着终端算力上移、云端算力下沉,在边缘形成算力融合,边缘计算逐渐深入多种应用场景,成为不可或缺的网络基础设施与支撑…
-
让元宇宙离现实更近一点,Cocos 为世界人工智能大会打造线上版「元生无界」
2022 年 9 月 1-3 日,由国家发展和改革委员会、工业和信息化部、科学技术部、国家互联网信息办公室、中国科学院、中国工程院、中国科学技术协会和上海市人民政府共同主办的 20…
-
2022世界人工智能大会开幕 “元宇宙”风起 落地待时日
导读:这是上海连续第五年举办世界人工智能大会,前四届大会共吸引600余家重点企业参与合作,155个重大项目集中签约,投资额累计达1107亿元。 AI正在从虚拟世界走向现实中。 9月…
-
音视频开发进阶课程|第六讲上:色彩和色彩空间
在前面几篇文章中,我们完成了音频相关基础知识的学习,从今天开始,我们要暂别音频,继续学习视频相关基础内容。 虽说声音在我们日常的生活、工作、娱乐过程中,发挥着不可替代的作用,但人们…
-
阿里公布多主播虚拟直播专利,可生成多个虚拟人进行直播
8月30日,阿里巴巴(中国)有限公司申请的“多主播虚拟直播方法以及装置”专利公布。 专利摘要显示,该方法应用于虚拟直播控制系统,包括:获取直播间的直播模式设置参数以利用多个虚拟人物…
-
苹果新获得两项音频专利
近日,美国专利商标局正式公布了苹果公司新授予的66项专利,其中两项与音频相关。 第一项音频专利涵盖了一种系统和方法,用于配置和调整扬声器系统输出的波束模式,以响应名为“免提波束模式…
-
虚拟数字人的痛点: 漂亮的皮囊有了缺有趣的灵魂
[ IDC在6月发布了一份《中国AI数字人市场现状与机会分析,2022》报告,预测中国AI数字人市场规模在2026年将达102.4亿元。 ] 2022世界人工智能大会(WAIC)将…
-
好视通获近亿元战略投资
8月31日消息,好视通正式宣布2022年获得近亿元战略投资,投资方为中国联通、格力集团和松禾资本等知名投资机构旗下的投资主体。联通创新基金总经理许柏明、格力金投董事长陈恩、高榕资本…
-
“‘宁静中国’与噪声治理关键技术”之交通噪声控制
2022年8月22日至23日,在北京召开的“‘宁静中国’与噪声治理关键技术”香山科学会议上,与会专家围绕“创新发展噪声科技,支撑建设‘宁静中国’”的主题,针对交通运输噪声、工业噪声…
-
未来十年,AI 语音识别将朝着这五个方向发展
在过去的两年中,自动语音识别(Automatic Speech Recognition, ASR)在商用上取得了重要的发展,其中一个衡量指标就是: 多个完全基于神经网络的企业级 A…
-
网龙公司任命国内首位虚拟人CEO
本文来源:时代周报 作者:齐鑫 虚拟数字人不光能直播,甚至还能当公司CEO。 近日,网龙公司(00777.HK)通过其官网发布公告称,旗下子公司福建网龙计算机网络信息技术有限公司任…
-
Camera 图像 MIPI Raw 是怎么回事?
简介 有时我们得到的Raw图是MIPI格式的,为了能正确读取该数据,我们需要进行MIPI Raw到Raw的转换。本文对将会先介绍MIPI的数据格式,然后用C进行实现。 MIPI R…
-
语音开黑更爽快!知名聊天软件Discord将登陆PS5
据知名舅舅党Tom Henderson消息,索尼将会为PS5添加语音聊天软件Discord的完整版。Tom Henderson表示:“完整版Discord将被整合在PS5的7.0系…