按时间归档:2023年
-
Gartner 2023 年企业对话式 AI 平台魔力象限
本月,Gartner 公布了备受期待的 2023 年企业对话式 AI 平台魔力象限报告。 此次发布正值市场兴趣高涨之际。这在很大程度上源于 ChatGPT 的兴起,以及人们对大型语…
-
ZEGO实时合唱方案 助力社交平台用户留存和时长等指标环比提升20%
在社交平台刚刚把KTV搬到线上的2017年,能做到单人音轨与伴奏音乐的对齐已经殊为不易。直到目前,也仍有相当数量的社交平台仅提供「单人独唱,众人围观」的K歌体验。 01 让更多人乐…
-
ICASSP2023 通用会议理解及生成挑战(MUG)成功举办及获奖团队结果分析
近日,ICASSP2023 通用会议理解及生成挑战(MUG)完成了测试集评测及结果公布,并举办了线上完赛沙龙。本次挑战由ModelScope魔搭社区、阿里巴巴达摩院语音实验室、阿里…
-
快手StreamLake中标浙江广播电视集团多个百万级项目
近期,快手StreamLake中标浙江广播电视集团多个百万级项目。围绕省级重大文化传播平台项目,双方展开深度合作。 浙江广播电视集团一直在广电领域引领创新,其App产品覆盖了多样化…
-
8×8 联络中心获得 AI 升级
8×8 宣布对其联络中心平台进行一系列人工智能更新,这将带来更好的客户体验。 8×8 联络中心获得了 8×8 智能客户助理和 8×8 主管工作区,OpenAI 已集成到其 8×8“…
-
视频编码中的Closed GOP 和 Open GOP
在本文中,我们将了解Closed GOP 和 Open GOP 的概念。这两种 GOP 类型在视频流中都很常见,并且会影响您的压缩效率、流的错误恢复能力以及 ABR 流中的可切换性…
-
使用 Handbrake 的视频压缩:安装和使用指南
Handbrake 是一种开源视频转码器,被广泛认为是视频转换的最佳工具。它使用起来毫不费力,支持多平台,并且涵盖范围广泛的预设和设备。这意味着您会发现比以往任何时候都更容易快速压…
-
视频压缩中的离散余弦变换
离散余弦变换 (DCT)可以说是现代图像和视频压缩中最基本的工具。DCT 用于将像素域中的数据转换为频域,以揭示有关图像或视频帧的洞察力。 本文的目的是让您直观地了解 DCT,而无…
-
数字经济时代 在线社交娱乐行业迎来新的想象空间
连续6年被写入政府工作报告、两会期间再度被高频提及的热词“数字经济”,正成为拉动我国经济增长的新引擎,也成为全球经济竞争的新焦点。 于在线社交娱乐行业而言,随着移动互联网的…
-
首个!火山语音立项有声阅读标准,获CCSA工作组一致通过
日前,中国通信标准化协会(CCSA)互联网与应用标准技术工作委员会(TC1)互联网应用总体及人工智能工作组(WG1)第75次组会在京顺利召开。本次会议由TC1WC1工作组组长曹峰主…
-
填补国际标准空白!海尔智家牵头IEEE智能家居语音标准
理想的智慧生活少不了语音交互,对用户来说,好的语音交互应该是简单一句话,智能家居就能“心领神会”,正确执行。但实际用起来,听不懂老人的方言、距离太远听不清、指令不具体没法执行等…
-
腾讯音乐天琴实验室面向行业首次发布三套开源数据集,助力音视频技术的发展变革
3月13日,腾讯音乐天琴实验室联合清华大学人机语音交互实验室(THUHCSI)、音频语音与语言处理研究组(ASLP@NPU)、CCF计算艺术分会及北京市智慧广电(网络视听)重点实验…
-
万字详解生成式 AI 与 Web3
自 2022 年末 OpenAI 面向公众推出 ChatGPT 以来,人工智能(AI)的热度一直居高不下。圣诞老人来得很早,他给人类带来了一台能回答大多数问题的机器! ChatGP…
-
虚拟现实与元宇宙产业联盟《可信虚拟人生成内容管理系统技术要求》标准制定工作启动
中国信通院CAICT官微3月13日消息,近年来,作为元宇宙和AIGC的关键产业要素,虚拟人概念炙手可热,技术产业发展乘势而起,呈现强劲的增长态势。但是,快速发展的市场机遇下蕴含着一…
-
如何选择正确的高带宽内存(HBM)
尽管多年来一直在努力用更快、更便宜或更通用的存储器来取代DRAM,甚至将其嵌入到SoC中,但DRAM仍然是任何这些架构中的基本组件。DRAM制造商并没有一成不变,而是根据性能、功耗…
-
人工智能如何改变我们与技术互动的方式
ChatGPT在科技界一鸣惊人,截止到2023年1月底,仅在推出两个月后就获得了1亿用户,并带来了一种隐约可见的变革感。 这项技术本身很吸引人,但让ChatGPT特别有趣的部分原因…
-
基于纠缠的量子网络
来自荷兰QuTech的一组研究人员在《科学》杂志论文,报告了连接三个量子处理器的第一个多节点量子网络的实现。此外,他们还进行了关键量子网络协议的原理证明演示,这标志着未来量子互联网…
-
微软推出理解图像内容、解决视觉难题的AI模型
近日,微软的研究人员推出了komos -1,这是一种多模态模型,据报道,它可以分析图像内容,解决视觉难题,执行视觉文本识别,通过视觉智商测试,并理解自然语言指令。研究人员认为,多模…
-
I 帧、P 帧和 B 帧的工作原理及用途
I 帧、P 帧和 B 帧的概念是视频压缩领域的基础。这三种帧类型在特定情况下用于提高编解码器的压缩效率、压缩流的视频质量以及流对传输和存储错误和故障的恢复能力。 在本文中,我们将了…
-
VVC、EVC、LCEVC——MPEG的视频编解码器
VVC、EVC、LCEVC 是 MPEG 在 2020-2021 年发布的三种视频编解码器,分别称为通用视频编码 (H.266)、基本视频编码 (EVC MPEG-5 Part 1…