按时间归档:2023年
-
Android音频播放接口AudioTrack详解【Android音视频开发】
Android 中常用的播放音频的接口有MediaPlayer、AudioTrack和SoundPool,音频的渲染最常用的是AudioTrack和OpenSL ES ,…
-
CTC联结时间分类的实现原理和推导公式
CTC应用背景 在语音识别和文字识别的领域,我们的数据集是音频文件和文本,但是,音频文件和文本很难在单位上对齐,比如有人说话快,有人说话慢,有的字符间距离不同,因此这种序列标签的对…
-
音频编码基础和原理
1. 前言 数字音频是把模拟的、连续的声音信号通过采样、量化和编码过程转变成数字信号,然后再进行记录、传输及其他加工处理。重放时再将这些记录的数字音频信号还原为模拟信号,…
-
中国信通院第二批“办公即时通信软件安全”测评开启报名
当前,在线移动办公已成为党政军企的常态化办公模式,以即时通讯作为移动办公入口的趋势越发明显,并且正在从单一的社交工具向平台化方向发展。随着数字化转型的全面提速,场景复杂、边界模糊等…
-
如何识别图像边缘?
图像识别(image recognition)是现在的热门技术。 文字识别、车牌识别、人脸识别都是它的应用。但是,这些都算初级应用,现在的技术已经发展到了这样一种地步:计算机可以识…
-
ECDN优化视频和其他一对多的跨企业数据网络的交付
早在我离开网络工程领域并成为一名分析师时(大约 1999 年),我的第一个任务是撰写有关 IP 多播主题的技术简介。当时,IP 组播作为一种优化跨企业数据网络的流视频传输的手段而兴…
-
ChatGPT 会用于联络中心吗?
生成式人工智能会取代联络中心座席吗?还没有,但它可能对协助代理人有价值。 OpenAI 于 2022 年 11 月宣布ChatGPT 的免费研究预览版以征求用户反馈,这在科技界掀起…
-
呼叫中心、人工智能、安全成为 “Best of EC”最佳入围项目的亮点
久负盛名的 Best of Enterprise Connect 奖项的决赛入围者已经公布,虽然我们不能透露太多关于他们的信息,但很明显,创新在联络中心、人工智能和安全等领域蓬勃发…
-
探索海外 DNS 服务市场
各种规模的公司越来越依赖互联网进行日常运营。保护他们的网站并确保其性能至关重要。为实现这一目标,企业可以求助于全球 DNS 服务市场及其提供各种服务和功能的提供商。从免费 DNS …
-
Rocket.Chat 为数百万人扩展开源实时消息系统
在本文中,演讲者基于 Rocket.Chat 这一开源的实时消息系统,介绍了其研发团队在解决用户数量增加而带来的应用服务扩展时的对策和具体做法。讲者对系统的两次扩展后服务架构的具体…
-
一文讲透伽马校正丨音视频基础
1、伽马校正 在视频的图像处理中,我们可能在很多地方都听说过伽马校正这个概念,它到底是干什么的呢?这里我们来探讨一下这个概念。 如果大家接触过更早的电视机或电脑显示器,应该知道一种…
-
Android-Native 开发之利用 AAudio 播放音频
谈到在Android C/C++层实现音频播放/录制功能的时候,大家可能首先会想到的是利用opensles去做,这确实是一直不错的实现方式,久经考验,并且适配比较广。 但如果你的项…
-
H.266环路滤波之LMCS亮度映射和色度缩放
1.背景介绍 在H.266里新增了一个Luma Mapping with Chroma Scaling, LMCS工具,对编码前的视频图像进行预处理。正如它的名字一样,它…
-
规模年均增长超50% 智算为人工智能夯实“算力底座”
从人脸识别、智能语音播报,到自动驾驶、工业数字孪生,看得见的智慧应用背后,是看不见的智能算力在支撑。 根据相关统计和测算,目前全国超过30个城市在建或筹建智算中心,未来5年我国智能…
-
图像采集:机器视觉图像采集优化方法
机器视觉在不同的复杂技术领域有着广泛应用。在简单的应用中(例如,利用背光检测不透明物体的轮廓),成像系统可在宽松的系统参数条件下可靠地运行。但在要求较高的应用中(比如检测镜面的表面…
-
如何将量子图像处理可视化?
随着人脸识别和自动驾驶汽车等应用的发展,图像处理的需求日益增长。由于数据量大且复杂,图像处理的计算成本很高。GPU 等专用硬件越来越多地用于加速图像处理。量子计算有望加快许多图像处…
-
什么是虚拟主播?虚拟主播是怎么实现的
近些年得益于信息及芯片技术的飞速发展,各种IT新技术层出不穷,物联网, 大数据, 人工智能… 。在众多新技术中,由于应用广泛,未来充满无限可能,‘人工智能’一直热度非凡…
-
WebRTC模块处理机制的实现
1. 前言 WebRTC是一个由Google发起的实时通讯解决方案,其中包含视频音频采集,编解码,数据传输,音视频展示等功能,我们可以通过技术快速地构建出一个音视频通讯应…
-
HEVC编码系统和结构浅析
为了满足海量视频数据的传输和存储要求,在H.264/AVC视频编码标准获得巨大成功后,新一代高效视频编码(High Efficiency Video Coding. HEVC)国际…
-
基于柔性压电声学的多功能可穿戴贴片,可集成传感、定位及水下通信功能
流体动力与机电系统国家重点实验室谢金教授团队联合英国诺森比亚大学傅永庆教授开发了一种基于柔性压电声学的具有传感、通信和定位功能的无线平台。在高频(~13 MHz)刺激下,可激发兰姆…