技术文章

WebRTC

如何在 WebRTC 应用中添加一个语音机器人

语音机器人，也被称为语音助手，是一种使用自然语言处理（NLP）和文本到语音（TTS）技术的机器人，通过语音命令与用户互动。语音机器人被设计为响应口语请求，以对话方式提供信息或执行任…

实时互动
2023年5月17日
技术文章

Instruct-NeRF2NeRF: 引导并编辑NeRF

本文提出了一种通过文本来编辑 NeRF 场景的方法。给定一个 NeRF 场景及用于重建它的多视角图像，本方法利用图像条件扩散模型InstructPix2Pix对输入图像进行迭代编辑…

图像处理
2023年5月17日
WebRTC

如何为 WebRTC 应用程序提供出色的体验

在WebRTC.ventures，我们相信，如果一个技术上健全的WebRTC应用不能提供积极的用户体验，那么它是不够的。我们把伟大的体验放在首位，认识到即使是最先进的应用，如果不能…

实时互动
2023年5月17日
技术文章

SRS单机模式搭建，基于阿里云ECS服务器

SRS 是一个简单、高效的实时视频服务器，支持RTMP/WebRTC/HLS/HTTP-FLV/SRT/MPEG-DASH/GB28181、Linux/Windows/MacOS、…

RTC观主
2023年5月17日
技术文章

COTS实用媒体处理平台构建案例 | SMPTE Motion Imaging Journal 2023

为了在商用非专用硬件上使用来自不同供应商的元素构成可扩展的基于软件的广播系统，并避免在设施和云中的锁定，需要采用混合多云方法。作为一个案例研究，本文构建了一个可扩展的边缘平台，用于…

大厂Animal
2023年5月17日
技术文章

Jetson Nano 是学习 AI 边缘计算的神器

笔者从 2019 年开始使用 NVIDIA Jetson Nano 开发套件，一开始是被 NVIDIA 当时推出的 Jetbot 智能小车所吸引，这套 2,00…

假装是大佬
2023年5月17日
实时音视频

必须要掌握的音视频编码、解码基础！

音视频为什么要编码？音视频编码技术在音视频领域有着举足轻重的地位，这是由于音视频原始数据量较大，在传输的过程中如果不进行编码的话，则无法进行传输。比方说，一张普通的图片的大小大概…

编解码
2023年5月17日
技术文章

视频编码测试平台CodecWar

在视频编码的研究和开发中，我们经常需要对编码器的性能进行比较，一般的做法是构建一个数据集，然后将两个编码器在同一个配置上（LD,RA,AI等）使用不同参数（CQP下一般为4个QP值…

编解码
2023年5月17日
技术文章

通过 OTT 进行高度可扩展和冗余的直播

ZEE 重新开始了国际 T20 联赛的体育直播，在 Zee5，这是我们第一次向终端用户提供体育直播的工作。为了确保我们在每个比赛日都能获得正确的数据流，这是一个艰难的旅程——从接…

RTC观主
2023年5月16日
技术文章

Meta为实时渲染参数化3D手部模型提出神经重照明框架

近年来，神经渲染方法显著提高了人脸渲染真实感。相关方法使用深度神经网络对人类皮肤上的光传输进行建模，通过重建真实图像直接再现物理效应，如亚表面散射。然而，尽管神经重照明取得了成功，…

大厂Animal
2023年5月16日
技术文章

当 MQTT 遇上 ChatGPT：探索可自然交互的物联网智能应用

随着物联网技术的迅猛发展，人与设备、设备与设备之间的互动已变得不再困难，而如何更加自然、高效、智能地实现交互则成为物联网领域新的挑战。近期，由 OpenAI 发布的 ChatGP…

RTE基础设施
2023年5月16日
技术文章

5G 高低频协同上行增强技术研究

摘要：时频双聚合技术用于 SA 网络架构，在载波聚合技术基础上，通过较低频的 2.1 GHz FDD 载波来辅助较高频段的 3.5 GHz TDD 载波来实现上行覆盖增强，同时下行…

RTE基础设施
2023年5月16日
技术文章

OpenGL Shader 编程基础-绘制基础图形

我们可以通过顶点着色器来绘制点线面图形，并组合成其他各种形状，但是一般 2D 场景中，顶点着色器一般都不改，并且它一般决定的是整个画布的大小。所以这里探讨的是通过片元着色器来绘制…

字节流动
2023年5月16日
技术文章

智能感知编码优化与落地实践

基于人眼视觉特性出发的感知编码优化技术，成为互联网短视频、OTT 等 UGC 场景的重点优化手段，可以在降低视频码率的同时，提升视频的观看体验。今天主要有 4 个方面的内容。首先…

大厂Animal
2023年5月15日
技术文章

5G网络分流比提升方法研究

摘要：分析了5G网络分流比的影响，从5G终端功能打开统计分析、5G网络覆盖情况分析、4G/5G网络无法共址建设原因以及4G/5G互操作参数设置情况分析了5G分流比低的原因，提出了提…

RTE基础设施
2023年5月15日
技术文章

杜比 Ac-4 与 MPEG-H：下一代音频编解码器

下一代音频 (NGA) 的两个领先实现是杜比 AC-4 和 MPEG-H。尽管它们都基于 ITU 的一套核心建议，但它们有不同的起源、优势和局限性。杜比 AC-4 与 MPEG-…

音频技术
2023年5月15日
技术文章

如何以实时精度完善 5G 场内体验

随着 5G 服务提供商宣布改变人们在体育场馆和音乐厅参加活动时的体验的头条新闻承诺，这些努力面临的尚未解决的挑战被忽视了。简而言之，仅靠 5G 无法可靠地提供具有完美同步的直播和屏…

RTE基础设施
2023年5月15日
WebRTC

WebRTC RTCP协议 PLI、FIR 请求关键帧

本篇文章主要介绍rtcp的反馈包，在音视频通话过程中反馈包是接收端用来通知发送端的消息。 RTCP 反馈包反馈包详情见：rfc4585 反馈包协议格式：协议字段介绍 versi…

webrtc学习和实践
2023年5月15日
WebRTC

WebRTC Android 视频硬件编码

本文将重点介绍在 Android 平台上，WebRTC 是如何使用 MediaCodec 对视频数据进行编码，以及在整个编码过程中 webrtc native 与 java 的流程…

webrtc学习和实践
2023年5月15日
技术文章

B站公布新专利，可在车载场景下语音发布弹幕

5 月 14 日消息，上海哔哩哔哩科技有限公司申请的“弹幕处理方法及装置”专利公布，实现了在车载场景的情况下使用语音发布弹幕。 IT之家附专利摘要：本申请提供弹幕处理方法及装置，…

厂商动态
2023年5月15日