

图像处理认证作者
-
MVDream:利用扩散模型实现多视角的3D生成
本文提出了MVDream,能够根据给定的文本提示生成几何上一致的多视图图像。通过利用在大规模网络数据集上预训练的图像扩散模型以及从3D资源渲染的多视图数据集,得到的多视图扩散模型既…
-
PICS:超低比特率下的图像压缩 | ICML’23 NCW
最近的文本到图像生成模型的进步提供了从简短的文本描述中生成高质量图像的能力。这些基础模型在大规模数据集上预先训练,适用于几乎没有或不需要进一步训练的各种后续任务。自然的问题是,这些…
-
OTAvartar:具有可控三平面渲染交互的单样本说话脸化身 | CVPR 2023
本文提出了一种名为 OTAvatar 的方法,用于构建具有可控性、泛化性和高效性的人脸化身。OTAvatar 使用一种泛化可控的三平面渲染方案,从单个参考肖像构建个性化化身。它首先…
-
草图指导的文生图扩散模型
强大的文生图预训练模型缺乏可以指导合成图像的空间属性的控制方法。在这项工作引入了一种通用方法,通过在推理期间使用来自另一个域(例如草图)的空间图来指导预训练的文本到图像扩散模型。 …
-
基于多视图消息认证的鲁棒多智能体协作 | 南大袁雷、俞扬等
研究意义 多智能体强化学习近年来在多个领域取得快速发展及诸多傲人的成果,智能体通过与环境进行交互逐步优化,最终得到最优的策略。其中,多智能体协作凭借其在真实应用场景中的常见应用最近…
-
2D 特征跟踪 – 第 1 部分:检测
交通图像上检测到的关键点 你是否曾经想过手机是如何在视频中跟踪你的脸部随着你移动的呢?或者自动驾驶汽车如何保持对道路上其他车辆的跟踪?所有这些惊人的成就都是通过2D特征跟踪实现的,…
-
利用潜空间屏蔽技术提升机器的神经图像压缩能力 | TCSVT 2022
这篇文章主要介绍了一种基于深度学习网络的图像压缩框架,该框架并不把提升人类视觉质量作为最终目标,而是面向进行计算机视觉任务的机器并进行进行端到端的训练,最终得到了优于标准VVC的图…
-
用于屏幕内容图像连续超分辨率的隐式 Transformer 网络 | NeurIPS 2021
如今,屏幕内容图像呈现爆炸性增长。然而,针对自然图像设计的图像 SR (Super-Resolution,超分辨率)方法对于 SCIs(screen content images,…
-
通过语义对应实现时间一致的自动视频上色 | CVPR 2023
视频着色任务最近引起了广泛的关注。近期的方法主要致力于相邻帧或间隔较小的帧的时间一致性。然而,它仍然面临着大间隔帧间不一致的严峻挑战。为了解决这个问题,本文提出了一种新颖的视频上色…
-
一种频域深度学习:提高网络准确性并减少输入数据大小、降低带宽压力 | CVPR 2020
在实际计算机视觉应用中,由于图像通常很大,它们必须被降采样到神经网络的预定输入尺寸。传统的空间降采样方法会导致网络准确性下降,本文提出通过在频域学习并选择适当的频率分量,可以提高网…
-
HDR是什么意思?HDR的主要标准有哪些
HDR ( High-Dynamic Range ) 高动态范围技术是一种在图像处理和显示领域中常用的技术,旨在提供更广泛的亮度范围和更丰富的色彩细节,通过在图像中捕捉和显示更多的…
-
nerf2nerf: 神经辐射场的成对配准
本文提出了新的3D配准方法:NeRF 的成对配准技术。核心方法是引入”surface field”(表面场)。然后利用 nerf2nerf registra…
-
PanoDiff:从窄视场图片生成全景图 | ACM MM 2023
简介:该工作由上海交通大学宋利教授带领的Medialab实验室产出,并于近期被ACM MM 2023所接收。360度全景图在计算机图形学及视觉领域应用广泛,相比于手机等移动设备即能…
-
IDeudemon:基于神经辐射场和生成性先验的人脸图像身份隐私保护 | ICCV 2023
该工作由上海交通大学宋利教授带领的Medialab实验室与悉尼科技大学合作产出,并于近期被ICCV 2023所接收。该工作实现了对人脸图像的身份隐私保护,旨在隐藏面部的真实身份,同…
-
基于图像分割及修复的数据生成
随着硬件及技术的发展,深度学习技术得到广泛的研究及应用,而数据作为驱动深度学习发展的重要输入,变得越来越重要。但是针对一些特殊场景,存在数据少、隐私风险等问题。针对上述问题,结合任…
-
医学图像的诊断无损压缩 | ICML 2023
医学图像(例如 X 射线)通常以高分辨率和大尺寸采集,以便捕捉更清晰的细节。本文工作实现了医学图像的压缩,同时保留了诊断所需的细粒度特征,这种特性被称为诊断无损。为此,使用超过一百…
-
ICE-Pick: 用于DNN的高效迭代剪枝 | ICML 2023
剪枝是深度神经网络 (DNN) 的主要压缩方法之一,从 DNN 模型中删除不太相关的参数以减少其内存占用。为了获得更好的最终精度,通常迭代地执行剪枝,在每一步中删除越来越多的参数,…
-
使用 zoom 预览出图和系统相机出图预览,画质不一样的问题分析
1、问题背景 最近在基于 Android 的平台调试一款摄像头,客户有反馈一个问题,系统自带的 Camera2 app 预览出图是正常的,但用 Zoom app 打开摄像头,出图画…
-
onvif 中 imaging setting 图像画质总结!
前言: 大家好,今天给大家来分享一篇关于图像质量的内容,这个内容是我在做onvif中的imaging setting的时候,关注到里面有关于: brightness(亮度) col…
-
YOLOv4:使用 Darknet 和 OpenCV 进行对象检测的综合指南
对象检测是计算机视觉中的一项基本任务,涉及识别和定位图像或视频中的对象。多年来,已经开发了多种对象检测算法,每种算法都有自己的优点和局限性。YOLOv4(You Only Look…