图像处理
-
嵌入基础模型的高斯溅射
简介:准确感知现实世界中的三维物体的几何和语义属性对于增强现实和机器人应用的持续发展至关重要。为此,本方法提出了嵌入基础模型的高斯溅射(Foundation Model Embed…
-
通过贝叶斯隐式表征来压缩数据 | NeurIPS 2023 Spotlight
论文摘要 在数字世界里,很多常见的数据类型都可以看作是一种特殊的连续函数形式,表征为隐式表征。例如,图像可以表征为将每个像素位置映射到对应RGB色值的连续函数。从这个角度出发,我们…
-
通过高斯-拉普拉斯-逻辑混合模型和串联残差模块学习的图像压缩 | TIP 2023
最近,基于深度学习的图像压缩方法取得了显着的成就,并在 PSNR 和 MS-SSIM 指标方面逐渐优于包括最新标准通用视频编码 (VVC) 在内的传统方法。学习图像压缩的两个关键组…
-
用大语言模型合成正确的路由配置需要什么?
本文研究了大型语言模型(例如 GPT-4)是否能够在减少人工工作量的情况下合成正确的路由器配置。作者团队发现单独的 GPT-4 表现非常糟糕,它可以生成有一定可行性的粗略配置,但在…
-
CacheGen:语言模型应用程序的快速上下文加载
随着大型语言模型(LLM)开始承担越来越复杂的任务,它们的输入包含更长的上下文来解决需要领域知识或特定于用户的对话历史的问题。然而,使用长上下文对响应式LLM系统提出了挑战,因为在…
-
AdaNIC:通过动态变换路由实现实用的神经图像压缩 | ICCV 2023
近年来,基于神经网络的图像压缩(NIC)得到了积极的发展,与传统方法相比,其表现出了令人印象深刻的性能。然而,由于NIC基于学习的特性,产生的浮点运算(FLOP)数量比传统算法高出…
-
基于生成表征的自条件图像生成
本文提出了一种表征条件图像生成方法(Representation-Conditioned image Generation, RCG)。无需任何人类标注提示,它以自监督的表征分布为…
-
基于指令提升的语言模型泛化能力增强方法
研究意义 大语言模型如ChatGPT具有强大的跨任务泛化能力,可以不在目标任务数据上进行训练仅仅依靠输入的文本指令就可以完成各种各样的任务。实现该能力的关键技术就是指令微调。以往指…
-
神经网络图像压缩:泛化、鲁棒性和谱偏 | NeurIPS 2023
目前,神经图像压缩(NIC)在分布内(in-distribution, IND)数据的 RD 性能和运行开销表现出了卓越的性能。然而,研究神经图像压缩方法在分布外(out-of-d…
-
C3: 图像与视频通用的高性能低复杂度神经压缩器
内容摘要:C3 方法基于 COOL-CHIC,并对图像进行了几项简单而有效的改进。作者进一步开发了将 C3 应用于视频的新方法。在 CLIC2020 图像基准上,我们的 RD 性能…
-
OpenCV分享:从新手到专家,计算机视觉工程师的成长指南
(映维网Nweon 2023年12月27日)在上一篇博文中,我们分享了OpenCV对何谓计算机视觉的介绍,包括它的朴素起源,这一迷人技术背后的机制,计算机视觉的任务,以及领先品牌如…
-
在没有自回归模型的情况下实现高效图像压缩 | NeurIPS 2023
本文主要讨论了基于深度学习的图像压缩编码方法(Learned Image Compression, LIC),通过在损失函数中引入相关性损失(correlation loss),强…
-
COOL-CHIC: 基于坐标的低复杂度分层图像编码器 | ICCV 2023
内容摘要:本文介绍了一种基于坐标的低复杂度分层图像编码器 (COOL-CHIC) ,它是一种能够替代自编码器的方法,每个解码像素仅对应 629 个参数和 680 次乘法。COOL-…
-
Tailored Visions:利用个性化提示重写增强文本到图像生成
创建与个人用户的愿望和偏好紧密结合的个性化视觉表示仍然具有挑战性。这个过程需要用户用可以被模型理解的语言表达他们的想法,这给许多用户带来了困难。在本文中,作者通过利用用户与系统的历…
-
基于GAN网络的图像数据生成技术浅析
Labs 导读:图像数据的生成一直是计算机视觉领域一个具有挑战性的任务。传统的图像数据生成方法通常是基于数学模型生成图像,难以生成逼真的真实图像。随着深度神经网络和大规模数据集的出…
-
Stable Video Diffusion: 将潜在视频扩散模型扩展到大型数据集
本文主要讨论了在生成视频模型中数据选择的重要性以及数据筛选对模型性能的影响。文章指出,虽然在视频建模方面的研究主要集中在空间和时间层的排列上,但对于数据选择的影响却鲜有研究,文章通…
-
ICCV 2023 | 基于不规则群解耦的语义结构图像压缩
图像压缩技术通常侧重于压缩图像以供人类消费,这导致为下游应用传输冗余内容。为了解决这一问题,一些先前的工作提出对比特流进行语义结构划分,通过选择性的传输和重构可以满足特定的应用需求…
-
PASD:像素感知的稳定扩散超分辨率和个性化风格网络
本文提出了一种提出了一种像素感知的稳定扩散( PASD )网络,以实现鲁棒的真实图像超分和个性化的风格化。引入像素感知的交叉注意力模块,使扩散模型能够在像素级别感知图像局部结构,而…
-
GPU架构与渲染性能优化
Labs 导读:在开发图形渲染应用时,渲染性能优化是一个绕不开的主题,开发者往往遵循一些优化准则来构建自己的应用程序,包括数据合并、模型减面、减少采样次数、减少不必要渲染等。本文结…
-
面向文本生成图像的可验证和可复制的人工评估 | CVPR2023
人类评估对于验证文本到图像生成模型的性能至关重要,因为这种高度认知的过程需要对文本和图像有深刻的理解。然而,作者对最近37篇论文的调查显示,许多工作完全依赖于自动测量(例如,FID…