
图像处理认证作者
-
CMIC:使用具有冗余感知的状态空间模型压缩图像 | ICLR 2026
本文提出了一种动态的状态空间模型 Content-Aware Mamba(CAM),并基于它构建了图像压缩模型 CMIC。作者指出,标准 Mamba 在图像压缩中存在两个关键瓶颈:…
-
Camera实战案例分析-拍照图像较预览画面上移
第三方相机 App 打开相机进行拍照,发现保存下来的照片和预览画面比较,拍照照片有上移。本文针对这一现象的原因和解决方式进行分析。
-
Vulkan 游戏引擎新教程:构建你自己的可用于生产环境的渲染引擎
Khronos® 旗下的 Vulkan® 工作组发布了《构建简易游戏引擎》教程,这是一份面向开发者的全新深度教程,旨在帮助他们超越基础知识,迈向专业级引擎开发。该系列教程以《 Vu…
-
OpenCV 4.13 发布,更多 AVX-512 指令集的使用、CUDA 13 支持及其他功能
OpenCV 4.13 于新年夜发布,带来了最新的开源计算机视觉 (CV) 功能。OpenCV 4.13 为这款广泛使用的计算机视觉库带来了诸多增强功能。 OpenCV 4.13 …
-
通过去模糊范式实现联合去模糊和低光照增强 | 合肥工业大学汪萌团队
研究团队:赵随意,张召,韦炎炎,赵洋,汪萌:合肥工业大学樊继聪:香港中文大学颜水成:新加坡国立大学论文链接:https://www.sciengine.com/SCIS/doi/1…
-
什么是各向异性扩散?各向异性扩散优缺点
什么是各向异性扩散? 各向异性扩散(Anisotropic Diffusion)是一种先进的图像处理技术,主要用于图像平滑和边缘保持。各向异性扩散(也称为Perona-Malik扩…
-
什么是小波压缩?小波压缩的优缺点
什么是小波压缩? 小波压缩(Wavelet Compression)是一种图像压缩技术,它利用小波变换在保持图像质量的同时减小文件大小。与其他仅关注频率域或空间域变换的压缩技术不同…
-
什么是自适应阈值处理?图像处理中的自适应阈值处理
什么是自适应阈值处理? 自适应阈值处理(Adaptive Thresholding)是一种图像处理技术,它根据局部像素强度将灰度图像转换为二值图像。与使用单一全局阈值不同,自适应阈…
-
JPEG XL 的 PDF 复兴:在数字成像领域逆势而上
数字图像领域迎来一个令人意外的转折:PDF协会宣布计划将JPEG XL作为“首选解决方案”整合到PDF规范中,这无疑为谷歌几乎已经弃用的JPEG XL格式注入了新的活力。尽管谷歌已…
-
你的超高清值得吗?剑桥 – Meta 研究确立人类 “分辨率极限”
剑桥大学与 Meta现实实验室(Meta Reality Labs)的研究人员表示,人类眼睛的分辨能力存在一个可测量的 “分辨率极限”。 这意味着,一旦电视显示器的像素密度达到该极…
-
英特尔发布衡量游戏图像质量的 AI 工具,为客观量化现代渲染技术的图像质量开辟新途径
英特尔有可能使客观评估现代游戏的图像质量变得更容易。一种新的 AI 驱动的视频质量指标,名为计算机图形视觉质量指标(Computer Graphics Visual Quality…
-
告别图像布局:简化 Vulkan 同步
Vulkan® 中的同步一直是其最棘手的挑战之一,开发者们也一直不遗余力地提醒我们这一点。Khronos® Vulkan 工作组一直致力于让 Vulkan 更加易于使用,而简化同步…
-
Qt C++ 图像处理学习路线
公众号“QT历险记” 发布了 Qt C++ 图像处理学习路线,内容包含基础学习阶段、进阶学习阶段、项目实战阶段和职业规划与就业阶段等内容。 基础学习阶段 掌握 C++ 基础 :Qt…
-
通过简单的 JPEG 压缩实现图像的自我验证
在过去几年中,有关篡改图像所带来风险的担忧经常出现在研究中,尤其是在基于人工智能的图像编辑框架不断涌现的情况下,这些框架能够修改现有图像,而不是直接创建图像。 针对此类内容提出的检…
-
CVPRW 2025 | 高效图像超分辨率中的蒸馏监督下的卷积低秩适应
本项工作是上海交通大学图像所MediaLab和传音多媒体团队的合作成果,获得CVPR NTIRE 2025高效超分辨率挑战赛道的第一名。卷积神经网络(CNN)在高效图像超分辨率领域…
-
Google Store 如何利用 glTF 3D 模型改变产品教育
本文研究探讨了 Google 如何利用 glTF 改进产品教育、降低成本、简化工作流程,同时提升 3D 内容创作的水平。
-
JPEG AI 模糊了真实与合成之间的界限
今年 2 月,JPEG AI 国际标准发布,经过数年的研究,该标准旨在利用机器学习技术,在不降低感知质量的前提下,生成更小、更易于传输和存储的图像编解码器。 这一事件很少成为头条新…
-
Datoviz:基于 Vulkan 的超高速、高性能 GPU 科学可视化库
Datoviz 是一个跨平台、开源的高性能 GPU 科学数据可视化库,专为大规模数据集的交互式探索而设计。它采用 C/C++ 编写,基于 Khronos Vulkan® 图形 AP…
-
使用 OpenCV 和 Tesseract-OCR 在 Google Colab 中构建 OCR 应用程序的编码指南
光学字符识别 (OCR) 是一种强大的技术,可将文本图像转换为机器可读的内容。随着数据提取自动化的需求日益增长,OCR 工具已成为许多应用程序的重要组成部分,从数字化文档到从扫描图…
-
DFSQ:用于超分辨率网络的分布灵活的子集量化方法 | 厦门大学纪荣嵘团队
研究意义 图像超分辨率(SR)技术旨在从低分辨率图像中恢复高分辨率图像,广泛应用于医学影像、视频增强和卫星图像处理等领域。然而,现有的SR模型通常依赖庞大的网络规模和计算资源,难以…