
图像处理认证作者
-
什么是各向异性扩散?各向异性扩散优缺点
什么是各向异性扩散? 各向异性扩散(Anisotropic Diffusion)是一种先进的图像处理技术,主要用于图像平滑和边缘保持。各向异性扩散(也称为Perona-Malik扩…
-
什么是小波压缩?小波压缩的优缺点
什么是小波压缩? 小波压缩(Wavelet Compression)是一种图像压缩技术,它利用小波变换在保持图像质量的同时减小文件大小。与其他仅关注频率域或空间域变换的压缩技术不同…
-
什么是自适应阈值处理?图像处理中的自适应阈值处理
什么是自适应阈值处理? 自适应阈值处理(Adaptive Thresholding)是一种图像处理技术,它根据局部像素强度将灰度图像转换为二值图像。与使用单一全局阈值不同,自适应阈…
-
JPEG XL 的 PDF 复兴:在数字成像领域逆势而上
数字图像领域迎来一个令人意外的转折:PDF协会宣布计划将JPEG XL作为“首选解决方案”整合到PDF规范中,这无疑为谷歌几乎已经弃用的JPEG XL格式注入了新的活力。尽管谷歌已…
-
你的超高清值得吗?剑桥 – Meta 研究确立人类 “分辨率极限”
剑桥大学与 Meta现实实验室(Meta Reality Labs)的研究人员表示,人类眼睛的分辨能力存在一个可测量的 “分辨率极限”。 这意味着,一旦电视显示器的像素密度达到该极…
-
英特尔发布衡量游戏图像质量的 AI 工具,为客观量化现代渲染技术的图像质量开辟新途径
英特尔有可能使客观评估现代游戏的图像质量变得更容易。一种新的 AI 驱动的视频质量指标,名为计算机图形视觉质量指标(Computer Graphics Visual Quality…
-
告别图像布局:简化 Vulkan 同步
Vulkan® 中的同步一直是其最棘手的挑战之一,开发者们也一直不遗余力地提醒我们这一点。Khronos® Vulkan 工作组一直致力于让 Vulkan 更加易于使用,而简化同步…
-
Qt C++ 图像处理学习路线
公众号“QT历险记” 发布了 Qt C++ 图像处理学习路线,内容包含基础学习阶段、进阶学习阶段、项目实战阶段和职业规划与就业阶段等内容。 基础学习阶段 掌握 C++ 基础 :Qt…
-
通过简单的 JPEG 压缩实现图像的自我验证
在过去几年中,有关篡改图像所带来风险的担忧经常出现在研究中,尤其是在基于人工智能的图像编辑框架不断涌现的情况下,这些框架能够修改现有图像,而不是直接创建图像。 针对此类内容提出的检…
-
CVPRW 2025 | 高效图像超分辨率中的蒸馏监督下的卷积低秩适应
本项工作是上海交通大学图像所MediaLab和传音多媒体团队的合作成果,获得CVPR NTIRE 2025高效超分辨率挑战赛道的第一名。卷积神经网络(CNN)在高效图像超分辨率领域…
-
Google Store 如何利用 glTF 3D 模型改变产品教育
本文研究探讨了 Google 如何利用 glTF 改进产品教育、降低成本、简化工作流程,同时提升 3D 内容创作的水平。
-
JPEG AI 模糊了真实与合成之间的界限
今年 2 月,JPEG AI 国际标准发布,经过数年的研究,该标准旨在利用机器学习技术,在不降低感知质量的前提下,生成更小、更易于传输和存储的图像编解码器。 这一事件很少成为头条新…
-
Datoviz:基于 Vulkan 的超高速、高性能 GPU 科学可视化库
Datoviz 是一个跨平台、开源的高性能 GPU 科学数据可视化库,专为大规模数据集的交互式探索而设计。它采用 C/C++ 编写,基于 Khronos Vulkan® 图形 AP…
-
使用 OpenCV 和 Tesseract-OCR 在 Google Colab 中构建 OCR 应用程序的编码指南
光学字符识别 (OCR) 是一种强大的技术,可将文本图像转换为机器可读的内容。随着数据提取自动化的需求日益增长,OCR 工具已成为许多应用程序的重要组成部分,从数字化文档到从扫描图…
-
DFSQ:用于超分辨率网络的分布灵活的子集量化方法 | 厦门大学纪荣嵘团队
研究意义 图像超分辨率(SR)技术旨在从低分辨率图像中恢复高分辨率图像,广泛应用于医学影像、视频增强和卫星图像处理等领域。然而,现有的SR模型通常依赖庞大的网络规模和计算资源,难以…
-
One-D-Piece:图像Tokenizer满足质量可控压缩
当前的图像标记化方法需要大量标记来捕获图像中包含的信息。尽管图像的信息量不同,但大多数图像分词器仅支持固定长度的分词化,导致分词分配效率低下。在本研究中,本文介绍了 One-D-P…
-
用基础扩散模型实现有损图像压缩 | ECCV 2024
将扩散模型纳入图像压缩领域,有可能产生逼真而详细的重建效果,尤其是在比特率极低的情况下。以往的方法主要是将扩散模型用作对条件信号中的量化误差具有鲁棒性的表达式解码器。然而,要以这种…
-
Meta AI 推出 CLUE:旨在解决传统图像安全系统缺陷的 AI 框架
数字平台的快速发展使图像安全问题成为关注焦点。从露骨的内容到暴力的描述,有害图像给内容审核带来了巨大挑战。人工智能生成内容(AIGC)的激增加剧了这些挑战,因为先进的图像生成模型可…
-
OpenGL 正在开发跨供应商网格着色
鉴于现代 Vulkan 应用程序接口的持续广泛采用,新的 OpenGL 扩展(尤其是令人兴奋的扩展)在近来非常罕见,但在 2025 年,我们将通过 GL_EXT_mesh_shad…
-
微软和清华大学推出Distilled Decoding:在自回归模型中加速图像生成而无质量损失的新方法
自回归 (AR) 模型改变了图像生成领域,为生成高质量视觉效果树立了新标杆。这些模型将图像创建过程分解为连续步骤,每个标记都基于先前的标记生成,从而创建具有出色真实感和连贯性的输出…