如何制作一个注册网站90设计首页官网详情页
- 作者: 五速梦信息网
- 时间: 2026年03月21日 09:50
当前位置: 首页 > news >正文
如何制作一个注册网站,90设计首页官网详情页,wordpress插件汉化包,做外贸生意的网站这是 ECCV 2024 的一篇文章#xff0c;文章作者想建立一个统一的 ISP 模型#xff0c;以实现在不同手机之间的自由切换。文章作者是香港中文大学的 xue tianfan 和 Gu jinwei 老师。
Abstract
现代端到端图像信号处理器#xff08;ISPs#xff09;能够学习从 RAW/XYZ 数据…这是 ECCV 2024 的一篇文章文章作者想建立一个统一的 ISP 模型以实现在不同手机之间的自由切换。文章作者是香港中文大学的 xue tianfan 和 Gu jinwei 老师。
Abstract
现代端到端图像信号处理器ISPs能够学习从 RAW/XYZ 数据到 sRGB或其逆过程的复杂映射为图像处理带来了新的可能性。然而随着相机型号的多样性不断增加长期开发和维护单个 ISP 是难以持续的因为其本身缺乏通用性阻碍了对多种相机型号的适应性。这篇文章提出了一种新颖的流程 —— 统一图像信号处理器Uni - ISP它统一了对多个相机的 ISP 学习为多种相机型号提供了准确且通用的处理器。Uni - ISP 的核心是通过学习正向 / 逆向 ISP 及其特殊的训练方案来利用设备感知嵌入。通过这种方式Uni - ISP 不仅提高了正向 / 逆向 ISP 的性能还开启了现有学习型 ISP 无法实现的多种新应用。此外由于没有由多个相机同步拍摄用于训练的数据集文章还构建了一个真实世界的 4K 数据集 ——FiveCam它包含由五部智能手机同步拍摄的 2400 多对 sRGB - RAW 图像。文章进行了大量实验证明了 Uni - ISP 在正向 / 逆向 ISP 中的准确性峰值信噪比分别提高了 1.5dB/2.4dB、其在实现新应用方面的通用性以及对新相机型号的适应性。
Introduction
图像信号处理器ISP将相机传感器捕获的原始图像数据转换为诸如 sRGB 等可查看的格式在决定照片的视觉质量方面起着关键作用。通过精心设计它们的 ISP各个相机品牌塑造出了符合不同用户偏好的独特摄影风格。例如苹果Apple智能手机相机以其清晰且独具特色的 “苹果感” 而广受赞誉而徕卡Leica相机则因其光晕效果和浓郁的色调备受推崇形成了标志性的徕卡风格。
近期神经网络已被用于逼近整个图像信号处理器ISP或特定模块即学习型 ISP这带来了两大主要益处。
1性能提升。神经网络强大的表征能力使学习型 ISP 能够执行具有挑战性的任务例如对高光和阴影区域中的细节内容进行脑补。2新功能。学习型 ISP 引入了新功能例如逆向 ISP它能将 sRGB 图像转换回 RAW/XYZ 空间为原始域增强和进一步处理如去模糊、去噪、高动态范围HDR摄影等提供了更大的灵活性和潜力。这些创新拓展了学习型 ISP 的应用范围和潜力。
然而目前的方法仍然是针对单个相机型号设计和训练 ISP这可能会限制不同 ISP 之间的协同效益。此外通用模型在低层级视觉、高层级视觉和多模态等多个领域都展现出了优势。随着相机型号数量的增加单个学习型 ISP 可能也缺乏广泛应用所需的通用性和适应性从长远来看可能难以为继。
在本文中我们旨在对来自不同相机的图像信号处理器ISP进行统一学习这有两个直接的优势。
1通过利用来自多个相机的 ISP 之间的协同效应来提升视觉质量。统一学习使 ISP 能够理解不同数据中的潜在共性和差异从而使视觉表现得到整体提升。2统一学习提供了新颖的应用超越了现有学习型 ISP 仅限于正向和逆向 ISP 的能力。这种统一学习实现了诸如跨不同相机型号的影像风格之间的转换、插值和外推等新用途。此外它还支持基于 ISP 行为自洽性的零样本图像取证包括图像级别的源相机识别和像素级别的图像拼接检测。
不过为多台相机学习一个具有设备感知能力的图像信号处理器ISP模型绝非易事面临着诸多挑战。首先我们发现在现有模型中简单地混合来自多台相机的训练数据并不能带来令人满意的性能。因此我们提出了 Uni - ISP这是一种用于多台相机的新型统一 ISP 模型它包含若干可优化的设备感知嵌入用于学习不同相机的 ISP。这些设备感知嵌入使模型能够捕捉针对单个设备量身定制的特定特性而共享的主干网络则能捕捉潜在的共性。
其次目前的 ISP 数据集并不包含由多台相机拍摄的同步 sRGB - Raw 图像对。尽管这类数据对于学习单个 ISP 并非必需但对于学习支持不同相机型号协同增效并能开发新应用的统一 ISP 至关重要。为解决这一问题我们用五部智能手机搭建了一个同步相机阵列并构建了一个新的数据集 ——FiveCam该数据集包含 2464 对同步的、空间分辨率为 4K 的高质量 sRGB - Raw 配对图像。所采集的数据集涵盖了从风景到特写等广泛的场景并且包含不同的光照条件包括白天和夜晚的室内外环境。
第三鉴于不同相机拍摄的同步照片对中不可避免地存在错位需要一种稳健的对齐和训练方案。为了应对这一挑战我们首先使用基于光流的方法对图像进行粗略对齐这会在变形图像中引入频率偏差。然后我们设计了一种频率偏差校正FBC损失来减轻纹理模糊。此外我们引入了自相机 / 跨相机训练方案以促进在相同 / 不同相机型号上的应用。
通过这三项设计统一图像信号处理器Uni - ISP可应用于广泛的图像任务例如跨不同相机型号的摄影外观转换、插值和外推。用户可以将一种相机型号的视觉特性应用到另一种相机上实现独特的美学效果。还可以利用这些 ISP 行为的自洽性来促进零样本图像取证任务包括源相机识别和图像拼接检测。大量实验表明Uni - ISP 优于现有技术在逆向 ISP 中峰值信噪比PSNR约高 1.5dB在正向 ISP 中约高 2.4dB。
图1 我们提出了 Uni-ISP 模型该模型可同时统一多个相机的逆 ISP图像信号处理行为和正 ISP 行为的学习。 通过利用不同相机 ISP 之间的共享特性与之前仅针对单个相机分别学习的 ISP 方法相比我们的方法在逆 ISP 和正 ISPA方面能够实现更高的性能。同时Uni-ISP 的设备感知特性使得一个已学习的 ISP 模型能够应用于新的跨相机 ISP 场景包括摄影外观迁移B 和 C、内插 / 外推D以及零样本图像取证E 和 F。
Method
Overview
首先介绍正向和逆向 ISP 任务中的 XYZ 图像格式。XYZ 图像是与设备无关的辐射度量学习 XYZ 图像与学习原始图像有相同的好处。因此我们选择将相机拍摄的原始图像处理得到的 XYZ 图像作为原始模态。具体而言XYZ 图像是通过对真实原始图像 RAW 应用 ISP 的固定流程得到的这个阶段使用拍摄时的白平衡、固定的线性去马赛克算法以及当前设备的 camera-to-XYZ 矩阵且不应用伽马色调映射。在这种设置下XYZ 图像与原始图像呈线性相关它们可以相互转换且无损失。
图 2 展示了统一图像信号处理器Uni - ISP的整体流程它包含逆向 ISP 模块 g g g 和正向 ISP 模块 h h h。我们的模型旨在学习 ISP 任务时能够识别各种摄像设备。假设我们这里讨论的图像尺寸均为 H × W H \times W H×W通道数为 C C C。给定由相机 a 生成的 sRGB 图像 I a ∈ R H × W × C I{a} \in \mathbb{R}^{H \times W \times C} Ia∈RH×W×C ε a ∈ R D \varepsilon{a} \in \mathbb{R}^{D} εa∈RD 表示针对相机 a 的尺寸为 D 的设备感知嵌入逆向 ISP 模块 g g g 通过学习在给定输入 I a I{a} Ia 的情况下输出相机 a 对应的 XYZ 图像 L ^ a \hat{L}{a} L^a。 L ^ a g ( I a , ε a ) (1) \hat{L}{a} g(I{a}, \varepsilon{a}) \tag{1} L^ag(Ia,εa)(1)
前向 ISP 模块 h h h 学习从给定的实际 XYZ 图像 L a L{a} La 中预测 I ^ a \hat{I}{a} I^a I ^ a g ( L a , ε a ) (2) \hat{I}{a} g(L{a}, \varepsilon{a}) \tag{2} I^ag(La,εa)(2)
模块 g ( ⋅ ) g(\cdot) g(⋅) 和 h ( ⋅ ) h(\cdot) h(⋅) 学习图像信号处理器ISP在不同设备间的通用属性而设备感知嵌入 ε a \varepsilon{a} εa 则侧重于相机 a 特定的自有属性。上述公式使我们能够通过将 g , h g, h g,h 与设备感知嵌入 $ {\varepsilon{a}, \varepsilon{b}, \varepsilon{c}, …, \varepsilon{z} }$ 一起训练来同时学习多台相机 { a , b , c , … , z } {a, b, c, …, z} {a,b,c,…,z} 的 ISP 行为。
Model Design 图 2 Uni-ISP 的模型设计。Uni-ISP 包含两个模块即逆 ISP 模块 g 和正 ISP 模块 h。这两个模块具有相同的结构。为了视觉上的简洁我们将逆 ISP 模块 g 绘制成缩略图其内部结构与正 ISP 模块 h 相同。设备感知嵌入是可优化的参数在训练或推理过程中它们将通过 DEIM动态嵌入交互机制被选择与瓶颈特征进行交互。
如图 2 所示统一图像信号处理器Uni - ISP使用了逆向 ISP 模块 g g g 和正向 ISP 模块 h h h每个模块都具有编码器-解码器架构。两个模块都包含局部特征提取块LFEBs用于细致的局部处理以及全局特征操作块GFMBs用于大范围的图像调整这反映了真实相机 ISP 的双重处理机制即同时处理诸如曝光补偿和色彩校正等全局操作以及色调映射和高光恢复等局部任务。
Local Feature Extraction Blocks 统一图像信号处理器Uni - ISP中的每个编码器和解码器阶段都包含四个局部特征提取块LFEBs。编码器阶段的 LFEBs 包含最大池化层解码器阶段的 LFEBs 包含上采样层。每个 LFEB 包含多个卷积层、激活层、半实例归一化层以及空间 / 通道注意力层。残差连接将编码器和解码器阶段的 LFEBs 连接起来。
Global Feature Manipulation Blocks 全局 ISP 操作受到曝光时间和 ISO 等参数的显著影响这些参数会改变照片的整体外观。我们设计的全局特征操作块GFMBs旨在结合这些参数来修改来自编码器局部特征提取块LFEBs的残差特征。然后这些经过操作的特征会被传递到解码器阶段相应的 LFEBs。使用过的相机参数曝光、ISO 和光圈值是从相机生成的 JPEG 图像的 EXIF 元数据中提取出来的。
Device-aware Embedding Interaction Module 设备感知嵌入交互模块DEIM位于编码器和解码器阶段之间通过与设备感知嵌入进行交互增强了模型适应不同摄像设备的能力。给定一个设备感知嵌入 ε a \varepsilon{a} εaDEIM 对来自编码器阶段的瓶颈特征 B 应用基于注意力的变换并输出 F a Fa Fa。这种设置使模型能够自适应地同时学习多台相机的 ISP 行为。
Training Scheme
文章为统一图像信号处理器Uni - ISP精心设计了一种特殊的训练方案该方案包含两种训练目标即自相机图像信号处理器ISP目标和跨相机 ISP 目标。
Self-Camera Training Objective
在自相机训练目标中我们的统一图像信号处理器Uni - ISP同时学习多台相机的逆向和正向图像信号处理器ISP行为。 L I n v ∥ L a − L ^ a ∥ 1 (3) \mathcal{L}{Inv} \left | L{a} - \hat{L}{a} \right |{1} \tag{3} LInv La−L^a 1(3) L F o r ∥ I a − I ^ a ∥ 1 (4) \mathcal{L}{For} \left | I{a} - \hat{I}{a} \right |_{1} \tag{4} LFor Ia−I^a 1(4)
Cross-Camera Training Objective
跨相机训练目标中的目标照片是由与拍摄输入照片不同的相机拍摄的。具体而言这种训练目标应用于正向图像信号处理器ISP模块 h h h 以处理相机模型转换。假设 I a I_a Ia 是由相机 a 拍摄的 I b I_b Ib 是由相机 b 拍摄的统一图像信号处理器Uni - ISP的逆向 ISP 模块 g g g 将 I a I_a Ia 作为输入并预测 XYZ 图像 L ^ a \hat{L}_a L^a这与公式 (1) 中描述的过程相同。然后正向 ISP 模块 h 将预测的 L ^ a \hat{L}_a L^a 转换为相机 b 的 sRGB 图像 I ^ b \hat{I}b I^b I ^ b h ( ε b , L ^ a ) (5) \hat{I}{b} h(\varepsilon_{b}, \hat{L}a) \tag{5} I^bh(εb,L^a)(5)
其中 ε b \varepsilon{b} εb 表示相机 b 的设备感知嵌入。
上面的loss 优化有一个问题因为输入图像 I a Ia Ia 和输出真实值 I b I{b} Ib 无法对齐因为它们是用不同的相机拍摄的。这使得像 L1 loss 这样的像素级损失无法驱动最小化 I ^ b \hat{I}b I^b 和 I b I{b} Ib 之间距离的跨相机训练目标。因此文章首先使用基于光流的方法 RAFT 来对用于跨相机训练目标的数据集进行 warp。所有由相机拍摄 b 的 sRGB 图像 I b I{b} Ib 都将被变形为 I b w I{b}^{w} Ibw使其与由相机 a 拍摄的 sRGB 图像 I a I{a} Ia 对齐。我们对数据集中每一个可能的 camera-to-camera 的 sRGB 图像对都应用这种 warp 操作。在训练过程中任何无法对齐的区域都将被标注为遮挡区域并进行掩模处理。 图 3 使用光流法包裹的数据集内频率偏差示意图。与原始图像相比包裹过程中的插值会使图像看起来模糊消除了其高频成分。
然而尽管基于光流的变形方法有效地对齐了这些图像但它也在我们的数据集中引入了频率偏差。如图 3 所示与变形前的图像相比变形后的图像往往缺少高频细节。如果我们直接使用对齐后的图像来训练我们的模型它将意外地在跨相机 ISP 任务中对图像进行平滑处理。为解决这个问题我们针对跨相机训练目标提出了频率偏差校正FBC损失。公式6展示了该任务的过程。FBC 损失可写为 L F B C ∥ f l o w ( I ^ b ) − f l o w ( I b w ) ∥ L f r e q ( I ^ b , I b ) (6) \mathcal{L}{FBC} \left | f_{low}(\hat{I}b) - f{low}({I}{b}^{w}) \right | \mathcal{L}{freq}(\hat{I}{b}, I{b}) \tag{6} LFBC flow(I^b)−flow(Ibw) Lfreq(I^b,Ib)(6)
其中 f l o w f{low} flow 表示一个低通滤波器文章用了一个高斯模糊核实现 L f r e q \mathcal{L}{freq} Lfreq 表示频域的 loss。
Overall Loss
整体的 loss 形式为 L L I n v L F o r L F B C λ L N R R (7) \mathcal{L} \mathcal{L}{Inv} \mathcal{L}{For} \mathcal{L}{FBC} \lambda \mathcal{L}{NRR} \tag{7} LLInvLForLFBCλLNRR(7)
其中 L N R R \mathcal{L}{NRR} LNRR 是附加的中性渲染正则化项 λ \lambda λ 是它的平衡权重。当中性渲染正则化在设备感知嵌入被给定为零向量时引导模型学习一个在 XYZ 和 sRGB 色彩空间之间执行标准色彩转换的虚拟相机。 L N R R ∥ s ( I a ) − g ( I a , 0 ) ∥ 1 ∥ s − 1 ( L a ) − h ( L a , 0 ) ∥ 1 (8) \mathcal{L}{NRR} \left | s(I_a) - g(I_a, \mathbf{0}) \right |_1 \left | s^{-1}(L_a) - h(L_a, \mathbf{0}) \right |_1 \tag{8} LNRR∥s(Ia)−g(Ia,0)∥1 s−1(La)−h(La,0) 1(8) s ( ⋅ ) , s − 1 ( ⋅ ) s(\cdot), s^{-1}(\cdot) s(⋅),s−1(⋅) 分别表示 sRGB-XYZ 和 XYZ-sRGB 之间的色彩空间转换。如果用户想要增强或减弱某台相机的摄影风格而不与另一台相机的设备感知嵌入进行内插或外推操作中性渲染正则化会为用户提供一个锚点。
Novel Dataset
尽管现有的 sRGB - RAW 数据集允许对逆向和正向 ISP 任务进行模型训练但仍然需要包含由多个设备同步拍摄的 sRGB - RAW 对的数据集。这类数据集对于训练能够有效处理跨相机 ISP 任务的模型至关重要而跨相机 ISP 任务对于诸如摄影外观转换和内插 / 外推等应用来说是至关重要的。
为应对这一挑战我们收集了一个名为 FiveCam 的新数据集其特点是包含来自五种不同相机型号同步拍摄的 sRGB - RAW 对。该数据集包含 2464 张高分辨率4K的原始图像和 JPEG 图像代表了大约 500 个不同的场景。FiveCam 数据集中使用的相机包括苹果 iPhone 14 Pro Max、谷歌 Pixel 6 Pro、华为 P40、三星 Galaxy S20 和小米 Mi 12。所有相机都通过编程的蓝牙快门进行同步以确保所有设备的拍摄时间一致。
图 4 展示了与其所使用的拍摄设备一同呈现的三个场景。我们的 FiveCam 数据集场景丰富多样在多种光照条件下从白昼到夜间环境包括室外和室内光照拍摄了自然景观和城市环境。
此外我们还创建了这个数据集的 sRGB - XYZ 版本其中所有相机的原始图像都使用拍摄时的白平衡、线性去马赛克算法进行处理并转换为标准的相机 - 到 - XYZ 色彩空间。这个版本中的 XYZ 图像保持了线性这使得它们对于需要保持原始图像线性的下游任务特别有益。
图 4 我们新数据集中 3 个场景的预览左图以及我们的拍摄设备右图。每个场景都包含来自五款智能手机相机的同步 sRGB标准红绿蓝-Raw原始图像对苹果 iPhone 14 Pro Max、谷歌 Pixel 6 Pro、华为 P40、三星 Galaxy S20 以及小米 Mi 12。这里将原始图像可视化为 XYZ 图像并且可以无损地转换回原始格式。
- 上一篇: 如何制作一个网站包含多个网页做网站青岛
- 下一篇: 如何制作自己的网站和app江门网站建设套餐
相关文章
-
如何制作一个网站包含多个网页做网站青岛
如何制作一个网站包含多个网页做网站青岛
- 技术栈
- 2026年03月21日
-
如何制作一般企业网站c mvc 网站开发进阶之路
如何制作一般企业网站c mvc 网站开发进阶之路
- 技术栈
- 2026年03月21日
-
如何制作虚拟网站网站建站报价单
如何制作虚拟网站网站建站报价单
- 技术栈
- 2026年03月21日
-
如何制作自己的网站和app江门网站建设套餐
如何制作自己的网站和app江门网站建设套餐
- 技术栈
- 2026年03月21日
-
如何注册免费网站dede title 我的网站
如何注册免费网站dede title 我的网站
- 技术栈
- 2026年03月21日
-
如何注册申请chn网站比wordpress
如何注册申请chn网站比wordpress
- 技术栈
- 2026年03月21日






