【机器学习】Harvard:Statistics of Real-World Hyperspectral Images

Posted by ShawnD on November 29, 2022

Abstract

高光谱图像通过在可见光谱中一些波长的窄带中包含每个像素 irradiance measurements,比典型的RGB图像提供更高的光谱分辨率。

额外的光谱分辨率可能对许多视觉任务有用,包括分割、识别和 relighting。

寻求捕获和利用高光谱数据的视觉系统应该受益于自然高光谱图像的统计模型,但目前对其结构知之甚少。

使用新收集的50张室内和室外场景的高光谱图像,作者导出了用于表示高光谱图像小块的优化的“空间光谱基础”,并探索了该基数的统计模型。

Hyperspectral Image Database

为了对现实世界高光谱场景的联合时空光谱统计进行实证分析,作者使用商用高光谱相机 (Nuance FX, CRI Inc.) 收集了50张户外和室内日光照明图像的数据集。该相机使用集成的液晶可调滤波器,并且能够通过一系列31个波长窄带顺序调谐滤波器来获取高光谱图像,每个波长窄带具有约10纳米带宽,并在420nm到720nm的10nm步长。图1(左)显示了相机对每个波长带的相对灵敏度,既考虑了12位灰度传感器的量子效率,也考虑了有效滤波器的每波段传输率。相机配备了 apo-chromatic lens,在所有情况下,都使用了最小的可行光圈设置。apo-chromatic lens 和 mechanical filter wheel 的组合使得能够获得基本上没有色差和错位的图像。为了避免因每波段噪音水平不同而污染统计数据,没有改变跨波段的曝光时间,也没有根据灵敏度对捕获的频段进行规范化。因此,以下部分中的所有结果都必须相对于相机灵敏度功能进行解释。然而,附录包括对敏感性归一化后计算的统计数据的讨论。

由于使用小孔径和单个波段的低传输率,整个图像(即所有波长带)的总采集时间很高,从15秒到 1 分钟不等。因此,所有图像都是使用三脚架拍摄的,并确保场景中的移动最小。为了拥有多样化的数据集,作者在一些地区捕获了带有运动的图像——但这些区域(和其他受灰尘等影响的区域)在分析前被手动屏蔽。因此,捕获场景中有人的任何区域都被屏蔽了,该分析不包括人类肤色样本。

捕获的数据集包括室内和室外场景的图像,这些场景具有多种物体、材料和比例(如图1一些样本被渲染为 sRGB)。作者认为该数据库是现实世界图像的代表性样本,捕获了像素级的材料统计数据以及纹理和阴影效果引起的空间相互作用。除了这里的分析外,这些图像可能有助于设计和评估获取和视觉任务的方法。作者还拍摄了另外25张在人工和混合照明下拍摄的图像,虽然这些图像没有用于这篇文章中介绍的分析,但它们与50张自然照明图像一起对社区可用。