第1章 绪 论
1.1 多光谱图像技术简介
光谱是一种电磁辐射 ,大自然中的彩虹和极光现象都是人们早期观察到的光谱。肉眼可以观测到的电磁辐射只有很少部分 ,称作可见光 ,如白光经棱镜或光栅色散后呈现的红、橙、黄、绿、青、蓝、紫,它们的波长在 380~780nm。此外还有大量不能直接观察到的电磁辐射 ,如 X射线、紫外线、红外线、微波等 ,它们波长的分布范围远远大于可见光波长 ,如图 1.1所示。
图1.1 各个波长范围内的光谱以及可见光光谱线
在一定条件下 ,用波长毸表示相邻波段相同相位之间的距离 ,用频率 f表示单位时间的波段数 ,用波段数毲表示单位长度的波长数 ,则它们之间的关系为
式中,c为光在真空中的传播速率 ,c=2.99792 *10^8m/s。设每个光量子的特征能量为毰,则可以用普朗克公式表示为式中 ,
式中 ,h为普朗克常量 ,h=6.626*10^-34J·s。表.1列出了常见光谱的波长范围以供参考 ,其中 ,1m=10^3mm=10^6mm=10^9nm=10^12pm。
多光谱图像是指使用几种不同的光谱带获取的图像 ,可以反映成像物体在不同光谱波段上的光学特性。多光谱图像技术起源于信息科学、模式识别和信号处理的相关理论和模型。在自动化、计算机视觉、目标探测等领域 ,多光谱图像技术相比于传统的图像处理技术具有巨大的优势。近年来 ,多光谱图像技术在不同的应用领域发展迅速 [1]。
多光谱图像的成像原理就是利用多个光谱通道对物体成像 ,相比一般的 RGB彩色图像的三个光谱通道 ,多光谱图像成像一般有几十至上百个光谱通道 ,在颜色工程科学领域 ,多光谱图像的成像技术是通过外界图像采集设备在 380~780nm的可见光范围内采集物体多个光谱通道的信息。一个光谱成像系统核心包括三个部分 :光源、滤光片、CCD相机。对于光源 ,要求在可见光区保持连续 ,滤光片用于构成多个光谱通道 ,CCD相机用于图像的采集和输入 [2]。
在多光谱成像的研究中 ,利用的光谱都是可见光。在可见光波长范围内 ,利用多通道成像技术实现对物体的不同光谱信息采集。在实验室中 ,实现多通道采集的方法有两种 :栙使用滤光片 ;栚使用成像光谱仪。*常用的方法就是使用滤光片 ,滤光片是由塑料或玻璃片再加入特种染料做成的 ,一种颜色的滤光片只能让该种颜色的光通过 ,各滤光片的透射率峰值被设定为互相间隔相等 ,单色相机通过依次使用不同的滤光片进行图像拍摄 ,获得同一景物的多幅单色图像 ,然后合并输出为相机色空间的多通道图像。成像光谱仪是一种传感器 ,这种传感器可以获取窄波段上连续光谱 ,使每个像元的光谱具有连续性 ,这样多光谱图像中的每一个像素都具有连续光谱。成像光谱仪首先对物体进行横向扫描 ,得到每一个波段的图像空间信息 ,然后对图像进行纵向扫描得到每一个像素的连续光谱曲线,这样综合两种扫描就可以得到既含有图像空间维信息又含有波段维信息的三维多光谱图像数据 [3]。下面以滤光片的方式阐述其成像原理 ,图 1.2是一个多光谱成像的典型装置。
图1.2 多光谱图像成像装置
在多光谱成像装置中 ,常用的光源一般��� D50光源和 A光源两种 ,假设 CCD=B
相机的波段数为 s,滤光片的个数为 k,则获取的多光谱图像的波段数 B为:
,若要计算多光谱图像每个波段图像的输出 pb,通过下面公式可以得到 :
为 CCD相机第 s个波段的为第 k个滤光片的光谱
后的成像结果
式中 ,1为可见光*短波长 ;2为可见光*长波长 ;
光谱灵敏度 ;为光谱反射比 ;
透射比。这样通过改变 CCD相机的波段和滤光片的个数 ,就可以得到不同通道
的多光谱图像。在实际的多光谱图像采集过程中 ,对滤光片的选择会直接影响*
20世纪 80年代 ,多光谱技术兴起。近年来 ,国内外对多光谱技术的研究不断增多。总体来说 ,对多光谱图像的研究主要集中在国外。从90年代开始 ,多光谱图像技术在北美洲、欧洲、大洋洲等地区得到迅猛发展。对于多光谱图像的研究不仅要分析各个光谱波段的丰富信息 ,重要的是研究各个光谱波段之间的连续性和相关性 ,这也是未来对多光谱图像研究的一个趋势。
Rn为光源的相对能量;
英国东安格利亚大学理学院计算机科学研究所开发了多光谱遥感数据库 , 2004年,Finlayson、Hordley和 Morovic等利用 10nm波长间隔对 400~700nm的光谱采样得到 31个波段的多光谱图像 ,这也是本书使用的多光谱图像数据库。反观国内 ,从事这方面的研究才刚刚起步 ,中国科学院遥感应用研究所张兵、高连如等在多光谱、高光谱遥感领域进行了研究 ,北京理工大学信息科学技术学院颜色科学与工程**专业实验室的杨萍等设计并实现了一种八通道多光谱成像系统用来进行多光谱成像和颜色复制的研究 [2]。
1.2 多光谱图像技术存在的问题分析
多光谱图像包含观测物体的丰富信息 ,但是对每个像元提取精细光谱 ,会导致多光谱图像具有海量的数据量 ,并且随着光谱数的增加 ,谱分辨率增加 ,谱间相关性增强 ,图像的分类精度降低 ,一些传统的全色图像处理算法难以满足多光谱图像处理的要求 (见图 1.3),因此对多光谱图像的降维非常重要。降维可以解决以下几点问题。
图1.3 多光谱图像技术存在的四个主要问题
1.数据量大
在多光谱成像中 ,多通道成像系统需要采集和存储比 RGB系统更多的数据。例如 ,以130个连续光谱的多光谱图像为例 ,空间尺寸为480 *320 ,若每个数据存储长度为 8bit,那么得到的多光谱图像尺寸有 152Mbit,如果使用 RGB图像存储 ,相同尺寸的图像大小只有 3.5Mbit,可见 ,光谱图像所带来的一个直接问题是 ,需要存储和处理海量数据 ,这样导致计算机的运行和处理效率降低 ,所以对光谱数据进行特征提取以达到压缩数据的目的是非常必要的。
2.Hughes现象
Hughes现象是指在多光谱分析过程中 ,随着参与运算波段数目的增加 ,分类精度先增后降的现象。对于多光谱图像 ,光谱数增加导致维数的大幅度增加 ,在目标分类过程中导致用于参数估计所需的训练样本数目也急剧增加。如果训练样本的数目不满足特征空间维数增加的要求 ,那么估计出的参数精度就难以保证。例如 ,某些图像中特征较小的物体信息 ,由于占整个图像面积较小 ,不能提供足够数量的训练样本点 ,因此往往不能得到满意的分类结果。在这种情况下 ,虽然光谱波段数目的增加隐含了更多的分类信息 ,但由于参数估计值不够** ,分类的结果与理想情况相差很大 ,这时就会产生 Hughes现象 [4]。
研究表明 ,分类结果取决于四个因素 :类别可分性、训练样本数目、特征空间维数以及分类器的类型 [5]。为了达到较好的分类结果 ,可以选择合适的分类器 ,也可以在一定范围内增加用于分类的特征并选取足够数量的训练样本 ,使得训练样本的数目相对于特征的维数有更大的比率。对于类别可分性 ,可以采用一定的方法使得这种可分性得到改善 [4]。
本书研究的多光谱图像降维技术 ,就是通过改变特征空间维数的方法来改善多光谱图像的分类精度。
3.数据冗余
多光谱图像数据冗余可以分为空间数据冗余和谱间数据冗余两种。空间数据冗余来自于图像本身的平滑性 ;谱间数据冗余来自于分辨率提高导致的频谱交叠 [5]。
图1.4 RGB图像的 3个波段灰度图像
图1.5 31个波段多光谱图像的前 5个波段灰度图像多光谱图像数据来自东安格利亚大计算机科学研究所
图像的谱分辨率越高 ,频谱交叠越厉害 ,谱间数据冗余就越大。数据冗余是多光谱图像技术中不可忽略的问题。由图 1.4和图 1.5可以看出 ,31个波段图像的5个波段图像之间的冗余信息比 3个波段图像各个波段之间的冗余信息更大 ,也就是说 ,图1.4中的 3幅图像的可分性更好 ,而图 1.5的5幅图像的可分性很差,即随着谱分辨率的增大 ,谱间冗余信息增大 ,谱间可分性减小 ,而降维则可以
有效地减小数据冗余量,提取图像的有效特征,提高分类精度。
4.数据难以描述
多光谱图像数据可以理解为一个巨大的三维矩阵,假设图像的大小为x *y,图像的波段数为z,则多光谱图像的数据形式为一个x *y *z的三维矩阵,当波段数z很大时,这个数据将变得非常庞大。多光谱图像数据的难以描述性在于如何描述各个光谱之间的相关性。由于向量代数的局限性,多光谱图像的各个光谱之间存在相关性和连续性,如果单独利用各个波段来描述,则会损失掉多光谱图像的大量信息。这些传统算法在处理多光谱图像时不能很好地利用多光谱图像中不同图层间的关联性,而基于非传统向量代数的算法则可以很好地解决这一问题[6]。Cliford代数是一种典型的非传统向量代数,本书就是基于 Cliford代数对多光谱图像进行降维,从而解决多光谱图像数据难以描述的问题。
通过多维多重矢量构成 Cliford片积,然后在对所有的 Cliford片积做 Clifford并运算得到整个多光谱图像的表示。多光谱图像的难以描述性就在于如何描述各个波段之间的相关性,例如,若 31维多光谱图像利用 Cliford代数的完备正交基表示,则需要n维子空间的n阶片积的 Cliford并来描述,其中n曑31,描述难度随着多光谱图像的波段维数的增加而增加,所以必须通过降维来简化多光谱图像的描述。
总之,在多光谱图像技术中,首先要解决的问题就是有效特征的提取和数据的压缩,而通过降维可把冗余的信息压缩到更少的波段上面,解决维数灾难 (见图1.6)。
图1.6 维数灾难
1.3 多光谱图像处理技术研究现状
多光谱图像是指利用传感器在多个窄光谱波段上对同一对象(地域或目标)进行观测所获得的图像,它反映了观测对象在各个窄光谱波段上的反射、透射或辐射特性。多光谱图像可以包括可见光、红外线、紫外线、毫米波、X射线等光谱