主成分分析(PCA)是一种常用的无监督学习方法,这一方法利用正交变换把由现行相关变量表示的观测数据转化为少数几个由线性无关变量表示的数据,线性无关的变量称为主成分。主成分的个数通常小于原始变量的个数,所以主成分分析属于姜维方法。主成分分析主要用于发现数据中的基本结构,即数据中变量之间的关系,是数据分析的有力工具,也用于其他机器学习方法的前处理。
统计分析比中,数据的变量之间可能存在相关性,以致增加了分析的难度。于是,考虑由少数几个不相关的变量来代替相关的变量,用来表示数据,并且要求能够保留数据中的不部分信息。
主成分分析中,首先对给定数据进行规范化,使得数据每一变量的平均值为0,方差为1,。之后对数据进行正交变换,用来由线性相关表示的数据,通过正交变换变成若干个线性无关的新变量表示的数据。新变量是可能的正交变换中变量的方差和(信息保存)最大的,方差表示在新变量上信息的大小。将新变量一次成为第一主成分,第二主成分等。通过主成分分析,可以利用主成分近似地表示原始数据,这可理解为发现数据的“基本结构”;也可以把数据由少数主成分表示,这可理解为对数据降维。
方差最大的解释。假设有两个变量 ,三个样本点A,B,C。样本分布在由 轴组成的坐标系中,对坐标系进行旋转变换,得到新的坐标轴 ,表示新的变量 。坐标值的平方和 表示样本在变量 上的方差和。主成分分析旨在选取正交变换中方差最大的变量,作为第一主成分,也是是旋转变换中坐标值的平方和最大的轴。注意到旋转变换中变换中样本点到原点距离的平方和 不变,根据勾股定理,坐标值的平方和最大 等价于样本点到 轴的距离平方和 最小。所以,等价地,主成分分析在旋转变换中选取离样本点的距离的平方和最小的轴,作为第一主成分。第二主成分等的选取,在保证与已有坐标轴正交的条件下,类似地进行
假设 是m维随机变量,其均值是
,
协方差矩阵是
考虑到m维随机变量 到m维随机变量 的线性变换
其中
由随机变量的性质可知
总体主成分的定义 给定式(1)所示的线性变换,如果他们满足下列条件
设 是m维随机变量, 是 的协方差矩阵, 的特征值分别是 ,特征值对应的单位特征向量分别是 ,则 的第k主成分是
的第k主成分的方差是
即协方差矩阵 的第k个特征值
首先求 的第一主成分 ,即求系数向量 。第一主成分的 是在 的条件下, 的所有线性变换中使方差达到最大的
求第一主成分就是求解最优化问题
定义拉格朗日函数
其中 是拉格朗日乘子,将拉格朗日函数对 求导,并令其为0,得
因此 是 的特征值, 是对应的单位特征向量。于是目标函数
假设 是 的最大特征值 对应的单位特征向量,显然 与 是最优化问题的解,所以, 构成第一主成分,其方差等于协方差矩阵的最大特征值
接着求 的第二主成分 ,第二主成分的 是在 且 与 不相关条件下, 的所有线性变换中使达到最大
求第二主成分需参求解约束最优化问题
定义拉格朗日函数
其中 对应拉格朗日乘子。对 求偏导,并令其为0,得
将方程左则乘以 有
此式前两项为0,且 ,导出 ,因此式成为
由此, 是 的特征值, 是对应的特征向量,于是目标函数为
假设 是 的第二大特征值 的特征向量,显然 是以上最优化问题的解。于是 构成第二主成分,其方差等于协方差矩阵的第二大特征值,
按照上述方法可以求得第一、第二、直到第m个主成分,其系数向量 分别是 的第一、第二、直到m个单位特征向量, 分别是对应的特征值。并且,第k主成分的方差等于 的第k个特征值。
主成分分析的主要目的是降维,所以一般选择 个主成分(线性无观变量),使问题得以简化,并能保留原有变量的大部分信息。这里所说的信息是指原有信息的方差。
对任意正整数 ,考虑正交线性变换
其中 是q的维向量, 是qm维矩阵,令 的协方差矩阵为
则 的迹 在 时取最大值,其中矩阵 是由正交矩阵A的前q列组成。
这表明,当 的线性变换 在 时,其协方差矩阵 的迹 取得最大值。也就是说,当A取前 的前q个主成分时,能够最大限度地保留原有变量方差的信息。
以上作为选择k个主成分的理论依据。具体选择k的方法,通常利用方差贡献率。
第k主成分 的方差贡献率定义为 的方差与所有方差之和的比记作
k个主成分 的累计方差贡献率定义为k个方差之和和所有方差之和的比
通常取k使得累计方差贡献率达到规定的百分比以上,例如70%~80%。累计方差贡献率反映了主成分保留信息的比例,但它不能反映对某个原有变量 保留信息的比例,这时通常利用k个主成分 对原有变量 的贡献率。
k个主成分 对原有变量 的贡献率为 , 的相关系数的平方,记作
计算公式如下:
其中, 是随机变量 的方差,即协方差矩阵 的对角元素。
在实际问题中,不同变量可能有不同的量纲,直接求主成分有时会产生不合理的结果,为了消除这个影响,常常对各个随机变量实施规范化,使其均值为0,方差为1
设 为随机变量, 为第i个随机变量, ,令
其中, 分布是随机变量 的均值和方差,这时 就是 的规范化随机变量。
在实际问题中,需要在观测数据上进行主成分分析,这就是样本主成分分析。样本主成分也和总体主成分具体相同的性质。
使用样本主成分时,一般假设样本数据是规范化的,即对样本矩阵如下操作:
其中
样本协方差矩阵S是中体协方差矩阵 的无偏估计,样本相关矩阵R是总体相关矩阵的无偏估计,S的特征值和特征向量 的特征值和特征向量的无偏估计。
传统的主成分分析通过数据的协方差矩阵或相关矩阵的特征值分解进行,现在常用的方法是通过数据矩阵的奇异值分解进行。下面介绍数据的协方差矩阵或相关矩阵的分解方法
给定样本矩阵 ,利用数据的样本的协方差矩阵或样本相关矩阵的特征值分解进行主成分分析
给定样本矩阵 ,利用数据矩阵奇异值分解进行主成分分析,这里没有假设k个主成分
对于 维实矩阵A,假设其秩为r, ,则可将矩阵A进行截断奇异值分解
式 是 矩阵, 是k阶对角矩阵, 分别由取A的完全奇异分解的矩阵U,V的前k列, 由完全奇异分解的矩阵 的前k个对角元素得到
定义一个新的 矩阵
的每一列均值为0,
即 等于X的协方差矩阵
主成分分析归结于求协方差矩阵 的特征值和对应的单位特征向量。
假设 的截断奇异值分解为 ,那么V 的列向量就是 的单位向量,因此V的列向量就是X的主成分。于是X求X的主成分可以通过 的奇异值来实现
主成分分析也称主分量分析,旨在利用降维的思想,把多指标转化为少数几个综合指标。 在统计学中,主成分分析(principal components analysis,PCA)是一种简化数据集的技术。它是一个线性变换。这个变换把数据变换到一个新的坐标系统中,使得任何数据投影的第一大方差在第一个坐标(称为第一主成分)上,第二大方差在第二个坐标(第二主成分)上,依次类推。主成分分析经常用减少数据集的维数,同时保持数据集的对方差贡献最大的特征这是通过保留低阶主成分,忽略高阶主成分做到的。这样低阶成分往往能够保留住数据的最重要方面但是,这也不是一定的,要视具体应用而定
李翔宇 樊彦国
(中国石油大学地球资源与信息学院,山东东营,257061)
摘要:本文从所拥有的遥感数据源的可能情况出发,分别介绍了各种情况下利用遥感进行土地利用变化动态监测的方法,分析了其优势和劣势。
关键词:遥感;土地利用变化;动态监测;方法
1 引言
我国是一个人多地少的国家,土地是我们赖以生存的资源。建立土地动态监测系统以快速准确地提供各类土地资源面积及其分布、土地资源动态变化状况及土地资源生态环境信息是十分必要的,这样可以保证我国在科学翔实的资料基础上对土地资源进行科学的规划及合理的利用,实现土地资源的可持续健康发展。可是传统的统计或实地调查方式,耗时耗力,劳民伤财,并且难以适应土地利用的快速变化,而遥感可以提供及时准确且覆盖面广的地面影像资料,并且周期短、信息量大,通过后期的分析、处理、比较,可以使人们迅速准确地掌握土地利用变化的详细信息,即实现土地利用的动态监测。现在,遥感技术已成为进行土地利用变化动态监测的重要手段。
基于遥感影像的土地利用变化监测方法大致可分为两类:光谱直接比较法和分类结果比较法。多数变化提取算法属于前一种,主要包括影像差值法、比值法、主成分分析法和变化矢量分析法等,这些算法直接通过两时相数据的光谱差异确定变化发生的区域,但不能得出变化图斑的类型;后一种方法通过对各自时相的数据进行土地利用分类,通过对两个分类结果的比较提取变化信息,但其精度受两时相数据分类精度的制约。实际操作中可以根据所持有数据源的不同而采用相应的方法。
2 基于单一传感器的土地利用变化监测方法
21 基于单一传感器多时相遥感影像
当遥感数据源为单一传感器但可以获得多时相遥感影像时,可以考虑以下几种方法。
211 单变量图像差值法[1]
单变量图像差值法比较简单,是使用最广泛的一种探测方法。它是将两个时相的遥感图像按波段进行逐像元相减,从而生成一幅新的代表二时相间光谱变化的差值图像。辐射值的显著变化代表了土地覆盖变化,在差值图像中接近于零的像元就被看做是未变化的,而那些大于或小于零的像元表示其覆盖状况发生了某种变化,从而设定适当的阈值就可以把变化信息提取出来。
212 图像比值法[1,2]
比值处理被认为是辨识变化区域相对较快的手段。它是对于两个时相多谱段数据中同名像元的光谱灰度值施以除法运算。显然,经过辐射配准后,在图像中未发生变化的像元其比值应近似为1,而对于变化像元而言,比值将明显高于或低于1。比值法可以部分地消除阴影影响,突出某些地物间的反差,具有一定的图像增强作用。
213 图像回归法[1]
图像回归法是首先假定时相Ⅰ的像元值是另一时相Ⅱ像元值的一个线性函数,通过最小二乘法来进行回归,然后再用回归方程计算出的预测值来减去时相Ⅰ的原始像元值,从而获得两时相的回归残差图像。
214 植被指数差值法[2]
植被指数差值法是用近红外与红光波段间的比值(植被指数)代替原始波段作为输入数据进行差值运算来生成变化图像。由于植物普遍对红光强烈吸收和对近红外光强烈反射,因此红光和近红外波段之间的比值有利于提高光谱差异。
215 主成分分析法[3]
(1)差异主成分法 两时相的影像经纠正、配准之后,先对影像作相差取绝对值处理,从而得到一个差值影像。差值影像作主成分变换之后的第一分量应该集中了该影像的主要信息,即原两时相影像的主要差异信息。这个分量可以被认为是变化信息而被提取出来,从而生成变化模板,作为指导下一步变化类型确认和边界确定的参考信息。
(2)多波段主成分变换 由遥感理论可得知,地物属性发生变化,必将导致其在影像某几个波段上的值发生变化,所以只要找出两时相影像中对应波段上值的差别并确定这些差别的范围,便可发现土地利用变化信息。在具体试验中将两时相的影像各波段进行组合,成一个两倍于原影像波段数的新影像,对该影像作主成分变换。由于变换结果前几个分量上集中了两个影像的主要信息,而后几个分量则反映出了两影像的差别信息,因此可以抽取后几个分量进行波段组合来产生出变化信息。一般说来,在上述多波段主成分变换之后,采用0、1、2分量进行波段组合能较好地反映出新旧时相影像的变化部分。
(3)主成分差异法 本方法和差异主成分方法所不同之处在于影像作主成分变换与差值处理的顺序不一样。要求先对两时相的影像作主成分变换,然后对变换结果作差值,取差值的绝对值为处理结果。在实际的试验中,两时相影像作主成分变换后相差的第一分量已经涵盖了几乎所有的变化信息。因此,可以认为这一分量属于影像的变化信息。
216 变化向量分析法[1]
由于多时相遥感数据中任一像元矢量都可用多维测量空间中的一个点来表示(空间的维数等于原始波段数),通过对不同时相下的同名像元矢量进行相减所得到的变化矢量就可以用于描述该像元第一时相 t1 到第二时相 t2 期间在多维空间中所发生的位置变化。其中变化矢量的模代表了变化的强度,而方向则指示了发生变化的类型。设时相 t1、t2 图像的像元灰度矢量分别为 G=(g1,g2,…,gk)T 和H=(h1,h2,…,hk)T,则变化矢量为:ΔG=G -H。ΔG 包含了两幅图像中所有变化信息。变化强度由变化矢量的模||ΔG||决定,||ΔG||越大,表明图像的差异越大,变化发生的可能性越大。因此,提取变化和非变化像元,可根据变化强度||ΔG||的大小设定阈值来实现,即像元||ΔG||超过某一阈值时,即可判定为土地利用类型发生变化的像元;而变化的类型,可由ΔG的指向确定。
这种方法利用多频段信息,在提取变化位置的同时可以得到变化类型信息,是一种较理想的算法。当然,要用好变化向量分析法还取决于分析过程中变化/未变化阈值是否取值合理以及相关分类方法是否适当。
217 分类后比较法
分类后比较法是对两期遥感影像进行监督或非监督分类,然后比较在各图像系列同一位置上的分类结果,进而确定土地利用类型变化的位置和所属类型。该方法可直接获得变化类型信息,但如何选择合适的分类方法提高分类精度是准确获得变化信息类型的关键。
211至216均属于光谱直接比较法,此方法对变化比较敏感,可以避免分类过程所导致的误差,但需要进行严格的辐射标准化,排除大气状况、太阳高度角、土壤湿度、物候等“噪声”因素对图像光谱的影响,由于目前对各种干扰(尤其是物候)导致的辐射差异的校正方法仍不成熟,因此,只能通过选择同一传感器、同一季相的数据来尽可能减小“噪声”。同时光谱直接比较法只注重变化像元的提取,而不能提供变化中土地类型的转化信息(如地类属性)。与之相对照,分类后比较法对辐射纠正要求相对较低,适用于不同传感器、不同季相的数据的比较,同时该方法不仅可以提供变化信息,而且还能够给出各时期的土地利用类型信息。但这种方法的最终精度受到影像分类精度的限制,而且它对影像的全部范围都要进行分类计算而不管它们是否已经发生变化,这样无疑大大增加了变化信息检测的计算量。
在目前的土地利用遥感监测研究中,结合光谱直接比较法和分类后比较法的混合动态监测方法逐渐受到重视,并有了一些成功的案例研究。Jenson 通过对湿地变化的动态监测研究表明:先利用光谱直接比较探测变化区,再进行图像分类确定变化类型的混合法是一种非常有效的变化检测方法[4];Macleod和Congalton的研究也表明以差值法为基础的混合动态监测法优于传统分类后比较法[5]。这样可以集两者之所长,取得更好的监测效果。
22 基于单一传感器单时相遥感影像
无论是光谱直接比较法还是分类后比较法都是基于多个时相的遥感影像来进行土地利用变化监测。而当前期遥感影像无法或者难以获得的情况下,依靠后期的单时相遥感影像与前期的土地利用现状图也可以进行动态监测,这就是采用将土地利用现状图叠加在遥感图像上的方法来监测土地利用变化情况[6]。具体说来,是利用土地利用现状图中不变的明显地物标志(如线状地物交叉点)作为控制点对遥感图像进行配准,然后将土地现状图叠加再校正后的遥感图像上,检查各图斑是否吻合,若图斑的角点有偏移,则发生变化。可通过遥感图像辨识当前的土地利用类型,而土地利用现状图含有先期的土地利用类型信息,所以可以比较容易地辨识土地利用类型的变更情况,并可测算出变化图斑的面积。若其中有不能确定的图斑,可以辅以外业调查,以提高监测精度。
3 基于多源遥感的土地利用变化信息监测方法
不同传感器都具有各自的优势,获得的图像各有所长,如美国陆地卫星(Landsat)TM图像光谱信息丰富;法国SPOT卫星图像具有全色通道而空间分辨率高;SAR图像不受光照条件的影响而且几乎不受大气和云层的干涉,可用于探测地物的复介电常数和表面的粗糙度等等。利用不同传感器的多源遥感影像进行融合,可以使其优势互补,在此基础上的土地利用变化动态监测已成为国际遥感界研究的主题之一。以TM影像和SPOT影像为例,目前应用多光谱TM和全色SPOT数据融合的方法主要有LAB变换、HIS变换、线性复合与乘积运算、比值运算、BROVEY 变换、高通滤波变换(HPH)和主成分分析(PCA)等方法[7],经上述算法融合后的图像可以有效地同时保留SPOT高分辨率图像的精细纹理和TM多光谱图像的丰富色彩信息,从而有利于提高图像的空间分辨率和光谱分辨率,为发生变化的地类图斑的提取提供良好的数据源基础。
31 光谱特征变异法[8]
针对基于多源遥感的土地利用变化监测,变化信息的提取方法除了21所述方法之外还可以选择光谱特征变异法。
同一地物反映在SPOT影像上的信息是与其反映在TM影像上的光谱信息一一对应的。因此作TM和SPOT影像融合时,才能如实地显示出地物的正确光谱属性。但如果两者信息表现为不一致时,那么融合后影像的光谱就表现得与正常地物有所差别,此时就称地物发生了光谱特征变异(例如同一位置,前期在遥感影像上呈现为绿色的麦地,后期新修道路在影像上呈现较亮的灰度,那么叠加之后会呈现一条绿色的道路,与正常地物相异),这部分影像在整个的影像范围内是不正常和不协调的,这些地物可以通过影像判读的方法勾绘出来,这种变化信息提取的方法具有物理意义明显、简洁的特点。但是经过试验发现,发生光谱特征变异的地物在几何尺寸上要足够的大才能被人工目视发现。此外,该方法的效率还受到被监测区地物光谱特性的限制。
32 变化信息提取方法的选择
根据土地利用动态监测项目所获取的数据源,可将遥感数据组合分为下述几种类型,针对不同的类型要采取相应的方法以获取较好的效果。
321 具有两时相的 TM 和 SPOT 数据
这种情况是最好的。在该条件下,先对两时相的数据以某一纠正后的TM或SPOT影像(首先处理TM还是SPOT视数据的具体情况而定,原则是利于TM和SPOT数据的配准融合处理)为参考分别作纠正和配准处理,为保留并结合原始数据中纹理信息和光谱信息要融合相对应的TM和SPOT影像,在两时相融合影像的基础上采用主成分差异的方法来提取变化信息。另外还可以用新时相的 SPOT 影像与旧时相的 TM 影像进行融合生成光谱特征变异影像来指导发现变化的区域。
322 具有两时相的 TM 和一个时相的 SPOT 数据
在此数据源的基础上,首先仍对某一时相的TM或SPOT数据作纠正处理,然后将其他时相的TM和SPOT数据都统一以这个纠正后的TM (SPOT)为参考影像作影像到影像的纠正和配准。之后,选择光谱特征变异的方法来寻找大部分的变化信息,借助于两时相的TM影像确认变化;此外,利用主成分分析的办法对两时相的TM数据进行处理,得到变化信息模板,将模板叠置在判读影像上补充单一方法进行变化提取的遗漏。
323 具有两时相的 SPOT 和一个时相的 TM 数据
通常,前面的数据预处理纠正配准部分同322相同,然后对其中交错时相的TM和SPOT数据进行融合得到光谱特征变异影像,借助于两时相的SPOT数据发现影像中纹理信息的变化,从而辅助提取影像中的变化信息部分。除此之外,两时相的SPOT影像数据理论上说,可以直接作比较得到变化的部分,但是由于成像条件的不同,这样直接比较的方法会导致产生很多伪变化信息,干扰了真正变化部分的提取。因此,首先要对原始SPOT影像进行去噪及辐射校正等预处理,然后才能用来提取变化的信息。
324 具有单时相的 SPOT 影像和另一时相 TM 影像的数据
首先要对SPOT和TM数据进行纠正处理,然后利用纠正后的SPOT和另一时相TM影像融合得到光谱特征变异影像,并以此作为判读变化信息的主要参考数据。此外,单时相的SPOT数据可以作为新增波段加入到原始的 TM 数据中去进行主成分分析来提取变化的信息,辅助发现漏判的变化图斑。
利用遥感进行土地利用动态监测的方法非常多,这些方法各有自己的优势和劣势,实际工作中,要针对所拥有的数据源的情况,综合各方面要求来选择合适的方法,也可以综合几种方法取长补短以达到更好的监测效果。至于如何更有效地识别土地变化的类型以及如何提高分类的精度仍有很大的研究空间。
参考文献
[1]卢珏土地利用动态监测变化信息提取算法评估[J]湖北农学院学报,2002,22 (5):394~396
[2]张银辉,赵庚星试论土地利用遥感动态监测技术方法[J]国土资源管理,2001,18 (3):15~18
[3]杨贵军,武文波,陈步尚,夏春林土地利用动态遥感监测中变化信息的提取方法[J]东北测绘,2003,26 (1):18~21
[4]Jensen J R,Cowen D J,Narumalani S,et alAn evaluation of coast watch change detection protocol in South Carolina [J]Photogram metric Engineering and Remote Sensing,1993,59 (6):1039~1046
[5]Macleod R D,Congalton R GA quantitative comparison of change-detection algorithms for monitoring eelgrass from remotely sensed data [J]Photogram metric Engineering and Remote Sensing,1998,64 (3):207~216
[6]吴连喜,严泰来,张玮,薛天民,程昌秀土地利用现状图与遥感图像叠加进行土地利用变更监测[J]农业工程学报,2001,17 (6):156~160
[7]张炳智,张继闲,张丽土地利用动态遥感监测中变化信息提取方法的研究[J]测绘科学,2000,25 (3):46~50
用于紫坪铺镇的研究数据和数据预处理情况已在第四章中详细说明,以下重点介绍用于通济镇的研究数据。
( 一) 震前 IKONOS 数据
用于震害信息提取的高空间分辨率遥感影像为研究区汶川地震前的 IKONOS 数据,该数据获取于 2002 年 8 月 26 日,为全色 + 多光谱捆绑数据 ( 图 5 -7) 。
图 5 -7 震前 IKONOS 影像
( 二) 震后 QuickBird 数据
震后 QuickBird 数据获取于 2008 年 7 月 22 日,QuickBird 卫星星下点分辨率,全色为0 61m,多光谱为 2 44m,是同类卫星 IKONOS 的 1 63 倍。本研究的 QuickBird 影像是标准影像产品 ( Standard Imagery) 的捆绑 ( 全色 + 多光谱) 产品 ( 图 5 -8) 。
图 5 -8 震后 QuickBird 影像
( 三) 辅助数据
辅助数据主要为通济镇土地利用现状图和 DEM 数据。土地利用现状图源自 2007 年的土地利用现状数据库,为 Shapefile 矢量格式 ( 图 5 -9) ; 首先以 1∶ 1 万的地形图为基准,将地形图上的等高线数字化,等高距为5m; 然后利用其生成研究区的数字高程模型 DEM,采样间隔为 5m; 最后根据 DEM 生成通济镇的坡向图和坡度图 ( 图 5 -10) 。
图 5 -9 通济镇土地利用现状图 ( 2007 年)
图 5 -10 根据 DEM 生成的通济镇的坡向图 ( 左) 和坡度图 ( 右)
( 四) 数据预处理
数据预处理包括波段融合、影像间的几何配准以及主成分变换,其中几何校正和配准的目的在于建立数据之间高度的空间相关性,最后利用震前和震后的 8 个波段的数据做主成分变换。
1 波段融合
本研究对原始影像进行了 HSV 融合、PCA 融合和 CN 融合,对各种方法融合后的效果进行了定性分析。像元的灰度平均值反映的是影像的平均亮度,如果均值适中,则目视效果良好。标准差是衡量影像信息量的重要指标,标准差越大,信息越丰富。根据计算结果可知,从信息扭曲方面,CN 融合的光谱扭曲最大,HSV 融合次之,PCA 融合光谱扭曲最小; 从光谱信息量方面,HSV 融合和 CN 融合在各个波段的信息量均出现退化,而 PCA 融合仅在波段 1 和波段 2 出现了较小的退化,在波段 3 和波段 4 出现了细微的增加; 从波段数方面,HSV 融合和 CN 融合一次都只能融合三个波段,损失了波段的信息,不利于土地利用的分类。从以上三个方面综合考虑,本研究选用 PCA 融合。
2 几何配准
高精度的几何配准是提取可靠的土地利用信息的前提。高精度的几何配准是利用地面控制点对不同遥感影像进行校正,从而消除各遥感影像中像元的错位。以 QuickBird 影像为参考,对 IKONOS 影像进行配准。通常采用的几何校正方法有多项式校正、共线校正和随机插值校正等。本研究采用基于二次多项式的坐标拟合所选控制点的质量是几何配准质量的基础,为了保证控制点质量,可以选取两期影像上都容易识别的明显地物点,例如道路交叉点、桥梁、地物转折点等。为了保证几何校正的精度,本研究在各影像上选取了约 40 个控制点,并尽量均匀地分布在研究区范围内。经过检验,控制点最大均方差( RMS) 平均约为 0 2 个像元,总体 RMS 平均约为 0 1 个像元,RMS 被严格控制在 0 5个像元以内。
融合结果将 IKONOS 影像重采样成 0 5m 空间分辨率,使两期影像的空间分辨率保持一致。重采样是根据未校正影像像元值计算生成一幅校正图像的过程,即将所有的遥感影像统一到同一个投影坐标系统下: UTM-WGS84,ZONE-49N。
图 5 -11 用于震害信息提取的数据
同样,研究中综合使用 DEM 数据、矢量数据等辅助数据也以 QuickBird 数据为基准数据,对 DEM 数据和土地利用现状图进行几何校正和精配准。
3 主成分变换
将融合之后的 QuickBird 影像和 IKONOS影像各自 4 个波段分别做一次主成分变换,然后对 8 个波段一起做一次主成分变换。将各自单独变换后产生的第一主成分和 8 个波段共同变换后的前两个主成分共同作为原始数据用于震害信息提取。
至此完成数据预处理工作,用于震害信息提取的有 QB_Blue、QB_Green、QB_Red、QB_NIR、QB _ PCA1、 IK _ Blue、 IK _ Green、 IK _Red、IK _ NIR、 IK _ PCA1、 IK + QB _ PCA1、IK + QB_PCA2 和 DEM 共 13 个层的数据,土地利用现状图作为辅助的专题图层输入 ( 图5 - 11) 。
主成分分析是设法将原来众多具有一定相关性(比如P个指标),重新组合成一组新的互相无关的综合指标来代替原来的指标。因子分析是研究如何以最少的信息丢失,将众多原始变量浓缩成少数几个因子变量,以及如何使因子变量具有较强的可解释性的一种多元统计分析方法。
主成分分析,是考察多个变量间相关性一种多元统计方法,研究如何通过少数几个主成分来揭示多个变量间的内部结构,即从原始变量中导出少数几个主成分,使它们尽可能多地保留原始变量的信息,且彼此间互不相关通常数学上的处理就是将原来P个指标作线性组合,作为新的综合指标。
主成分分析和因子分析的不同:
1、原理不同:
主成分分析是利用降维(线性变换)的思想,在损失很少信息的前提下把多个指标转化为几个不相关的综合指标(主成分),即每个主成分都是原始变量的线性组合,使得主成分比原始变量具有某些更优越的性能,从而达到简化系统结构,抓住问题实质的目的。
而因子分析更倾向于从数据出发,描述原始变量的相关关系,是由研究原始变量相关矩阵内部的依赖关系出发,把错综复杂关系的变量表示成少数的公共因子和仅对某一个变量有作用的特殊因子线性组合而成。
2、线性表示方向不同:
主成分分析中是把主成分表示成各变量的线性组合,而因子分析是把变量表示成各公因子的线性组合。
3、假设条件不同:
主成分分析不需要有假设条件;而因子分析需要一些假设。因子分析的假设包括:各个共同因子之间不相关,特殊因子之间也不相关,共同因子和特殊因子之间也不相关。
欢迎分享,转载请注明来源:品搜搜测评网