2022年2022年流形学习算法分析及在人脸数据库上的应用 .pdf
《2022年2022年流形学习算法分析及在人脸数据库上的应用 .pdf》由会员分享,可在线阅读,更多相关《2022年2022年流形学习算法分析及在人脸数据库上的应用 .pdf(4页珍藏版)》请在得力文库 - 分享文档赚钱的网站上搜索。
1、25卷 第9期2008年9月微 电 子 学 与 计 算 机M ICROEL ECTRON ICS & COMPU TERVol. 25No. 9September 2008收稿日期: 2008 - 03 - 13基金项目:国家自然科学基金资助项目(60435010 ) ;河北省教育厅科研计划项目(Z2006303 ) ;东北大学“985工程”项目流形学习算法分析及在人脸数据库上的应用宋 欣1,王 娟1,张 斌1,叶世伟2(1东北大学秦皇岛分校计算中心,河北 秦皇岛066004 ; 2中国科学院研究生院信息科学与工程学院,北京100049 )摘 要:为了更高效的处理高维数、 高复杂性的非线性数据
2、,发现其嵌入在源数据空间中的本维特征,提出了基于局部光滑逼近思想的流形学习算法,通过局部线性误差逼近最小化,实现将高维数据映射到低维空间.在FREY人脸数据库上进行降维实验,证明了该方法的可行性和有效性.关键词:流形学习;局部光滑逼近;维数约简;人脸图像处理中图分类号: TP181 文献标识码: A 文章编号: 1000 - 7180 (2008)09 - 0091 - 04ManifoldLearningAlgorithmAnalysis andApplicationin Face DatabaseSONG Xin1 ,2, WAN GJuan1, ZHAN G Bin1, YE Shi2w
3、ei2(1 Computer Center , NortheasternUniversityat Qinhuangdao , Hebei Qinhuangdao 066004 , China ; 2 School ofInformation Scienceand Engineering, the Graduate Schoolof the ChineseAcademy of Sciences , Beijing 100049 , China)Abstract : In order to process the nonlinear data withhigh - dimensional and
4、high complexityefficiently, and found the di2mensional characteristicembedded in the source data s pace , the manifold learning algorithmbasedon Locallysmooth ap2proximatingwas proposed on the basis of the analysis of the typical manifoldlearning algorithm.The dimensionalityre2duction of the high -
5、dimensional nonlinear data is achieved by locally linear error approximatingminimum.Through theexperiments on dimensionalityreduction in the FREY face database , the results show that the feasibility and effectivenessof manifold learning method applying to face image data processing.Key words : mani
6、foldlearning ; Locallysmooth approximating; dimensionalityreduction ; face image processing1引言计算机信息处理中要面对大量高维数、 高复杂度的数据 ,数据之间也存在着大量的冗余的线性或者是非线性相关,如何对这些海量数据进行有效的挖掘处理 ,成为当今计算机技术研究领域广泛关注的热点问题 .文中在详细分析了典型的流形学习算法的原理基础上,提出了基于流形学习思想的局部光滑逼近的数据降维算法,在人工数据集上实验证明了其有效性后,进一步将流形学习算法应用到FREY 人脸数据库上进行测试分析,比较各算法在人脸数据集
7、上的降维效果,说明流形学习算法应用于人脸图像这样高维数、 高复杂性的非线性数据处理问题上的可行性.2 典型流形学习算法分析2. 1流形与流形学习流形1是拓扑学中的概念,可以定义为:设M是一个豪斯多夫拓扑空间,若对每一点PM ,都有P的一个开领域U和Rn的一个开子集同胚,则称M为n维拓扑流形,简称为n维流形.流形学习方法其主要目标是发现嵌入在高维数名师资料总结 - - -精品资料欢迎下载 - - - - - - - - - - - - - - - - - - 名师精心整理 - - - - - - - 第 1 页,共 4 页 - - - - - - - - - 据空间的低维光滑流形.设Yd.数据集
8、 yi是随机生成的,且经过f映射为观察空间的数据 xi= f ( yi) ,流形学习就是在给定观察样本集 xi的条件下重构f和 yi.2. 2 等距映射算法等距映射算法(Isometric Mapping , Isomap)核心是估计两点间的测地距离223,力求样本在从高维空间降到低维空间的过程中能得到最大程度上的重构和恢复.算法的实现步骤为: (1)设输入空间X中所有数据点xi处于相对光滑的流形M中, i =1,2, N ,根据这些数据点的邻接关系构建加权无向邻接图G ,邻接关系定义为样本点的邻接点处于固定的 邻域内或选取样本点的K个近邻,邻接点的权重为样本点之间的欧式距离dx( i , j
9、 ) . (2)估计流形M上两点之间的测地线距离,根据图G上两点的最短 路 径 作为 近 似 估 计,得 到 距 离 矩 阵DG= dG( i , j) . (3)应用 MDS 算法构造低维嵌入Y ,对于最短距离矩阵DG= dG( i , j ) 有计算代价函数E = ( DG)-( DY)L2, DY= dY( i , j)=yi-yj ,令S =(Sij)=(D2ij), H =(Hij)=(ij-1/ N ) ,推导出( D)= -HSH/2,则低维嵌入是( D)的第 2小到第d +1小的特征值所对应的特征向量.2. 3 局部线性嵌入算法局 部 线 性 嵌 入 (LocallyLinea
10、rEmbedding ,LL E)4 处理的源数据大多数是非线性数据,如果在源数据点稠密分布的情况下,可以将源数据空间采样点邻域内的点近似的分布于一个超平面上. 算法首先要求设D维空间中有N个数据属于同一流形,记做: Xi=( xi1, xi2,. . . , xiD) , i(1,2, N ) .假设有足够的数据点,并且认为空间中的每一个数据点可以用它的K个近邻线性表示.求近邻点,一般采用K近邻或者 邻域.接着计算权值Wij,代价函数为: E( W)=ni =1|Xi-kj =1WijXij| .由于权值体现了数据间内在的几何关系,所以L L E算法中权值要满足两个约束条件: (1)要求每一
11、个数据点Xi都只能由它的邻近点来表示,若Xj不是近邻点,则Wij=0; (2)要求权值矩阵的每一行的和为 1.最后算法保持权值Wij不变,求Xi在低维空间的象Yi,使得低维重构误差最小.2.4 拉普拉斯特征映射拉普拉斯特征映射(Laplacian Eigenmaps)算法首先根据采样点的k个近邻关系或根据采样点的邻域的方法构建一带权图G( V , E) ,其中V表示选择采样点的集合, E表示两点如果是邻近点则在两点间有一条边相连,为讨论方便,假定图是连通的.那么,就需要对这个邻接图中的每条边赋予权值Wij,规定如果两个点是邻近点则Wij=1,否则Wij=0.考虑带权邻接图映射到低维空间时使得相
12、连的点之间距离尽可能的离得近,所以先假设该映射为y = ( y1, y2, yn)T,如果要确保采样点Xi与Xj是邻近点,也就是使得其映射Yi和Yj的距离尽可能的小,所以对于任意的Y,可以最小化经过局部均化的目标函数:12i , j(yi-yj)2wij=yTL y令D为对角矩阵, Dii=jwij, L=D -W为Laplacian 矩阵,所以就可以计算图拉普拉斯算子的广义特征向量,求得低维嵌入.2. 5 Hessian特征映射Hessian特征映射( Hessian Eigenmaps)5 试图恢复出局部等距于低维欧氏空间中开连通子集的流形的生成坐标 .假设MRm是一个光滑的流形, Tx(
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 2022年2022年流形学习算法分析及在人脸数据库上的应用 2022 流形 学习 算法 分析 数据库 应用
限制150内