流形学习的统一框架及其在模式识别中的应用.pdf
《流形学习的统一框架及其在模式识别中的应用.pdf》由会员分享,可在线阅读,更多相关《流形学习的统一框架及其在模式识别中的应用.pdf(112页珍藏版)》请在得力文库 - 分享文档赚钱的网站上搜索。
1、中山大学博士学位论文流形学习的统一框架及其在模式识别中的应用姓名:鲁春元申请学位级别:博士专业:信息计算科学指导教师:冯国灿20090606摘要流形学习的统一框架及其在模式识别中的应用专业:信息计算科学博士生:鲁春元导师:冯国灿教授摘要随着信息时代的到来,人们获得了方便的信息提取于段,也面临着复杂的海量数据处理的问题,尤其是面对模式识别、数据挖掘、图像处理与机器学习领域中的海量数据时。这些数据往往都呈现出高维数、高增长率、难以被人感知的特点。因此如何从这些数据中合理有效的找到对人们有用的信息成为亟待解决的问题。数据降维是一种有效的处理手段。降维就是要在保持数据信息尽量完整的条件下合理的降低数据
2、的维数。通过发现和描述数据内部的规律来降低数据维数,从而满足人们压缩、存储、感知和进一步复杂处理的需要。传统的降维方法往往都假定数据的分布具有全局线性特性。其中广泛应用的有:独立分量分析(I C A),主成分分析(P C A)和线性判别分析(L D A)等等。显然这种假设大大限制了传统降维方法的能力。当面临的真实数据大多是呈现相互关联,非线性化的结构时,传统的降维方法显得越来越无能为力。近年来,一类具有代表性的非线性降维算法,如等距流形映射(I S o M A P)、局部线性嵌入(L L E)等方法的提出,引起了人们极大的兴趣。由于这类算法的能够发现嵌入在高维空间中的低维流形结构,所以也把这类
3、算法叫做流形学习算法。中lJ 1 人学博上学位论文流形学习的统一框架及其在模式识别r l l 的应用流形学习是一种新的机器学习与认知科学的方法。它的主要目标是发现嵌入在高维数据空间的低维光滑流形表示及其嵌入规则。目前,流形学列算法已经成为降维领域的一个研究热点,并且流形学习算法在高维数据可视化、人脸识别和文本分类等领域取得了一定的效果。本文针对几种有代表性的流形学习算法进行了深入的研究,主要探讨了流形学习的框架理论相关研究及其在模式识别中的应用。在理论方面本文做出了两方面的工作。一是构造了一个统一框架,将传统的线性降维算法如主成分分析(P C A)、线性判别分析(L D A)与流形学习算法如I
4、 S O M A P、L L E、保近邻嵌入(N P E)、拉普拉斯特征映射(L E)、保局投影(L P P)与边界费舍尔分析(M F A)等统一到这个框架之下。并在提出的统一框架下构造了一个新的流形学习算法一一子流形保形分析(S u b M a n i f o l dP r e s e r v i n gA n a l y s i s,简称S M P A)。该算法不仅适于数据可视化,也适于模式分类。实验结果表明该算法优于其他算法。二是摆脱传统核方法在核函数上的制约,构造出了数据上的最优流形核矩阵。本文通过将本文框架下的流形学习转变为一个半正定规划问题,通过半正定规划的技术构造最优核矩阵。实验
5、结果显示了该方法的有效性。在应用方面,本文针对目前流形学习算法在模式识别应用中稳定性较差,识别率不高的情况,结合A d a B o o s t 方法,提出了一套新的最优分类流形子空间的人脸识别方法。另外,本文还提出了一种基于流形分值的特征选择方法。总的来说,本文的主要贡献包括以下五个方面:1 本文对几种有代表性的流形学习算法进行了深入的研究,提出了基于度量的流形学习算法的统一框架。该框架能够将现有的降维算法(P C A、L D A 等线性算法与I S O M A P、L L E、N P E、L E、L P P、M F A 等非线性降维算法)统一起来,更好地解释与比较各个算法的优劣。2 在本文提
6、出的框架下,能够根据不同的目的衍生出不同的算法。由此本文提出了一个用于数据可视化与分类的新算法一一子流形保形分析(S M P A)。该算法旨在进行分类的情况下,保持多类数据中的子流形结I l摘要构。实验验证了该算法的有效性。3 在模式分类中,数据的特征极为关键,本文提出了基于本文框架下流形学习的流形分值特征选择。这种特征选择方法在模式识别应用上显示了较好的效果。4 本文突破传统核方法在核函数上的制约,通过半正定规划(S D P)构造最优流形核矩阵。相关实验结果显示了该方法的有效性。5 本文结合A d a B o o s t 方法,提出了一套新的最优分类流形子空间的人脸识别方法。该方法不仅能提高
7、识别率,而且具有很好的稳定性和抗光照能力。关键词:流形学习,框架,特征选择,核技巧,半正定规划,模式识别I I IA b s t r a c tAU n i f i e dM a n i f o l dL e a r n i n gF r a m e w o r ka n di t sA p p l i c a t i o n si nP a t t e r nR e c o g n i t i o nM a jo r:I n f o r m a t i c s&C o m p u t a t i o n a lS c i e n c eN a m e:L uC h u n y u a nS
8、u p e r v i s o r:P r o f F e n gG u o c a nA b s t r a c tN o w a d a y s,p e o p l ea r ef a c i n gw i t hal o to fm a s s i v ei n f o r m a t i o n,e s p e c i a l l yi nt h ef i e l d so fp a t t e mr e c o g n i t i o n,d a t am i n i n g,i m a g ep r o c e s s i n ga n dm a c h i n el e a r
9、n i n g T h eh i g hd i m e n s i o n a ld a t aa r ev e r yd i f f i c u l tt ob ep e r c e i v e d T h e r e f o r e,h o wt oe x t r a c tr e a s o n a b l e,e f f e c t i v ea n du s e f u li n f o r m a t i o nf r o mc o m p l e xd a t aa n dv i s u a ld a t aa r ei m p o r t a n tp r o b l e m
10、s D i m e n s i o n a l i t yr e d u c t i o ni sa ne f f e c t i v ef r e q u e n t l yu s e dm e t h o d T h ep u r p o s eo fd i m e n s i o n a l i t)rr e d u c t i o ni st om a i n t a i nt h ed e s i r e di n t e r n a ls t r u c t u r eo fd a t aa sm u c ha sp o s s i b l ea n dt or e d u c e
11、t h ed a t ad i m e n s i o nr e a s o n a b l y V i ad i s c o v e r ya n dd e s c r i p t i o no ft h ed a t a Si n t e r n a ls t r u c t u r e,w ec a nr e d u c et h ed a t ad i m e n s i o nt om e e tt h er e q u i r e m e n to ff e a t u r er e p r e s e n t a t i o n,d a t ac o m p r e s s i
12、o n,d a t as t o r a g e,p e r c e p t i o na n de v e nf u r t h e rc o m p l e xp r o c e s s i n g M a n yc o n v e n t i o n a lm e t h o d s,s u c ha sI n d e p e n d e n tC o m p o n e n tA n a l y s i s(I C A),P r i n c i p a lC o m p o n e n tA n a l y s i s(P C A),e t c w i t ht h ea s s u
13、m p t i o nt h a tt h ed a t al i eo nag l o b a ll i n e a rs t r u c t u r e I ti sc l e a rt h a tt h i sa s s u m p t i o nl i m i t st h ep o w e ro ft r a d i t i o n a ld i m e n s i o n a l i t yr e d u c t i o nm e t h o d s I nt h ep r a c t i c a lw o r l d,d a t aa r ea l w a y sS Oi n t
14、 e r r e l a t e da n dn o n l i n e a rt h a tt h et r a d i t i o n a ld i m e n s i o n a l i t yr e d u c t i o nm e t h o d sb e c o m ep o w e r l e s s V中山大学博士学位论文流形学习的统一框架及其在模式识别中的应用I nt h ep a s tf e wy e a r s,s o m ew e l l-k n o w nn o n l i n e a rd i m e n s i o n a l i t yr e d u c t
15、i o na l g o r i t h m ss u c ha sI s o m e t r i cM a p p i n g(I S O M A P),L o c a l l yL i n e a rE m b e d d i n g(L L E),e t c h a v ea t t r a c t e dm o r ea n dm o r ea t t e n t i o no fs c h o l a r sf r o ma l lk i n d so fr e s e a r c ha r e a s S i n c et h e s ea l g o r i t h m sa r
16、 ed e s i g n e dt of i n dt h el o w-d i m e n s i o n a lm a n i f o l d sw h i c he m b e d d e di nt h ea m b i e n th i g h-d i m e n s i o n a ls p a c e,S Ot h e ya r ea l s o c a l l e dm a n i f o l dl e a r n i n ga l g o r i t h m s M a n i f o l dl e a r n i n gi sat y p eo fn e wm e t h
17、 o d so fm a c h i n el e a r n i n ga n dc o g n i t i v es c i e n c e T h em a i ng o a li st or e c o v e rs m o o t hl o w-d i m e n s i o n a lm a n i f o l d sa n dt h ee m b e d d i n gr u l e s、i t hw h i c hd a t ai se m b e d d e di nh i g hd i m e n s i o n a ld a t as p a c e R e c e n
18、t l y,t h em a n i f o l dl e a r n i n gh a sb e c o m ear e s e a r c hs p o t l i g h ta n ds t a r t st ob ea p p l i e di ni m a g ea n a l y s i s,c o m p u t e rv i s i o n,a n dd o c u m e n t sa n a l y s i s I nt h i st h e s i s,s o m et y p i c a lm a n i f o l dl e a r n i n ga l g o r
19、i t h m sa r es u m m a r i z e df i r s t,a n dt h e nt h et h e o r i e so fm a n i f o l dl e a r n i n gh a v eb e e nd e v e l o p e da n ds o m ep r a c t i c a la p p l i c a t i o n si np a t t e mr e c o g n i t i o nh a v eb e e ni n t r o d u c e d F i r s t,w ep r e s e n t e dag e n e r
20、 a lf r a m e w o r kw h i c ho f f e r sau n i f i e dv i e wf o ru n d e r s t a n d i n ga n de x p l a i n i n gd i m e n s i o n a l i t yr e d u c t i o na l g o r i t h m ss u c h8 8P C A,L D A,I S O M A P,L L E,L a p l a c i a nE i g e n m a p(L E),L o c a l i t yP r e s e r v i n gP r o j e
21、 c t i o n(L P P),N e i g h b o r h o o dP r e s e r v i n gE m b e d d i n g(N P E),a n dM a r g i n a lF i s h e rA n a l y s i s(M F A)S e c o n d,an o v e ld i m e n s i o n a l i t yr e d u c t i o na l g o r i t h m,S u b M a n i f o l dP r e s e r v i n gA n a l y s i s(S M P A)h a sb e e np
22、r o p o s e df o rc l a s s i f i c a t i o na n dv i s u a l i z a t i o nw i t h i nt h ef r a m e w o r k M o r e o v e r,w ed i s c u s sh o wt ol e a r na no p t i m a lk e m e lm a t r i xf o rh i g hd i m e n s i o n a ld a t at h a tl i e so ne x a c to rn e a ral o wd i m e n s i o n a lm a
23、 n i f o l d S oan o v e la l g o r i t h mi si n t r o d u c e db a s e do nS e m i D e f i n i t eP r o g r a m(S D P)I np r a c t i c a la p p l i c a t i o n,m a n i f o l dl e a f i n gm e t h o d sh a v es o m eg r e a td r a w b a c k s,s u c ha st h eh i g he r r o rr a t ea n dt h eu n s t
24、a b i l i t yo np a t t e mr e c o g n i t i o n I no r d e rt oc o p e谢t l lt h e s ed r a w b a c k s,an e wf a c er e c o g n i t i o nm e t h o db a s e do nm a n i f o l dl e a r n i n ga l g o r i t h ma n dA d a B o o s th a sb e e np r o p o s e di nt h i st h e s i s Af e a t u r es e l e c
25、 t i o nm e t h o db a s e do nm a n i f o l ds c o r eh a sa l s ob e e np r e s e n t e d V IA b s t r a c tT h em a i na c h i e v e m e n t si nt h i st h e s i sa r ea sf o l l o w s:1 An o v e lg e n e r a ld i m e n s i o n a l i t yr e d u c t i o nf r a m e w o r kb a s e do nt h es i m i l
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 流形 学习 统一 框架 及其 模式识别 中的 应用
限制150内