中国海洋大学模式识别1.ppt
《中国海洋大学模式识别1.ppt》由会员分享,可在线阅读,更多相关《中国海洋大学模式识别1.ppt(89页珍藏版)》请在得力文库 - 分享文档赚钱的网站上搜索。
1、1模式识别2 相关学科相关学科 教学目标教学目标 基本要求基本要求 教材教材/参考文献参考文献关于本课程的有关说明3 相关学科统计学统计学概率论概率论线性代数(矩阵计算)线性代数(矩阵计算)形式语言形式语言人工智能人工智能图像处理图像处理计算机视觉计算机视觉 等等等等4 教学目标掌握模式识别的基本概念和方法掌握模式识别的基本概念和方法有效地运用所学知识和方法解决实际问题有效地运用所学知识和方法解决实际问题为研究新的模式识别的理论和方法打下基础为研究新的模式识别的理论和方法打下基础 5 基本要求基本基本:完成课程学习,通过考试,获得学分。:完成课程学习,通过考试,获得学分。提高提高:能够将所学知
2、识和内容用于课题研究,:能够将所学知识和内容用于课题研究,解决实际问题。解决实际问题。飞跃:飞跃:通过模式识别的学习,改进思维方式,通过模式识别的学习,改进思维方式,为将来的工作打好基础,终身受益。为将来的工作打好基础,终身受益。6教材教材/参考文献参考文献边肇祺,张学工,边肇祺,张学工,模式识别模式识别,清华大学出版社。,清华大学出版社。Sergios Theodoridis,Konstantinos Koutroumbas,Pattern Recognition,Fourth Edition 李晶皎等译,模式识别,电子工业出版社。李晶皎等译,模式识别,电子工业出版社。孙即祥,现代模式识别,
3、国防科技大学出版社,孙即祥,现代模式识别,国防科技大学出版社,2003年。年。R.Duda,P.Hart,D.Stork,Pattern Classification,second edition,2000(有中译本).7讲授课程内容及安排第一章第一章 引论引论 第二章第二章 聚类分析聚类分析第三章第三章 判别域代数界面方程法判别域代数界面方程法 第四章第四章 统计判决统计判决 第五章第五章 统计决策中的学习与估计统计决策中的学习与估计第六章第六章 最近邻方法最近邻方法第七章第七章 特征提取和选择特征提取和选择 8第一章 引论1.1 1.1 一个模式识别案例及基本概念一个模式识别案例及基本概念
4、1.2 1.2 特征矢量和特征空间特征矢量和特征空间1.3 1.3 随机矢量的描述随机矢量的描述1.4 1.4 正态分布正态分布91.1.1 一个模式识别案例一个模式识别案例n识别是人类的基本行为n模式识别(Pattern Recognition)使用计算机来辨别事物。机器识别,计算机识别,自动识别。10人类:人类:学习、总结规律,抽象出概念学习、总结规律,抽象出概念机器:机器:基本方法是计算基本方法是计算 缺乏抽象能力缺乏抽象能力机器与人类识别事物原理的比较机器与人类识别事物原理的比较11一个模式识别案例一个模式识别案例n鱼类加工厂:将传送带上的鱼自动进行分类 鲈鱼(Seabass)鲑鱼(S
5、almon)12n问题分析采用摄像机获取图像,根据图像对鱼进行分类。可能遇到的问题:n目标的提取预处理n分类的依据特征提取n判别的规则分类器设计n预处理:去噪,分割,把鱼和鱼之间以及鱼和背景之间分开。1314n特征提取和选择:对单个鱼的信息进行特征提取,通过测量某些特征来减少信息量。n长度n宽度n光泽度n鱼翅的数量和形状n嘴的位置,n分类决策:把特征送入决策分类器,制定某种判决规则1516特征选择n采用长度作为特征17特征选择n结论 单独使用长度错误率太高 必须考虑其它特征n改进措施 采用光泽度进行新的尝试18特征选择n采用光泽度作为特征19n运用两种特征组和:光泽度和宽度鱼 xT=x1,x2
6、光泽度光泽度宽度宽度特征选择20 采用光泽度和宽度作为特征21n可以尝试增加其他特征,但必须注意两点:新增特征与已有特征不相关 不会引起分类性能的下降n可以改进分类器模型,达到如下图所示的效果:2223讨论:这样的效果好吗?24n系统设计的目标是:使所设计的分类器能够正确识别未知样本-泛化能力 如果设计出过分复杂的判决边界,过分关注某些特定的训练样本,而忽略了类别的共同特征,导致泛化能力弱!-过拟合 讨论25n决策边界过于复杂(过拟合)导致的问题n运算量大n数学表达困难n泛化能力差:对未知样本的分类错误率高26n理想状况:对训练样本的分类性能和分界面复杂度的折中27n面向特定任务的二分类系统n
7、如果两种错误代价相同,则以最小错误率为准则;n如果两种错误代价不等,则以最小损失(风险)为准则。确定某种决策规则,使得决策所引起的损失最小,这是决策理论的核心任务。错误分类(误判)的代价(损失)28采用光泽度作为特征,考虑误判代价29模式识别系统的三个步骤(1)预处理 后续操作的基础:减少数据量,同时又不损失关键信息。n去除噪声n光照调整n目标提取n规一化其它模式识别系统的预处理例子:从图象中将汽车车牌的号码识别出来。先将车牌从图像中找出来,再对车牌进行划分,将每个数字分别划分开。30(2)特征提取 原始数据量巨大,含有冗余信息;需要对原始数据进行变换,得到反映分类本质的特征。可以考虑的特征:
8、n形状特征:长/宽比 周长/面积比n纹理特征n频谱特征n其它模式识别系统的三个步骤31(3)分类 根据某种判决规则将被识别对象归为某一类别。确定判决规则的基本原则:使按这种判决规则对被识别对象进行分类所造成的错误识别率最小或引起的损失最小。监督模式识别VS非监督模式识别模式识别系统的三个步骤1.1.2 模式识别的基本概念模式识别的基本概念n样本(样本(Sample)Sample):一个具体的研究(客观)对象。一个具体的研究(客观)对象。如如一一条条鱼鱼、某某个个患患者者,一一个个汉汉字字,一一幅幅图图片等。片等。n样本集(样本集(Sample set)Sample set):若干样本的集合。3
9、2n特征特征(Features)(Features):用用于于表表征征样样本本的的观观测测,通通常常是是数数值值表表示示的的某某个个量量化特征。化特征。如如果果描描述述1个个样样本本需需要要多多个个特特征征,则则这这些些特特征征组组成成1个特征矢量,记为:个特征矢量,记为:n 特征空间:特征空间:特征矢量的全体构成了样本的特征空间,特征矢量的全体构成了样本的特征空间,特征的个数就是特征空间的维数。特征的个数就是特征空间的维数。1个样本可以用特征空间的个样本可以用特征空间的1个点表示。个点表示。34n模式类模式类(Pattern Class)(Pattern Class):在在所所有有样样本本上
10、上定定义义的的一一个个子子集集,同同一一类类的的样样本本在在所所关关心心的的某某种种性性质质上上是是不不可可分分的的,即即具具有有相相同的模式。同的模式。n模式识别模式识别(Pattern Recognition)(Pattern Recognition):确定一个样本的类别属性(模式类)的过程,确定一个样本的类别属性(模式类)的过程,即把某一样本归属于多个类型中的某个类型。即把某一样本归属于多个类型中的某个类型。35监督模式识别与无监督模式识别监督模式识别与无监督模式识别n监督模式识别监督模式识别:有一个已知类别的样本集有一个已知类别的样本集(集合中每个样本的类别已知),作为作为训练样本集,
11、训练样本作为学习过程中的导师,来指导设计分类器。n无监督模式识别无监督模式识别 没有已知类别标签的训练样本可用,通过挖掘样本中潜在的相似性分类。36监督模式识别系统的主要环节:监督模式识别系统的主要环节:原始特征提取:原始特征提取:1 1)测量可能与分类有关的特征,形成原始特征矢量)测量可能与分类有关的特征,形成原始特征矢量2 2)将对象分解为基元,)将对象分解为基元,符号化,形成符号串或关系图符号化,形成符号串或关系图二次特征选择:采用某种算法,对特征进行再次提取和二次特征选择:采用某种算法,对特征进行再次提取和选择选择,得到最有利正确分类的特征矢量,得到最有利正确分类的特征矢量学习和训练:
12、学习和训练:利用已知样本集,指导训练分类器设计,利用已知样本集,指导训练分类器设计,建立分类和识别规则建立分类和识别规则分类识别:分类识别:对未知类别样本按建立的分类规则进行分对未知类别样本按建立的分类规则进行分类识别类识别37监督模式识别系统数据采集数据采集原始特征提原始特征提取取二次特征二次特征提取与选择提取与选择分类器分类器设计设计训练训练样本样本通常在采集信息过程中,还要去除所获取信息通常在采集信息过程中,还要去除所获取信息中的噪声,增强有用的信息等工作。这种使信息中的噪声,增强有用的信息等工作。这种使信息纯化的处理过程叫做信息的纯化的处理过程叫做信息的预处理预处理。选择一定的算法,利
13、用已知样本指导训练分类器选择一定的算法,利用已知样本指导训练分类器。通常能描述对象的元素很多,为节约资源和提通常能描述对象的元素很多,为节约资源和提高处理速度,有时更为了可行性,在满足分类识高处理速度,有时更为了可行性,在满足分类识别正确率要求的条件下,按某种准则尽量选用对别正确率要求的条件下,按某种准则尽量选用对正确分类识别作用较大的特征。使得用较少的特正确分类识别作用较大的特征。使得用较少的特征就能完成分类识别任务。征就能完成分类识别任务。38监督模式识别系统数据采集数据采集特征提取特征提取二次特征二次特征提取与选择提取与选择分类分类决策决策待识待识对象对象识别结果识别结果数据采集数据采集
14、特征提取特征提取分类器分类器设计(训练)设计(训练)二次特征提二次特征提取与选择取与选择训练训练样本样本改进采集改进采集提取方法提取方法改进特征提改进特征提取与选择取与选择制定改进分制定改进分类识别规则类识别规则正确率正确率测试测试训练阶段训练阶段决策阶段决策阶段39纸币识别器对纸币按面额进行分类纸币识别器对纸币按面额进行分类 面额面额系统实例5元10元20元50元100元40系统实例 长度长度(mm)(mm)宽度宽度(mm)(mm)5 5元元13613663631010元元14114170702020元元14614670705050元元1511517070100100元元1561567777
15、41系统实例磁性磁性金属条位置金属条位置(大约大约)5 5元元有有 54/8254/821010元元有有 54/8754/872020元元有有 57/8957/895050元元有有 60/9160/91100100元元有有 63/9363/935元 10元 20元 50元 100元12345678反反射射光光波波形形43系统实例数据采集、特征提取:数据采集、特征提取:长度、宽度、磁性、磁性的位置,光反射亮度、光长度、宽度、磁性、磁性的位置,光反射亮度、光透射亮度等等透射亮度等等 特征选择:特征选择:长度、磁性及位置、反射亮度长度、磁性及位置、反射亮度分类识别:分类识别:确定纸币的面额及真伪确定
16、纸币的面额及真伪44模式识别的其他例子模式识别的其他例子计算机自动诊断疾病计算机自动诊断疾病:1.1.信息采集信息采集 测量体温、血压、心率、血液化验、测量体温、血压、心率、血液化验、X X光透射、光透射、B B超、心电图、超、心电图、CTCT等尽可能多的信息,并将这些等尽可能多的信息,并将这些信息数字化后输入电脑。信息数字化后输入电脑。特征要进行选择特征要进行选择。2 2 运行在电脑中的运行在电脑中的专家系统专家系统或专用程序可以分析或专用程序可以分析这些数据并进行这些数据并进行分类分类,得出正常或不正常的判,得出正常或不正常的判断,不正常情况还要指出是什么问题。断,不正常情况还要指出是什么
17、问题。451.1.3模式识别的基本方法一、统计模式识别一、统计模式识别二、句法模式识别二、句法模式识别三、模糊模式识别三、模糊模式识别四、人工神经网络法四、人工神经网络法五、人工智能方法五、人工智能方法461.1.3 模式识别的基本方法一、统计模式识别一、统计模式识别模式描述方法:模式描述方法:特征向量特征向量 模式判定:模式判定:模式类用条件概率分布模式类用条件概率分布P(X/P(X/i i)表示表示,m,m类就有类就有m m个分布,然后判定未知模式属于哪一个分布。个分布,然后判定未知模式属于哪一个分布。471.1.3 模式识别的基本方法一、统计模式识别一、统计模式识别理论基础:理论基础:概
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 中国海洋 大学 模式识别
限制150内