DM1序论.ppt - 上海.ppt
《DM1序论.ppt - 上海.ppt》由会员分享,可在线阅读,更多相关《DM1序论.ppt - 上海.ppt(70页珍藏版)》请在得力文库 - 分享文档赚钱的网站上搜索。
1、DataMiningByYaoLi-xiu:Outline:MIntroductionMDataPreprocessingMConceptDescriptionMAssociationRulesMClassificationandRegressionMClusteringChapter1Introduction AI、ML、PR、DM Function&Applicatonl定义定义1人工智能是一种使计算机能够人工智能是一种使计算机能够思维思维,使机器具有,使机器具有智力的激动人心的新尝试。智力的激动人心的新尝试。l定义定义2人工智能是那些与人的人工智能是那些与人的思维思维、决策、问题求解和、
2、决策、问题求解和学习等有关活动的自动化。学习等有关活动的自动化。l定义定义3人工智能是用计算模型研究人工智能是用计算模型研究智力行为智力行为。l定义定义4人工智能是研究那些使人工智能是研究那些使理解、推理和行为理解、推理和行为成为可成为可能的计算。能的计算。人工智能的定义l定义定义5人工智能是一种能够人工智能是一种能够执行执行需要人的智能的创造性机器的技术。需要人的智能的创造性机器的技术。l定义定义6 6 人工智能研究如何使计算机人工智能研究如何使计算机做事做事让人过得更好。让人过得更好。l定义定义7 7 人工智能是一门通过计算过程力图理解和模仿智能行为的学科。人工智能是一门通过计算过程力图理
3、解和模仿智能行为的学科。l定义定义8 8 人工智能是计算机科学中与智能行为的自动化有关的一个分支。人工智能是计算机科学中与智能行为的自动化有关的一个分支。其中,定义其中,定义1 1和定义和定义2 2涉及涉及拟人思维拟人思维;定义;定义3 3和定义和定义4 4与与理性思维理性思维有关;有关;定义定义5 5和定义和定义6 6涉及涉及拟人行为拟人行为;定义;定义7 7和定义和定义8 8与与拟人理性行为拟人理性行为有关。有关。人工智能的定义Russell&Norvig的定义的定义SystemsthatthinklikehumansSystemsthatthinkrationallySystemstha
4、tactlikehumansSystemsthatactrationally人工智能是计算机科学的一个分支,是研究使计算人工智能是计算机科学的一个分支,是研究使计算机表现出人类智能的学科。机表现出人类智能的学科。它涉及逻辑学、计算机科学、脑科学、神经生理学、心理学、它涉及逻辑学、计算机科学、脑科学、神经生理学、心理学、哲学、语言学、信息论、控制论等多个学科,是一门综合哲学、语言学、信息论、控制论等多个学科,是一门综合性的交叉和边缘学科。性的交叉和边缘学科。人工智能的定义人工智能学科的诞生经历了漫长的历史过程。历史上一人工智能学科的诞生经历了漫长的历史过程。历史上一些伟大的科学家和思想家对此作出
5、了巨大的贡献,为今些伟大的科学家和思想家对此作出了巨大的贡献,为今天的人工智能研究作了长足和充分的准备。天的人工智能研究作了长足和充分的准备。人工智能的诞生亚里士多德(亚里士多德(Aristotle)(公元前)(公元前384322)古希腊伟大的哲学家、思想家,研究人类思维规律的鼻古希腊伟大的哲学家、思想家,研究人类思维规律的鼻祖,为祖,为形式逻辑形式逻辑奠定了基础,提出了奠定了基础,提出了推理方法推理方法,给出了,给出了形式逻辑的一些基本定律,创造了形式逻辑的一些基本定律,创造了三段论三段论法。法。人工智能的诞生(1)由大前提和小前提推出结论。如凡金属(M)都能导电(P)(大前提),铜(S)是
6、金属(M)(小前提),所以铜(S)能导电(P)(结论)。演绎:从普遍性结论或一般性事理推导出个别性结论的论 弗兰西斯弗兰西斯培根(培根(Francis BaconFrancis Bacon)()(1561 1561 1626 1626)英国哲学家和自然科学家,系统提出了英国哲学家和自然科学家,系统提出了归纳法归纳法,成为和亚里,成为和亚里士多德的演绎法相辅相成的思维法则。他强调了知识的重要士多德的演绎法相辅相成的思维法则。他强调了知识的重要作用,指出作用,指出“知识就是力量知识就是力量”。人工智能的诞生(2)归纳:从个别性知识,引出一般性知识的推理,是由已知真的前提,引出可能真的结论莱布尼茨(
7、莱布尼茨(Leibnitz)()(16461716)德国数学家和哲学家,提出了关于德国数学家和哲学家,提出了关于数理逻辑数理逻辑的思想,的思想,即把形式逻辑符号化,从而对人的思维进行运算和即把形式逻辑符号化,从而对人的思维进行运算和推理的思想。推理的思想。人工智能的诞生(3)-3,-2,5,(?),61,122-3-252461122他们的差是1,7,19,37,61,后五数的差是6,2*6,3*64*64布尔(布尔(Boole)()(18151864)英国数学家、逻辑学家。他的主要贡献是初步实现了莱布尼英国数学家、逻辑学家。他的主要贡献是初步实现了莱布尼茨关于思维茨关于思维符号符号化和数学化
8、的思想,提出了一种崭新的代数化和数学化的思想,提出了一种崭新的代数系统系统布尔代数布尔代数,凡是传统逻辑能处理的问题,布尔代数,凡是传统逻辑能处理的问题,布尔代数都能处理。都能处理。符号逻辑符号逻辑对于逻辑代数,布尔的方法是着重于外延逻辑,即类的逻辑。其中类或集合用x,y,z,表示,而符号X,Y,Z,则代表个体元素用1表示万有类,用0表示空类或零类他用xy表示两个集合的交他称这个运算为选拔(election),即x与y所有共同元素的集合人工智能的诞生(4)歌德尔(歌德尔(Gdel)()(19061978)美籍奥地利数理逻辑学家,他研究美籍奥地利数理逻辑学家,他研究数理逻辑数理逻辑中的一些带根本
9、性中的一些带根本性的问题,即的问题,即不完全性定理和连续假设的相对协调性证不完全性定理和连续假设的相对协调性证明明,指出了把人的思维形式化和机械化的某些极限,在理论,指出了把人的思维形式化和机械化的某些极限,在理论上证明了有些事情是机器做不到的。上证明了有些事情是机器做不到的。人工智能的诞生(5)图灵(图灵(TuringTuring)()(1912 1912 1954 1954)英国数学家。他于英国数学家。他于19361936年提出了一种年提出了一种理想计算机的数学模型理想计算机的数学模型(图灵机)。(图灵机)。现已公认,所有可计算函数都能用图灵机计算,现已公认,所有可计算函数都能用图灵机计算
10、,这为电子计算机的构建提供了理论根据。这为电子计算机的构建提供了理论根据。19501950年,他还提出了著名的年,他还提出了著名的“图灵实验图灵实验”,给智能的标准提,给智能的标准提供了明确的定义:供了明确的定义:把人和计算机分两个房间,并且相互对话,如果作为人的把人和计算机分两个房间,并且相互对话,如果作为人的一方不能判断对方是人还是计算机,那这台计算机就达到了人一方不能判断对方是人还是计算机,那这台计算机就达到了人的智能。的智能。人工智能的诞生(6)莫克利(莫克利(J.W.MauchlyJ.W.Mauchly)()(1907 1907 1980 1980)美国数学家,和他的学生埃克特(美国
11、数学家,和他的学生埃克特(J.P.EckertJ.P.Eckert),于),于19461946年年研制成功了世界上研制成功了世界上第一台通用电子数字计算机第一台通用电子数字计算机ENIACENIAC。人工智能的诞生(7)冯冯诺依曼(诺依曼(John von NeumannJohn von Neumann)()(1903 1903 1957)1957)美籍匈牙利数学家,提出了以美籍匈牙利数学家,提出了以二进制二进制和程序和程序存储控制为核心的通用存储控制为核心的通用电子数字计算机体系电子数字计算机体系结构结构原理,奠定了现代电子计算机体系结构原理,奠定了现代电子计算机体系结构的基础。的基础。19
12、461946EDVACEDVAC。人工智能的诞生(8)由五个基本部分组成:1)运算器2)控制器3)存储器4)输入装置5)输出装置麦卡锡(麦卡锡(JohnMcCarthy),美国数学),美国数学家、计算机科学家,家、计算机科学家,“人工智能之父人工智能之父”。人工智能的诞生(9)首次提出“人工智能”(AI)概念;发明Lisp语言;研究不寻常的常识推理;发明“情景演算”。19561956年夏,在美国的达特茅斯学院,由年夏,在美国的达特茅斯学院,由McCarthyMcCarthy(斯坦福大学)、(斯坦福大学)、MinskyMinsky(哈佛大学)、(哈佛大学)、LochesterLochester(
13、IBMIBM公司)、公司)、ShannonShannon(贝尔实验室)(贝尔实验室)四人共同发起,四人共同发起,邀请邀请IBMIBM公司的公司的MoreMore、SamuelSamuel,MITMIT的的SelfridgeSelfridge、SolomonffSolomonff,还有,还有SimonSimon、NewellNewell等人参加学术讨论班,在一起共同学习和探讨用机器模拟等人参加学术讨论班,在一起共同学习和探讨用机器模拟智能的各种问题。智能的各种问题。在会上,经在会上,经McCarthyMcCarthy提议,决定使用提议,决定使用“人工智能人工智能”一词来概括该研究一词来概括该研究
14、方向。这次具有历史意义的会议标志着人工智能这个学科的正式诞生。方向。这次具有历史意义的会议标志着人工智能这个学科的正式诞生。人工智能的诞生(10)1956年夏季,人类历史上第一次人工智能研讨会在美国的达特茅斯(Dartmouth)大学举行,标志着人工智能学科的诞生。1969年召开了第一届国际人工智能联合会议(International Joint Conference on AI,IJCAI),此后每两年召开一次。1970年人工智能国际杂志(International Journal of AI)创刊。这些对开展人工智能国际学术活动和交流、促进人工智能的研究和发展起到积极作用。人工智能的研究及
15、应用领域 人工智能研究及应用领域很多,主要研究领域包括人工智能研究及应用领域很多,主要研究领域包括问题求解、机器学习、专家系统、模式识别、自动定理问题求解、机器学习、专家系统、模式识别、自动定理证明、自然语言理解等。证明、自然语言理解等。第第1章人工智能概述章人工智能概述第第2章确定性知识表示章确定性知识表示第第3章确定性推理章确定性推理第第4章搜索策略章搜索策略第第5章计算智能章计算智能第第6章不确定性推理章不确定性推理第第7章机器学章机器学第第8章自然语言理解章自然语言理解第第9章分布智能章分布智能第第10章新型专家系统章新型专家系统人工智能的研究及应用领域1 问题求解人工智能的第一个大成
16、就是发展了能够求解难题的下棋(如国际象棋)程序,它包含问题的表示、分解、搜索与归约等。深蓝八皇后问题旅行者问题人工智能的研究及应用领域2 专家系统一般地说,专家系统是一个智能计算机程序系统,其内部具有大量专家水平的某个领域知识与经验,能够利用人类专家的知识和解决问题的方法来解决该领域的问题。发展专家系统的关键是表达和运用专家知识,即来自人类专家的并已被证明对解决有关领域内的典型问题是有用的事实和过程。人工智能的研究及应用领域3 模式识别 模式的本意是指一些供模仿的标准式样或标本。模式识别就是指识别出给定物体所模仿的标本。人工智能所研究的模式识别是指用计算机代替人类或帮助人类感知模式,是对人类感
17、知外界功能的模拟,研究的是计算机模式识别系统,也就是使一个计算机系统具有模拟人类通过感官接受外界信息、识别和理解周围环境的感知能力。例如,识别自己所需要的工具,产品人工智能的研究及应用领域4 自动定理证明自动定理证明的实质:对前提P和结论Q,证明P-Q永真。反证法人工智能的研究及应用领域5 机器学习 学习是人类智能的主要标志和获得知识的基本手段;要使机器象人一样拥有知识和智能,就必须使机器具有获得知识的能力。计算机获得知识的两种途径:直接获得;学习获得(机器学习)。学习是一个有特定目的的知识获取过程,其内部表现为新知识结构的不断建立和修改,而外部表现为性能的改善。第第1章引言章引言第第2章概念
18、学习和一般到特殊序章概念学习和一般到特殊序第第3章决策树学习章决策树学习第第4章人工神经网络章人工神经网络第第5章评估假设章评估假设第第6章贝叶斯学习章贝叶斯学习第第7章计算学习理论章计算学习理论第第8章基于实例的学习章基于实例的学习第第9章遗传算法章遗传算法第第10章学习规则集合章学习规则集合第第11章分析这习章分析这习第第12章归纳和分析学习的结合章归纳和分析学习的结合第第13章增强学习章增强学习数据挖掘,机器学习和统计l数据挖掘是在人工智能(AI)和统计分析基础上发展起来的,这两门学科都致力于模式发现和预测模式发现和预测。l数据挖掘不是为了替代传统的统计分析技术。相反,他是统计分析方法学
19、的延伸和扩展。大多数的统计分析技术都基于完善的数学理论和高超的技巧,预测的准确度还是令人满意的,但对使用者的要求很高。而随着计算机计算能力的不断增强,我们有可能利用计算机强大的计算能力只通过相对简单和固定的方法完成同样的功能。一些新兴的技术同样在知识发现领域取得了很好的效果,如SVM和决策树,在足够多的数据和计算能力下,他们几乎不用人的关照自动就能完成许多有价值的功能。l数据挖掘就是利用了统计和人工智能技术的应用程序,他把这些高深复杂的技术封装起来,使人们不用自己掌握这些技术也能完成同样的功能,并且更专注于自己所要解决的问题。一、数据挖掘的概念一、数据挖掘的概念(What is data mi
20、ning?)二、数据挖掘技术的发展(二、数据挖掘技术的发展(Development)三、功能三、功能(What data mining can do?)四、应用(四、应用(Application)五、五、DM的处理流程的处理流程 六、六、DM的研究发展方向的研究发展方向 七、一些流行的数据挖掘软件七、一些流行的数据挖掘软件 数据挖掘的定义数据挖掘的定义 数据挖掘的历史虽然较短,但从数据挖掘的历史虽然较短,但从2020世纪世纪9090年代以来,年代以来,它的发展速度很快,加之它是多学科综合的产物,目前还它的发展速度很快,加之它是多学科综合的产物,目前还没有一个完整的定义,人们提出了多种数据挖掘的
21、定义,没有一个完整的定义,人们提出了多种数据挖掘的定义,例如:例如:SASSAS研究所(研究所(19971997):):“在大量相关数据基础之上进行在大量相关数据基础之上进行数据探索和建立相关模型的先进方法数据探索和建立相关模型的先进方法”。BhavaniBhavani(19991999):):“使用模式识别技术、统计和数学使用模式识别技术、统计和数学技术,在大量的数据中发现有意义的新关系、模式和趋势技术,在大量的数据中发现有意义的新关系、模式和趋势的过程的过程”。关键词:大量关键词:大量数据挖掘的定义数据挖掘的定义韩家炜韩家炜简单的说,DM就是从大量数据里挖掘或提取有用的知识。广义的说,DM
22、是一个从存储在Database/datawarehouse或其它介质里的大量数据中识别有效的、新颖的、有潜在价值的以及最终可理解的模式的非常规的过程。技术上的定义,DM就是从大量的、不完全的、有噪声的、模糊的、随机的实际应用数据中,提取隐含在其中的、人们事先不知道的、但又是潜在有用的信息和知识的过程。数据数据:Staticnumericdata:1,2,3(Time)SeriesData(thedatarelatedtotimechange)Stockanalysis,Bankaccount,Sensordataetc.BioinformaticsSpatialData(thedatarela
23、tedtospatialorgeographicalinformation,GIS)RemoteSensing,CensusTextData(word,sentence,journaletc.)Weblogmining,MachinetranslateMultimediaData(figure,image,hyper-text,soundetc.)Content-basedImageRetrieval一、数据挖掘的概念(Whatisdatamining?)二、数据挖掘技术的发展(Development)三、功能(Whatdataminingcando?)四、应用(Application)五、D
24、M的处理流程六、DM的研究发展方向七、一些流行的数据挖掘软件Majorreason:Thewidelyavailabilityofhugeamountsofdataandtheimminentneedforturningsuchdataintousefulinformationandknowledge.数据挖掘技术是1、必然:必然:网络之后的下一个技术热点2、数据挖掘技术的动力:数据挖掘技术的动力:数据爆炸但知识贫乏3、数据挖掘技术的实现基础:数据挖掘技术的实现基础:计算机技术的发展数据挖掘技术的实现基础数据挖掘技术的实现基础对这种技术进行支持的三种基础技术:-海量数据搜集 -强大的多处理器计
25、算机 -数据挖掘算法Friedman列举的四个主要的技术理由:-超大规模数据库的出现,例如商业数据仓库和计算机自动收集的数据记录;-先进的计算机技术,例如更快和更大的计算能力和并行体系结构;-对巨量数据的快速访问;-对这些数据应用精深的统计方法计算的能力。1、1989年,USADetroit,召开的11th国际人工智能联合会议的专题讨论会上,首次提出KDD的概念2、1995年在Canada蒙特利尔召开的第一届知识发现和数据挖掘国际学术会议,作为人们重新认识数据、认识存储、认识数据统计和分析的新的起点,唤来了知识发现和数据挖掘理论及应用研究的热潮。美国计算机学会(ACM)于当年提出了数据挖掘的概
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- DM1序论.ppt 上海 DM1 序论 ppt
限制150内