机器学习入门机器学习入门 (6).pdf
《机器学习入门机器学习入门 (6).pdf》由会员分享,可在线阅读,更多相关《机器学习入门机器学习入门 (6).pdf(11页珍藏版)》请在得力文库 - 分享文档赚钱的网站上搜索。
1、教学目标(1 1)掌握)掌握“训练误差训练误差”和和“泛化误差泛化误差”的概念;的概念;(2 2)掌握)掌握“留出法留出法”和和“交叉验证法交叉验证法”两种评估方两种评估方法;法;(3 3)理解)理解“二项检验二项检验”、“t t检验检验”和和“交叉验证交叉验证t t检验检验”三种比较检验方法;三种比较检验方法;(4 4)了解)了解“偏差偏差”和和“方差方差”的概念和意义。的概念和意义。目目 录录2评估方法评估方法 3比较检验比较检验4偏差偏差1经验误差经验误差评估方法02泛化误差的评估测试集与训练集互斥(为什么?)测试集与训练集互斥(为什么?)例:例:老师出了10道习题供同学们练习,考试时老
2、师又用同样的这10道题作为试题,这个考试成绩能否有效反映出同学们学得好不好呢?(1 1)训练集()训练集(S S)(2 2)测试集()测试集(T T)数据集(数据集(D D)训练集S和测试集T的确定方法(1 1)留出法)留出法(2 2)交叉验证法)交叉验证法(3 3)自助法)自助法1、留出法例:例:D包含1000个样本,则训练集S为700个,测试集T为300个。若模型在T上有90个样本分类错误。则:错误率 E=(90/300)x 100%=30%精度=1-30%=70%。分层采样S和T的数据分布一致性。例:例:评估结果的计算多次评估取平均值。例:例:进行 100 次随机划分,每次产生一个训练/测试集用于实验评估,100 次后就得到 100个结果,而留出法返回的则是这 100个结果的平均值。2、交叉验证法例:例:(1 1)大小相似)大小相似(2 2)数据分布一致)数据分布一致(3 3)互斥)互斥P次k折交叉验证10种划分方式。共测试100次。例:例:10 次 10 折交叉验证1 1种划分方式种划分方式
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 机器学习入门机器学习入门 6 机器 学习 入门
限制150内