欢迎来到得力文库 - 分享文档赚钱的网站! | 帮助中心 好文档才是您的得力助手!
得力文库 - 分享文档赚钱的网站
全部分类
  • 研究报告>
  • 管理文献>
  • 标准材料>
  • 技术资料>
  • 教育专区>
  • 应用文书>
  • 生活休闲>
  • 考试试题>
  • pptx模板>
  • 工商注册>
  • 期刊短文>
  • 图片设计>
  • ImageVerifierCode 换一换

    人事测评测评的质量评价.ppt

    • 资源ID:66145320       资源大小:469.50KB        全文页数:60页
    • 资源格式: PPT        下载积分:16金币
    快捷下载 游客一键下载
    会员登录下载
    微信登录下载
    三方登录下载: 微信开放平台登录   QQ登录  
    二维码
    微信扫一扫登录
    下载资源需要16金币
    邮箱/手机:
    温馨提示:
    快捷下载时,用户名和密码都是您填写的邮箱或者手机号,方便查询和重复下载(系统自动生成)。
    如填写123,账号就是123,密码也是123。
    支付方式: 支付宝    微信支付   
    验证码:   换一换

     
    账号:
    密码:
    验证码:   换一换
      忘记密码?
        
    友情提示
    2、PDF文件下载后,可能会被浏览器默认打开,此种情况可以点击浏览器菜单,保存网页到桌面,就可以正常下载了。
    3、本站不支持迅雷下载,请使用电脑自带的IE浏览器,或者360浏览器、谷歌浏览器下载即可。
    4、本站资源下载后的文档和图纸-无水印,预览文档经过压缩,下载后原文更清晰。
    5、试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓。

    人事测评测评的质量评价.ppt

    一、误差一、误差(一)误差的含义一)误差的含义F两两层含含义:F其一,其一,误差是由与差是由与测量目的无关的量目的无关的变因引起的;因引起的;F其二,其二,误差是不准确或不一致的差是不准确或不一致的测量量结果。果。F一种是随机一种是随机误差,又叫可差,又叫可变误差,差,这是由与是由与测量目的无关的偶然因素引起而不易控制的量目的无关的偶然因素引起而不易控制的误差,差,它使多次它使多次测量量产生不一致的生不一致的结果。果。这类误差的差的方向和大小的方向和大小的变化完全是随机的,无化完全是随机的,无规律可循。律可循。(二)误差的主要表现形式二)误差的主要表现形式F另一种是系统误差,又称常定误差,这是由与另一种是系统误差,又称常定误差,这是由与测量目的无关的变因引起的一种恒定而有规律测量目的无关的变因引起的一种恒定而有规律的效应,稳定地存在于每一次测量中,此时虽的效应,稳定地存在于每一次测量中,此时虽然测值一致,但不正确。可见,系统误差只影然测值一致,但不正确。可见,系统误差只影响测值的准确性,而随机误差既影响准确性又响测值的准确性,而随机误差既影响准确性又影响一致性。影响一致性。(三)人事测评的误差类型(三)人事测评的误差类型F第一第一类是来源于人事是来源于人事测评工具本身的工具本身的误差;差;F第二第二类是来源于是来源于测评实施施过程的程的误差;差;F第三第三类是来源于是来源于测评实施者的施者的误差;差;F第四第四类是来源于是来源于应试者的者的误差。差。1、测评工具和方法的因素、测评工具和方法的因素F物理、化学物理、化学测评工具越精密、工具越精密、测评方法越科学,方法越科学,则误差越小;反之差越小;反之则误差越大。差越大。F人事人事测评不像物理、化学不像物理、化学测量,人的才能、个性、量,人的才能、个性、品德等品德等许多特性都是无法直接多特性都是无法直接测量的,而且人事量的,而且人事测评常常有主常常有主观的因素。的因素。F因此,人事因此,人事测评工具和方法造成的工具和方法造成的误差比物理化差比物理化学学测量要大得多。量要大得多。测评工具和方法造成误差的因素测评工具和方法造成误差的因素F(1)测评工具所工具所测评的行的行为和特性与目和特性与目标上所上所欲欲测评的行的行为和特性之和特性之间的不一致。比如,的不一致。比如,测评情情绪稳定性的所有定性的所有测评题目都目都应该只只测评情情绪稳定性,而定性,而实际上,有的上,有的题目目还测了情了情绪稳定性以定性以外的特性,外的特性,这些特性就成了干些特性就成了干扰因素,是因素,是测评误差的来源。差的来源。(2)测评指标和测题抽样的代表性)测评指标和测题抽样的代表性F一般来一般来说,测评指指标、测题越多,越多,则代表性越好,代表性越好,误差也就越少。差也就越少。F因因为经济、可行性等原因,不可能把所有与、可行性等原因,不可能把所有与测评目目的有关的所有指的有关的所有指标都作都作为测评的指的指标,也不可能把,也不可能把所有相关的全部所有相关的全部测题都都选作作测试题目,目,F只能只能选有代表性的指有代表性的指标、有代表性的、有代表性的测题样本用来本用来作作测评之用。之用。测题的内容和的内容和难度分布是度分布是测题代表性代表性的重要指的重要指标。(3)测题的格式和用词、测评程序等因)测题的格式和用词、测评程序等因素素F有的有的题目格式(如是非目格式(如是非题)具有可猜)具有可猜测性;性;F有的有的题目格式(所有的主目格式(所有的主观题)其)其评分具有主分具有主观性;性;F测题的用的用词有歧有歧义或用或用词不是很准确不是很准确F这些都是引起些都是引起测评误差的来源。差的来源。2、测评的具体实施过程中的偶然因素、测评的具体实施过程中的偶然因素F随着随着电脑等等测评工具的使用,工具的使用,测评实施已施已经越越来越来越标准化,有准化,有测评实施造成的施造成的误差也越来越差也越来越少。少。F但是,但是,测评的具体的具体实施施过程中程中还是会有是会有许多不多不可可预期的偶然因素。期的偶然因素。不可预期的偶然因素种类不可预期的偶然因素种类F(1)环境干境干扰。测评环境的温度、通境的温度、通风、噪音、噪音、照明、突然断照明、突然断电等因素,都可以等因素,都可以产生生误差。差。F(2)测评纪律的控制不好。律的控制不好。测评纪律控制不律控制不严格,出格,出现有人作弊(如代考、抄有人作弊(如代考、抄袭、相互交流等)、相互交流等)、泄露、泄露测评题目等,也会造成目等,也会造成测评误差。差。F(3)错误操作。操作。误读指指导语、对指指导语错误理理解、解、误答(如自己答的答案是答(如自己答的答案是A,却,却选了了C)、)、记录错误、记分分错误等因素。等因素。3、被测评者因素、被测评者因素F被被测评者因素被者因素被测评者是活生生的人,人是非者是活生生的人,人是非常复常复杂的,的,诸多生理、心理因素都可以成多生理、心理因素都可以成为干干扰人事人事测评目的的因素。目的的因素。F可可导致人事致人事测评误差的被差的被测评者因素大致有:者因素大致有:F(1)生理因素。)生理因素。身体健康因素、身体健康因素、饥饿与与过饱、疲疲劳程度、生理周期等都可以影响人格程度、生理周期等都可以影响人格测试的的结果。果。F(2)动机水平机水平F每个被每个被测评者都有参加者都有参加测评的目的,的目的,这个目的个目的可以可以导致被致被测评者故意掩者故意掩饰自己,采取装好或自己,采取装好或装坏的装坏的倾向性回答,其向性回答,其结果就不能反映出被果就不能反映出被测评者的真者的真实情况。情况。F不同的被不同的被测评者其者其动机水平不一机水平不一样,因而掩,因而掩饰程度也会有所不同。程度也会有所不同。F不同的不同的动机水平可以引起被机水平可以引起被测评者不同的者不同的应激激状状态,动机机过分分强烈会引起被烈会引起被测评者者产生生测评焦焦虑,而,而动机不足机不足则会引起被会引起被测评者者对测评采采取敷衍了事的取敷衍了事的态度,。度,。F在人格、在人格、态度、度、动机等机等测评中,被中,被测评者的者的动机水平常常会是机水平常常会是测评被被测评者因素者因素产生生误差的差的最重要的因素。最重要的因素。F(3)受教育程度、价受教育程度、价值观等文化因素。等文化因素。被被测评者受教育程度不同,其成者受教育程度不同,其成长的文化背景不同,的文化背景不同,价价值观不同,会造成被不同,会造成被测评者者对测题的理解、的理解、答答题态度、答度、答题偏好等的不同,从而造成偏好等的不同,从而造成测评误差。差。F(4)有关有关经验。如果在如果在测评之前,被之前,被测评者已者已经具有与具有与测评有关的有关的经验,比如已,比如已经经历过类似的或同一似的或同一类型的型的测试从而掌握了有关的答从而掌握了有关的答题策略,就可能策略,就可能对测评结果果产生生较大的影响。大的影响。F有人曾做有人曾做过试验,让5名熟悉、已知其智力水平名熟悉、已知其智力水平的学生的学生进行知行知觉和和图形推理的大量形推理的大量练习,然后,然后再再进行瑞文行瑞文图形智力形智力测试,结果果测得的得的结果比果比他他们的的实际智力高出不少。智力高出不少。4、主试因素、主试因素F主主试以貌取人、以貌取人、对被被测评者有偏者有偏见,可以造成,可以造成测评误差。差。F主主试不良的言行不良的言行举止止对被被试的心理状的心理状态干干扰、暗示、暗示、误导,可以造成,可以造成误差。差。F主主试评分的分的标准不一致,先准不一致,先紧后松、先松后后松、先松后紧、忽高忽低,或有意无意地修改忽高忽低,或有意无意地修改评分分标准,准,对某某些人特些人特别照照顾,都可以引起,都可以引起误差。差。总结总结F测评的的误差一般可以被分差一般可以被分为两大两大类:随机:随机误差差和系和系统误差。差。F随机随机误差是由偶然因素造成的,其差是由偶然因素造成的,其产生是随机生是随机的、无的、无规律的,因此其数律的,因此其数值大小也是随机大小也是随机变化、化、不确定的。它是引起不确定的。它是引起测评不一致的不一致的变因,与因,与测评信度有关。信度有关。F系系统误差,又称差,又称为常定常定误差或偏差。它是由与差或偏差。它是由与测验目的无关的因子引起的一种恒定的、系目的无关的因子引起的一种恒定的、系统的的变化,其数化,其数值大小具有一定的大小具有一定的规律性和律性和稳定性。它定性。它与与测评的效度有关。的效度有关。F习惯上,把随机上,把随机误差称差称为观察察误差或差或测评误差。差。从从这个意个意义上上讲,测评误差差这个概念所指个概念所指误差只差只是是测评分数所包含的分数所包含的误差(随机差(随机误差和系差和系统误差)差)的一部分(即随机的一部分(即随机误差)。差)。二、信度分析二、信度分析(一)信度的基本概念(一)信度的基本概念F信度又叫可靠性程度,用于分析一种信度又叫可靠性程度,用于分析一种测评方法所方法所得得结果的前后一致性水平,并以果的前后一致性水平,并以这种一致性程度种一致性程度为指指标来判断来判断测评的可靠性。的可靠性。F测验结果的可靠性与果的可靠性与测验结果受果受误差影响的程度差影响的程度密切相关。密切相关。F在人才在人才测评中中误差是不可避免的,只能尽可能追差是不可避免的,只能尽可能追求高的精度,把求高的精度,把误差控制在一个有差控制在一个有规律的范律的范围以以内,内,这样测量得到的量得到的结果才比果才比较稳定可靠。信度定可靠。信度实际上就是随机上就是随机误差的一种度量。差的一种度量。(二)信度系数及估计方法(二)信度系数及估计方法F信度指信度指标都用信度系数的形式呈都用信度系数的形式呈现。F信度系数是同一信度系数是同一样本在两种不同本在两种不同时间、不同情、不同情境条件或两境条件或两组不同不同评价材料价材料评定定结果之果之间的相的相关系数。关系数。F针对不同的不同的误差来源,信度可有不同的确定方差来源,信度可有不同的确定方法。法。F一般有以下几种一般有以下几种类型:重型:重测信度、复本信度、信度、复本信度、内部一致性信度、内部一致性信度、评分者信度。分者信度。1.重测信度重测信度F重重测信度又称信度又称为稳定性系数,它是估定性系数,它是估计测评跨跨时间的一致性程度,即用同一的一致性程度,即用同一测验,在两个不,在两个不同同时间里里对同一群体施同一群体施测两次,两次,这两次两次测验分分数的相关系数就是重数的相关系数就是重测系数。系数。F一个一个测验的重的重测系数越高,系数越高,说明明测评的的稳定性定性越好,越好,测评受随机因素的影响越小。受随机因素的影响越小。F在在获得重得重测系数系数时,最需要注意的是必,最需要注意的是必须根据根据测验的性的性质和目的来控制合理的和目的来控制合理的时间间隔。隔。F时间间隔隔长了,被了,被试的心理特征就会因的心理特征就会因为学学习、经历、教育培、教育培训等因素而等因素而发展展变化,使相关系化,使相关系数降低;数降低;F时间间隔短了,又会使首次隔短了,又会使首次测评时的的练习效果效果和和记忆效果的影响增大,从而造成了假性的高效果的影响增大,从而造成了假性的高相关。相关。2.复本信度复本信度F复本是指在内容、数量、格式、复本是指在内容、数量、格式、难度、平均数、度、平均数、标准差等各方面与原准差等各方面与原测评一一样的的测评,即功能等,即功能等值但但题目内容不同。两个等目内容不同。两个等值的的测验互互为复本。复本。F复本信度又称复本信度又称为等等值性系数,它是代表性系数,它是代表测评跨形跨形式的一致性,即在式的一致性,即在对被被试进行行测评以后以后间隔一定隔一定的的时间,运用复本再,运用复本再测评一次所一次所获得的复本相关得的复本相关系数。系数。F复本信度的高低反映了两个复本信度的高低反映了两个测验复本在内容上的复本在内容上的等等值性程度。性程度。F复本信度的复本信度的优点:适用于在点:适用于在长期追踪研究或期追踪研究或调查某些干涉某些干涉变量量对测验成成绩影响,同影响,同时减少了减少了辅导或作弊的可能性。或作弊的可能性。F当然,复本相关系数也有局限性:当然,复本相关系数也有局限性:F一方面,在一方面,在现实中,中,编制理想的复本常常很制理想的复本常常很难,有有许多多测评都没有复本。都没有复本。F另一方面,复本另一方面,复本测评也会受也会受练习的影响。的影响。3.内部一致性信度内部一致性信度F用重用重测相关系数和复本相关系数,都需相关系数和复本相关系数,都需测评两两次,不但要花次,不但要花较多的精力,而且受多的精力,而且受测者会受者会受练习的影响使第二次的影响使第二次测评失真。失真。F内部一致性系数内部一致性系数则不同,它只需要不同,它只需要测评一次,一次,它通它通过分析同一分析同一测评内部各内部各测评项目之目之间的相的相关系数的方法来估关系数的方法来估计信度系数。信度系数。F内部一致性系数反映的是跨内部一致性系数反映的是跨测题的一致性,即的一致性,即测评内部各部分之内部各部分之间是否具有同是否具有同质性。性。F内部一致性信度又分内部一致性信度又分为分半信度、同分半信度、同质性信度性信度和和系数。系数。(1)分半信度)分半信度F获得分半信度系数的方法是把一个得分半信度系数的方法是把一个测评分成两分成两个最个最为等等值的两半,并分的两半,并分别计算每位被算每位被试在两在两半半测验上的得分,再求出上的得分,再求出这两个分数的相关系两个分数的相关系数,从而来估数,从而来估计整个整个测评的信度。的信度。F因因为分半系数只是根据原分半系数只是根据原测题的一半的一半题目而来,目而来,而信度的大小又与而信度的大小又与测验的的长度有关,所以分半度有关,所以分半系数常常要比原系数常常要比原测验的信度低。的信度低。F为了校正了校正这个差异,常运用斯皮个差异,常运用斯皮尔曼曼-布朗公式:布朗公式:F rxx=2rhh/(1+rhh)F 其中,其中,rhh:两半:两半测验的相关系数;的相关系数;rxx:估:估计或修正后的信度。或修正后的信度。(2)同质性信度)同质性信度F同同质性信度不需要把性信度不需要把测评分分为两半,它是指两半,它是指测验内部的各内部的各题目在多大程度上考察了同一内容。目在多大程度上考察了同一内容。F所所谓的同的同质性是指所有的性是指所有的测验题目目测量的只是量的只是单一的特一的特质或内容,表或内容,表现为所有所有测验题目得分目得分的一致性。的一致性。F常用的常用的计算方法是算方法是库德德-理理查逊估估计方法方法。计算公式有算公式有库德德-理理查逊20号公式(号公式(简称称KR20)和)和21号公式(号公式(KR21)。)。KR20公式公式Fn为测验题目数,为测验题目数,pi为通过为通过i题的人数比例;题的人数比例;qi为未通过为未通过该题的人数比例;该题的人数比例;pi+qi=1;piqi为所有题目答对与为所有题目答对与答错人数百分比乘积的总和。答错人数百分比乘积的总和。F库德库德-理查逊信度系数的运用需要满足几个条件:所有测理查逊信度系数的运用需要满足几个条件:所有测题都采用二分法记分,即都采用题都采用二分法记分,即都采用0,1记分,答对记记分,答对记1分,分,答错记答错记0分;测验的项目难度比较接近;项目间的组间相分;测验的项目难度比较接近;项目间的组间相关相等。关相等。(3)系数系数F当当测验项目采用多重目采用多重记分(如人格分(如人格测验、态度度量表),量表),库德德-理理查逊信度就无法运用。克信度就无法运用。克伦巴巴赫提出了适用于各种赫提出了适用于各种记分情况的分情况的系数来估系数来估计信度。具体公式如下:其中,信度。具体公式如下:其中,Si为每一每一项目的目的方差;方差;Sx为测验总分方差。分方差。4、评分者信度、评分者信度F在人事在人事测评中,不同的中,不同的评分者其分者其观察角度、注察角度、注意力、意力、对被被试的偏的偏见等都会使等都会使评分的分的结果不一果不一致,因此,致,因此,评分者的分者的评判也是判也是误差的来源之一。差的来源之一。评分者信度就是指不同分者信度就是指不同评分者分者对同同样对象象进行行评定的一致性。定的一致性。F具体方法是:由两名具体方法是:由两名评分者分者对同一个被同一个被试样组进行行评分,再求两个分,再求两个评判分数的相关系数。判分数的相关系数。这种相关系数的种相关系数的计算可以用算可以用积差相关方法,也可差相关方法,也可以采用斯皮以采用斯皮尔曼等曼等级相关方法。相关方法。F如果如果评分者在三人以上,而且又采用等分者在三人以上,而且又采用等级记分分时,就要,就要用肯德用肯德尔和和谐系数来求系数来求评分者信度。公式分者信度。公式为:F其中,其中,K为评分者人数,分者人数,N为被被评定的人数或答卷数;定的人数或答卷数;Ri为每一个每一个对象被象被评等等级。(三)影响信度系数的主要因素(三)影响信度系数的主要因素F1.测验长度度 :在其他条件相等的情况下,:在其他条件相等的情况下,测验长度(度(题目的多少)越目的多少)越长,信度,信度值越高。因越高。因为测验越越长,题目取目取样或内容取或内容取样就越充分,就越充分,结果就越可靠,同果就越可靠,同时也避免猜也避免猜测题目的影响。目的影响。F2.样本本团体的性体的性质:一般而言,在其他条件不:一般而言,在其他条件不变的情况下,的情况下,样本本团体的分数分布范体的分数分布范围越大,越大,变异性越大,信度系数将越大。异性越大,信度系数将越大。样本本团体的异体的异质性越大,信度系数就越高。性越大,信度系数就越高。F3.测验难度:度:测验难度度对信度也会信度也会产生影响。生影响。F如果一个如果一个测验的的难度太低,大多数被度太低,大多数被试都可以都可以轻而易而易举地答地答对题目,目,测验分数会非常集中并分数会非常集中并聚在高分端;聚在高分端;F如果如果测验的的难度太高,多数被度太高,多数被试都只能凭猜都只能凭猜测答答题,所有分数都集中在低分端。,所有分数都集中在低分端。这样都会使都会使测量到的分数分布太窄,量到的分数分布太窄,导致信度降低。致信度降低。三、效度三、效度(一)(一)效度的含义效度的含义F人事人事测量的效度就是指量的效度就是指测量的有效性,即所采量的有效性,即所采用的用的测评工具工具对其所要其所要测评的特性的特性测量到什么量到什么程度的估程度的估计。F一是效度是一是效度是针对测验结果的。果的。F二是效度是二是效度是针对某种特定的某种特定的测评目的而存在的。目的而存在的。F三是效度是三是效度是连续性的,是一个关于程度的估性的,是一个关于程度的估计。(二)效度的类型及估计方法(二)效度的类型及估计方法F一般把效度分一般把效度分为内容效度、构思效度和效内容效度、构思效度和效标关关联效度三效度三类,F这三三类效度是相互效度是相互联系的,一个好的系的,一个好的测评通常可通常可以用一种或一种以上的效度来表示。以用一种或一种以上的效度来表示。1.内容效度内容效度F内容效度是内容效度是检查测验内容是否是所欲内容是否是所欲测量的行量的行为领域的代表性取域的代表性取样的指的指标,即是即是说指指标与与标准准是否符合是否符合该类人人员的功能特征。要素的的功能特征。要素的设计与与标准的准的编制成制成为鉴定定测评效度的内容。常效度的内容。常见方方法:法:F(1)通)通过对照内容范照内容范围来估来估计F(2)评分者信度分者信度F(3)统计分析分析2.构思效度构思效度F构思效度是指构思效度是指测验能能够测量到理量到理论上的构思或特上的构思或特质的程度。的程度。F所所谓的构思是指一些抽象的假的构思是指一些抽象的假设性的概念、特性性的概念、特性或或变量。如智力、量。如智力、创造力、言造力、言语流流畅性、焦性、焦虑、动机等。构思不能直接机等。构思不能直接测量,需要借助一定的量,需要借助一定的测评工具来反映。工具来反映。F构思效度的估构思效度的估计方法有方法有许多,多,总的来的来说,可以分,可以分为测验内部的方法和内部的方法和测验间方法两大方法两大类。3、效标关联效度、效标关联效度F效效标关关联效度是以效度是以测评分数和效度准分数和效度准则之之间的相的相关系数来表示关系数来表示测评效度的高低的,表效度的高低的,表现进行行预测的有效性程度。的有效性程度。这里效里效标是指考察是指考察测验效用的外效用的外在参照在参照标准,是一种可以直接、独立准,是一种可以直接、独立测量的行量的行为。F通常情况下,通常情况下,对一般一般职工来工来讲,其效,其效标应为产量与量与质量;量;对于科技人于科技人员应以以发明、明、创造及技造及技术成果的数量和效益成果的数量和效益为效效标;对管理人管理人员应以以工作效率、工作效率、职工工积极性极性调动程度和程度和经济效益效益为效效标;对领导人人员应以开以开发人才、开人才、开创局面和局面和社会、社会、经济效益效益为效效标。(三)影响效度的主要因素(三)影响效度的主要因素F(1)(1)受受测样本本F一个一个测验施施测于不同的于不同的样本,由于受本,由于受测者在年者在年龄、文化程度以及、文化程度以及经验背景上的差背景上的差别,效度就,效度就会随之不同,因此,受会随之不同,因此,受测样本的本的选取是用来考取是用来考察效度所依据的重要因素。察效度所依据的重要因素。样本容量的大小与本容量的大小与效度系数的高低也有一定关系。效度系数的高低也有一定关系。样本容量越大,本容量越大,测量量误差就会有相互抵消的差就会有相互抵消的趋势,由此会有助,由此会有助于提高于提高测验和效和效标测量的信度,同量的信度,同时有助于提有助于提高效度系数。高效度系数。F(2)效效标F选择适当的效适当的效标是是统计效度的先决条件。一个效度的先决条件。一个测验由于采用的效由于采用的效标不同,其效度可能会大相不同,其效度可能会大相径庭。甚至,由于效径庭。甚至,由于效标选择不当,可能不当,可能导致无致无法衡量法衡量测验的效度。的效度。F通通过以上的分析,我以上的分析,我们可以看出信度与效度的分可以看出信度与效度的分析是直接析是直接对测评结果果质量的考量的考查,而一个,而一个测验的的信度和效度在很大程度上取决于信度和效度在很大程度上取决于该测验的的题目参目参数数(难度和区分度度和区分度),编制和制和筛选具有适当参数的具有适当参数的题目是改善目是改善测验信度和效度的前提。我信度和效度的前提。我们根据根据试题结果果对组成成测验的各个的各个题目目进行分析,从而行分析,从而评价价题目好坏。目好坏。四、难度分析四、难度分析(一)难度的概念(一)难度的概念F难度是指度是指测验题目的目的难易程度,也是易程度,也是试题对被被试知知识和能力水平的适合程度的指和能力水平的适合程度的指标。F难度是一个相度是一个相对的概念,的概念,难度的高低与被度的高低与被试的水平直接相关。我的水平直接相关。我们在在说测量的量的难易易程度程度时,应该针对具体的被具体的被试。(二)难度的计算(二)难度的计算F1、以答、以答对百分比来估百分比来估计难度度F如果如果试题为二分法反二分法反应记分分项目,目,P值可以采可以采用通用通过率公式率公式计算。公式算。公式为:P=R/N F其中,其中,P为试题难度;度;R为答答对试题的人数;的人数;N为参加参加测验的的总人数。人数。F当被当被试人数人数较多多时,可以采用极端分,可以采用极端分组法求法求试题的的难度,先按度,先按测验总分的高低分的高低进行排序,然行排序,然后将被后将被试分成三分成三组:分数高的:分数高的27%被被试为高高分分组,分数最低的,分数最低的27%的被的被试为低分低分组,中,中间46%的被的被试为中中间组。分。分别计算高分算高分组和和低分低分组的通的通过率,再求率,再求试题的的难度。度。FP=(PH+PL)/2F其中,其中,PH和和PL分别代表高分组和低分组的通过分别代表高分组和低分组的通过率。率。(三)难度对测验的影响(三)难度对测验的影响F1.1.测验难度影响度影响测验分数的分布形分数的分布形态 F测验的的难度就越大,度就越大,测验分数就越是集中在低分分数就越是集中在低分段,其分数分布呈正偏段,其分数分布呈正偏态;相反,分数分布呈;相反,分数分布呈现负偏偏态。F2.2.测验难度影响度影响测验分数的离散程度分数的离散程度 F测验分数分数过高或高或过低,低,测验分数就会高度集中,分数就会高度集中,测验分数的离散程度就分数的离散程度就变小了。小了。F3.3.测验难度影响度影响测验的的鉴别能力能力 (四)测验难度的确定(四)测验难度的确定F确定合理的确定合理的测验难度才能使度才能使试题产生区分不同程生区分不同程度被度被试的最大效果。但的最大效果。但题目的目的难度水平究竟多高度水平究竟多高合适,依合适,依赖于于测验的目的、性的目的、性质、和、和题目形式。目形式。F 一般来一般来说,我,我们进行行测验的目的是要了解被的目的是要了解被试个个体体间的差异,所以在的差异,所以在选择题目目时,最好使,最好使试题的的平均平均难度接近度接近0.50 0.50,而各,而各题难度在度在0.500.500.200.20之之间。F此外,此外,对于不同的于不同的题型型应该有各自适宜的有各自适宜的难度。度。如是非如是非题难度度值应为0.750.75,而,而对于四于四择一一题目,目,难度度值约为0.630.63。五、区分度分析五、区分度分析(一)区分度的概念(一)区分度的概念F区分度又称区分度又称鉴别度,它是指度,它是指测验项目目对不同水不同水平的被平的被试反反应的的鉴别能力和区分程度。能力和区分程度。F若若项目目鉴别力高,力高,则能力能力强、水平高的被、水平高的被试得得分高,能力弱、水平低的被分高,能力弱、水平低的被试得分低,否得分低,否则就就没有没有鉴别力。力。F它是它是评价价测题质量,量,筛选测题的主要指的主要指标和依和依据。据。(二)区分度的估计方法(二)区分度的估计方法F1.1.鉴别度指数度指数F鉴别度指数是衡量区分度的一种最常用,也是度指数是衡量区分度的一种最常用,也是最最简便的方法,它是比便的方法,它是比较得分高和得分低的两得分高和得分低的两组被被试在在项目通目通过率上的差率上的差值。F一般思路一般思路为,当成,当成绩是是连续变量量时,可从分数,可从分数分布的两端各分布的两端各选择27%的被的被试组成高、低分成高、低分组,再分,再分别计算两算两组每道每道题目上的通目上的通过率,二率,二者之差就是各者之差就是各题目的目的鉴别度指数度指数D。F公式:公式:D=PH-PLF其中,其中,PH为高分高分组答答对该题的人数比率;的人数比率;PL为低分低分组答答对该题的人数比率。的人数比率。2.方差法方差法F方差表示一方差表示一组数据离散程度。方差大,数据分散。数据离散程度。方差大,数据分散。被被试在某一在某一试题上的得分越分散,上的得分越分散,则该题的的鉴别力越大。力越大。F在在进行行实际的的项目分析中,被目分析中,被试一般不能少于一般不能少于30人,人,这样使用下面公式才有效。使用下面公式才有效。3.内部一致性系数计算区分度内部一致性系数计算区分度F一般以一般以总分来衡量被分来衡量被试能力的高低,当被能力的高低,当被试总分分高高时,在某个,在某个项目上的得分也高;目上的得分也高;F总分低分低时,项目上的得分也低,目上的得分也低,说明明该项目和目和总分有一致性。分有一致性。F在在标准化和大准化和大规模的模的测验中,通中,通过考察考察项目和目和总分的相关,来分的相关,来测验各各项目所目所测查内容的一致性。内容的一致性。如果如果项目与目与总分高相关,分高相关,项目的目的鉴别力也就高。力也就高。4.项目与外部准则的相关项目与外部准则的相关项目效度分析项目效度分析F项目效度分析是考察被目效度分析是考察被试在在项目上反目上反应和在效和在效标上表上表现的关系的关系,即每个即每个测题所所测查的行的行为是否是否反映了被反映了被试在效在效标上的表上的表现。F相关系数就是相关系数就是项目通目通过率与效率与效标成成绩的相关系的相关系数。相关越高,表明数。相关越高,表明项目越具有区分的能力。目越具有区分的能力。(三)合理区分度的确定(三)合理区分度的确定F在上面已在上面已经谈到不同的到不同的计算方法会算方法会带来不同的来不同的区分度区分度值,也就是,也就是说区分度的区分度的值具有相具有相对性。性。F此外,区分度此外,区分度还与受与受测团体的同体的同质程度有关,程度有关,同同质性越性越强,区分度就越小。,区分度就越小。F所以,在确定合理的区分度所以,在确定合理的区分度时,我,我们既要考既要考虑采用哪种区分度指采用哪种区分度指标,以及,以及样本大小和特性外,本大小和特性外,还要考要考虑测验的目的、性的目的、性质和功能。和功能。

    注意事项

    本文(人事测评测评的质量评价.ppt)为本站会员(s****8)主动上传,得力文库 - 分享文档赚钱的网站仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知得力文库 - 分享文档赚钱的网站(点击联系客服),我们立即给予删除!

    温馨提示:如果因为网速或其他原因下载失败请重新下载,重复下载不扣分。




    关于得利文库 - 版权申诉 - 用户使用规则 - 积分规则 - 联系我们

    本站为文档C TO C交易模式,本站只提供存储空间、用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。本站仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知得利文库网,我们立即给予删除!客服QQ:136780468 微信:18945177775 电话:18904686070

    工信部备案号:黑ICP备15003705号-8 |  经营许可证:黑B2-20190332号 |   黑公网安备:91230400333293403D

    © 2020-2023 www.deliwenku.com 得利文库. All Rights Reserved 黑龙江转换宝科技有限公司 

    黑龙江省互联网违法和不良信息举报
    举报电话:0468-3380021 邮箱:hgswwxb@163.com  

    收起
    展开