展开模型和优势模型在职业兴趣测验中的比较研究

发布时间：2022-04-01 10:24:56 | 浏览次数：

方平，邓希冯，姜媛

摘要：该研究调查了展开模型（GGUM）和优势模型（GRM）对职业兴趣测验反应数据的拟合情况，并对展开模型和优势模型两种测验编制方法在职业兴趣测验中进行了比较。结果发现：（1）展开模型的模型拟合情况和测量精度优于累积模型，两种模型对被试能力参数估计的差异主要体现在极端被试上，对兴趣水平极端高的被试，展开模型的估计值更精确；（2）采用展开模型编制的测验在信度上远远高于Likert方法编制的测验，中间区域题目的增加提高了测验的信度，但两种方法在测验的效标关联效度上没有差异。结果表明，在职业兴趣的测量上，展开模型更精确；在职业兴趣测验的编制上，GGUM和Likert法没有差异，反而Likert法具有简便、易懂的优势。

关键词：展开模型；优势模型；职业兴趣

中图分类号：B841.2文献标识码：A文章编号：1003-5184（2012）05-0447-07

1 引言

在心理测量中，被试对一组题目的反应有两种基本的模式——优势型反应模式和展开型反应模式，这两种不同的反应模式遵循着不同的反应原理，适用于不同的测量类型。优势模型通常用于态度和人格量表的编制中（Roberts，Laughlin，& Wedell，1999），这种方法最初由Likert提出，后来Coombs（1964）将这种方法称为优势模型，它假设当被试在特质连续体上的位置高于题目的位置时，被试会赞同题目，当被试位置低于题目位置时，被试就不会赞同题目（Coombs，1964），项目-总分相关，区分度分析，删除题目后的Cronbach α系数，主成份分析是优势模型中选择项目的常用方法，因此，如果项目同其它项目有高相关、同大多数题目在一个因素上有高载荷，这些项目就会被选择，这样的结果是只有在所测特质上水平相对极端（不管正性或负性）的题目会被挑选出，偏中性的题目将不会被选择因为它们同其它题目的相关不会很高，在同一个因子上的载荷也不如其它更极端的题目高（Van Schuur & Kiers，1994）。

与优势模型相对应的是展开模型，又称为理想点模型。Thurstone（1928）发表论文“态度可以被测量”，他在论文中描述了他的量表编制方法，后来Coombs将他的方法称为理想点模型，理想点模型假设个体会同意一道题取决于个人和题目位置的接近程度，不同意有两种原因：个体水平高于题目水平和个体水平低于题目水平。Thurstone的方法主要用于态度和人格的测量和量表编制中。在量表编制中，展开模型试图使题目覆盖态度结构或人格特质的全部范围，就测量而言，这种方法假设当题目接近个体的态度或人格水平时，个体更可能同意题目，当题目远离个体的态度或人格水平时，不管哪种方向，个体都不太可能同意题目，因此，有必要纳入更多的中性题目到量表中，对中间区域的被试才能获得所测特质的准确估计。

展开模型是近年来心理测量研究中的热点问题，现有研究发现态度和人格测量中理想点模型更合适（邓稳根，戴海琦，黄海，戴慧群，2009；郭庆科，苗金凤，王昭，2006；Scherbaum，Finlinson，Barden，& Tamanini，2006），于是近年来开始有研究尝试使用IRT展开模型编制测验。展开模型和累积模型所选择的题目的难度分布不同，展开模型编制方法增加了中间水平的题目，但这些题目的增加是否一定会带来测验信效度的改善还没有明确的结论，而且相对于传统的Likert编制方法，展开模型理论复杂，结果解释困难，被试量要求更高，所以有必要探讨展开模型的编制方法是否具有明显的优势。研究将比较GGUM 和GRM模型在《升学指导测验》各分量表反应数据上的拟合差异，然后用GGUM编制方法和Likert编制方法对量表进行修订并进行比较，以便获得展开模型与优势模型在兴趣测验编制中优劣的证据。

2 方法

2.1 被试

某211大学1250 名大三学生参加了测试，有效问卷1182份，其中男生706人，女生544人，所有被试的平均年龄为20.4岁，标准差为1.06。

2.2 材料

研究材料为《升学与就业指导测验》，该量表由张厚粲等（2004）编制。测验分为社会型、经营型、事务型、技术型、研究型、自然型、艺术型7个分测验，测验的题本共140题。题本从结构上包括2个部分，第一部分是“我喜欢的职业活动”，有96题；第二部分“我喜欢的日常活动”，有44题。采用6点计分，各分量表的α系数在0.89～0.92之间。

2.3 统计工具

使用GGUM和PARSCLE估计展开模型和优势模型下的题目参数和被试参数，使用MODFIT计算两种模型下实际项目特征曲线和估计的项目特征曲线的一致程度，比较两种模型的模型拟合和测量精度。

3 结果

3.1 兴趣测验模型拟合比较

3.1.1 单维性检验

单维性假设是IRT的前提之一，是正确使用IRT的先决条件，研究采用主成份分析的方法来考验测验的单维性问题，且计算第一与第二特征根比值，根据单维性的要求，最大特征根与次大特征根的比值如果大于某一个固定值时，可以认为该测验为单维性测验，Hambleton的标准，则认为这个值等于3就可以认为测验符合单维性假设，可以进行分析。如表1所示，7个分测验的最大特征根与次大特征根的比值均超过3，可以认定测验为单维性测验。

3.1.2 模型拟合比较

在心理测量中，经常采用单个项目、两项目对和三项目组的χ2/df指数来考察项目的拟合情况。单个项目的χ2/df检验对单维性的违反不敏感，两项目对和三项目组对模型与数据的歪曲起放大作用，可检测出异常反应模式。Drasgow 等人认为这个统计量对比较几个竞争的IRT模型是非常有用的，最佳拟合的模型对单个项目和两项目对以及三项目组都有较小的校正的χ2/df。

从表2中可以发现，在社会、经营、事务、技术、研究、自然、艺术7个分量表中，GGUM在单个项目和两项目对以及三项目组都有较小的校正的χ2/df。表2的结果表明累积模型比展开模型更拟合职业兴趣测验。

3.1.3 测量精度对比

模型有效性的另一个衡量标准是模型的测量精度，即GGUM 与GRM 相比是否提供更大的信息量。表3中列出了2个模型在è=-2、è=-1、è=0、è=1、è=2五个能力点上的平均信息量，由于展开模型和累积模型的项目反应曲线的差异主要体现在极端能力被试上，表3还列出了è=2、è=3、è=4三个极端高的能力点和è=-2、è=-3、è=-4三个极端低的能力点上的平均信息量，从表3中可以看出模型的测量精度。

从表3中可见，在社会、经营、事务、技术、研究、自然、艺术7个分量表中，GGUM与GRM在＼[-4，2＼]的特质范围内提供的信息量十分接近，在大于2的极端兴趣区，GGUM的测量精度要明显高于GRM，这说明展开模型对职业兴趣的估计更准确。

3.2 基于累积模型的技术类兴趣问卷修订

3.2.1 项目分析

以每个项目得分与总分之间的积差相关系数作为区分度的指标。相关系数显著说明该项目能够代表所要测量的内容或主题。研究中问卷所有题项的相关系数为0.42～0.70，且相关系数显著性p<0.001。以上分析表明，这些项目的区分度非常理想。

3.2.2 因素分析

研究对1400份问卷中技术型分量表的有效数据进行因素分析，根据题项的负荷值来确定最后要保留的题项，结果显示，问卷KMO检验值为0.941，Bartlett球形检验值为5684.376，显著水平为0.000，极其显著，表明数据适宜作因素分析。由碎石图可知抽取的主要因素有1个，解释总变异的38.05%，题目的因素载荷见表4。

按因素载荷大于4的标准，删除T10、T40，保留18道题构成最终量表。

3.2.3 信度分析

研究采用信度检验中最常用的Cronbach α系数来评估问卷的信度，并利用Alpha if item deleted判断是否保留题目，若删除某个题目，α系数增大，则表示可以删除该题目。分析结果没有题目需要删除。信度分析结果表明问卷信度较高。

3.2.4 效度分析

以学生对专业的满意度作为效标，对所学专业是否满意是被试综合各方面影响因素后对所学专业的一个综合反映，是职业兴趣研究中一个主要的考察指标。Nafziger和Holland（1975）指出，当个体职业兴趣类型与环境类型一致时，个体的满意感会较多，工作变动或工作调换的概率较小。如果我们的职业兴趣量表是有效的话，那么某个环境类型的个体在量表上对应的职业兴趣类型上得分越高，个体会产生更多的满意感，更多的学习投入，更愿意留在原环境类型中，换专业的意愿更小。

研究以四川某综合性大学电气工程、电子信息工程、工程力学三个技术类专业二年级（197人）的学生为样本，采用皮尔逊相关作为指标值。考察学生的兴趣得分与满意度的关系。效标效度的各项指标值见表6。

3.3 基于展开模型的技术类兴趣问卷修订

3.3.1 人-物双极维度的验证

由于展开模型的编制思想属于Thurston编制法，量表包含正向和负向各个水平的题目，因此以Prediger的维度理论对技术分量表进行修订，Prediger认为社会型、技术型在一个维度上，位于人-物维度的左右两端。人-物双极维度的合理性是量表编制的前提，下文对这一维度进行验证。

研究者发现在对Holland兴趣数据进行因素分析的研究中往往能得到3个主要因素：一般因素、人-物因素、数据-观念因素，Prediger（1982）和其他研究者（Jackson，1977，1986）认为一般因素是使兴趣测验各分量表的关系变得模糊的反应偏差，因此他们建议将一般因素移除。理论上技术类题目和社会类题目位于人-物维度的两端，研究中所有题目在第一个公因子上都有较高的载荷，两类题目在第二个公因子上的载荷分别为负值和正值，因此分别命名为：一般因素和人-物因素。

3.3.2 单维性检验

Davison（1977）发现当数据拟合一个单维展开模型时，主成份分析将得到两个主成份，并且项目载荷形成一个扇形模式，GGUM的模拟数据也得到了相同的结论，因此，主成份分析可以用来识别不太符合GGUM单维性假设的题目。Roberts基于模拟研究提出当题目在前两个主成份上的共同度大于或等于0.3时，可以认为题目符合单维性。根据这一标准，删除T10、T43、T92、T122、T13、T14、T100共7道题目。

3.3.3 项目参数

前文已经对数据单维性进行验证，接下来可以用GGUM2004估计测验的参数。将共1182名被试、33道6级计分题的作答数据导入GGUM2004软件中估计，可以得到题目的初始参数，软件为默认设置，迭代次数为外循环200次，内循环20次，迭代精度为0.001。这样就可以一次性估计出题目和被试参数，并能得到题目的拟合参数。项目拟合度用infit和outfit评估，没有题目拟合度明显差于其它题目，出于和Likert方法比较的目的，问卷最终保留18道题目，题目参数见表8。

由表8可知，全部项目的位置参数介于标准范围＼[-4，+4＼]，项目区分度为0.85～2.55，达到标准（Roberts et al.，2000），基本符合展开模型对项目区分度的要求。根据项目的信息量从高到低选择18道题，保留T16、T32、T40、T57、T62、T83、T114、T116、T139、T44、T49、T60、T64、T70、T93、T103、T123、T135构成最终问卷。

3.3.4 测验的信度

项目反应理论中测验的信度可以用测验信息函数表示。如果信息量大，那么被试在那个水平上的特质就能得到准确的估计，估计值就会更接近被试真实水平。根据漆树青等人的研究，测验标准差应小于等于0.20，即测验的总信息量应到达25以上时测验精度非常可靠。由图中可以看出本测验的最大信息量远远大于25，符合要求。

3.3.5 测验的效标关联效度

估计题目参数的同时可以获得被试的特质参数。研究以四川某综合性大学电气工程、电子信息工程、工程力学三个技术类专业二年级（197人）的学生为样本，采用皮尔逊相关作为指标值。考察学生的兴趣θ值与满意度的关系。效标效度的各项指标值见表9。

3.4 两份测验的比较

3.4.1 测验题目的难度分布

为便于比较，使用GGUM对量表1进行了分析，得到了题目参数和被试参数，两份测验题目的难度分布见图2和图3，测验一中题目主要集中在中等偏高的特质区，中间区域没有题目，测验二在中间及中等偏高的特质区都有分布。

3.4.2 测验信度的比较

从图4可以看出，由于测验二中含有位于中间位置的题目，测验二的信息函数远远大于测验一，测验二能提供更高的测量精度。

3.4.3 测验效标关联效度的比较

表10列出了两份测验的效标关联效度，被试参数都由GGUM得出。为了解两份测验效标关联效度的差异，下面对相关系数的差异进行显著性检验。先将两个相关系数分别转化成z值，然后根据公式z=z1-z2〖KF（〗1n1-3+1n2-3〖KF）〗进行Z检验，z值=0.46，小于z分布在95%显著水平上的临界点1.96，也就是说，虽然在样本中测验二被试兴趣水平与专业满意度的相关程度要强于测验一，但是在总体中两种相关程度之间是没有差别的。

4 讨论

近年来，研究者发现在态度和人格测验中，展开模型更符合被试的反应机制，在职业兴趣测验中也得到了同样的结论。人格、态度、职业兴趣都是非认知性个体差异，兴趣跟态度、人格具有密切的联系，兴趣测验本身就是描述有关职业名称或活动的态度，兴趣也是人格的一个有机组成部分，Holland认为职业兴趣与人格之间存在很高的相关性，他将人格分为七种职业兴趣类型。职业兴趣还与其他人格因素有密切关系，元分析发现研究型与开放性、艺术型与开放性、社会型与愉悦性和外向性、经营型与外向性稳定相关（Larson，Rottinghaus，& Borgen，2002）。所以，职业兴趣同态度和人格一样更符合展开模型。

研究一结果表明，当被试反应符合理想点过程时，累积模型对持极端兴趣的个体参数估计不准确，一般情况，这种误差是可以忽略的，但有时持有极端兴趣的个体在一些兴趣研究中可能是极为重要的部分，比如，研究者可能想识别非常喜欢或非常不喜欢某类职业活动的个体，进而在一些潜在的探索性变量上与其他被试进行比较。很显然累积模型在识别这些个体上存在困难。

研究采用Likert方法编制的测验一主要由位置比较极端的题目构成，采用GGUM编制的测验二在潜在特质的中间区域和极端区域均有题目，对比两份问卷的信效度，测验二的信度远远高于测验一，中间区域题目的增加提高了测验的信度，但未改变测验的效标关联效度。将测验的信息函数值转化为经典测验的信度系数可以发现，两份测验都有非常高的信度，在测验误差很小的条件下，测验信度的提高对被试能力估计的影响是很小的。换句话说，展开模型测验编制方法的确具有优势，但这种优势没有多大价值。

展开模型远比累积模型复杂，Edwards和Kenney（1946）发现编制Thurstone量表的时间是Likert量表的2倍，这还不包括专家评分的时间，Barclay和Weaver（1962）发现编制一个Thurstone量表大约需要134个小时，而编制一个简单点的Likert量表需要的时间不到94个小时。而科学是偏好简约性的，Thurstone提出了理想点模型，但他也对因素分析法进行了发展，他应该也会同意我们应该坚持简单的模型，除非复杂模型能显著提高测验的有效性（Pitt & Myung，2002；Preacher，2006）。

5 结论

职业兴趣的测量上，展开模型拟合更佳，测量更精确；职业兴趣测验的编制上，GGUM在测验信度上有优势，两种方法的效标关联效度没有差异，反而Likert法具有简便、易懂的优势。参考文献

邓稳根，戴海琦，黄海，戴慧群.（2009）.展开模型对EPQ反应数据的拟合调查.心理与行为研究，7（4），300-303.

郭庆科，苗金凤，王昭.（2006）.IRT 展开模型及对非累积反应机制的检测.心理学探新，26（1），67-69.

张厚粲，冯伯麟，袁坤.（2004）.我国中学生职业兴趣的特点与测验编制.心理学报，（1），89-95. Barclay，J.E.，& Weaver，H.B.（1962）.Comparative reliabilities and ease of construction of Thurstone and Likert attitude scales.The Journal of Social Psychology，68，109-120.

Coombs，C.H.（1964）.A theory of data.New York：Wiley.

Edwards，A.L.，& Kenney，K.C.（1946）.A comparison of the Thurstone and Likert techniques of attitude scale construction. Journal of Applied Psychology，30，72-83.

Jackson，D.N.（1977）.Manual for the Jackson Vocational Interest Survey.Port Huron，MI：Research Psychologists Press.

Jackson，D.N.（1986）. Career direction inventory manual.Port Huron，MI：Research Psychologists Press.

Larson，L.M.，Rottinghaus，P.J.，& Borgen，F.H.（2002）.Meta-analyses of big six interests and big five personality factors. Journal of Vocational Behavior， 61（2），217-239.

Nafziger，D.H.，& Holland，J.L.（1975）.Student-college congruency as a predicator of satisfaction. Journal of Counseling Psychology， 22，132-139.

Pitt，M.A.，& Myung，I.J.（2002）.When a good fit can be bad.Trends in Cognitive Sciences，6，421-425.

〖JP3〗Preacher，K.（2006）.Quantifying parsimony in structural equation modeling.Multivariate Behavioral Research， 41，227-259.

Prediger，D.J.（1982）.Dimensions underlying Holland"s hexagon：Missing link between interests and occupations？Journal of Vocational Behavior， 21，259-287.

Roberts，J.S.，Laughlin，J.E.，& Wedell，D.H.（1999）.Validity issues in the Likert and Thurstone approaches to attitude measurement.Educational and Psychological Measurement， 59，211-233.

Roberts，J.S.，Donoghue，J.R.，& Laughlin，J.E.（2000）.A General Item Response Theory Model for Unfolding Unidimensional Polytomous Responses.Applied Psychological Measurement，（1），3-32.

Scherbaum，C.A.，Finlinson，S.，Barden，K.，& Tamanini，K.（2006）.Applications of item response theory to measurement issues in leadership research.Leadership Quarterly， 17，366-386.

Van Schaur，W.H.，& Kiers，H.A.L.（1994）.Why factor analysis often is the incorrect model for analyzing bipolar concepts，and what model to use instead.Applied Psychological Measurement， 18，97-110.

Unfolding Model and Dominance Model in Vocational Interest Test

Fang Ping1，Deng Xifeng1，Jiang Yuan2

（1.Department of Psychology，Capital Normal University，Beijing 100048；2.Division of Sport Psychology，Beijing Sport University，Beijing100084）

Abstract：This article investigate the differences between the Unfolding Model and Dominance Model in vocational interest measurement and sale development.Results suggested that（1）GGUM can fit the interest data better and provide more information than cumulative IRT models，GGUM can provide more accurate θ estimate for person with extreme high interest；（2）By adding more moderate-level Items，scale developed by GGUM have an advantage over scale developed by Likert technique in higher test reliability.But two way showed no difference in predictive validity.Therefore，GGUM was a more accurate method in the measurement of vocational interest；GGUM and Likert techniques make no difference in the development of vocational interest scale，but Likert techniques had the advantage of simplicity and practicality.

Key words：Unfolding Model；Dominance Model；vocational interest

推荐访问：模型测验展开兴趣优势

上一篇：机械振动与模态分析课程体系改革与探索
下一篇：在教学中进行德育渗透

本文标题：展开模型和优势模型在职业兴趣测验中的比较研究
链接地址：http://www.yzmjgc.com/youxiufanwen/2022/0401/38992.html

版权声明：
1.赢正文档网的资料来自互联网以及用户的投稿，用于非商业性学习目的免费阅览。
2.《展开模型和优势模型在职业兴趣测验中的比较研究》一文的著作权归原作者所有，仅供学习参考，转载或引用时请保留版权信息。
3.如果本网所转载内容不慎侵犯了您的权益，请联系我们，我们将会及时删除。

展开模型和优势模型在职业兴趣测验中的比较研究

本栏目阅读排行

栏目最新

展开模型和优势模型在职业兴趣测验中的比较研究

相关阅读

猜你喜欢

本栏目阅读排行

栏目最新