泉州市网站建设_网站建设公司_SSL证书_seo优化
2025/12/17 22:34:57 网站建设 项目流程

不少人在做研究时可能会遇到这样的场景:明明按照教程一步步把问卷数据做了信效度检验,却被一句“这些分析不能做”打回重来。很多人这才意识到——原来信效度分析并不是所有问卷的必做项目

一、非量表问卷vs量表问卷

在实际研究中,问卷有不同类型:有的是为了收集基本信息和态度倾向的普通调查问卷,有的则是基于理论框架构建的量表问卷。两者的用途、结构和统计要求完全不同,也决定了是否需要进行信效度检验。

1非量表问卷

非量表问卷是我们日常生活中最常见、最直白的问卷形式,其核心目的是收集事实信息或了解简单情况/态度,不依赖理论模型,不需要信效度分析。

1)题目特点

  • 题目多为单项、独立、直接提问式(如年龄、性别、满意度等);
  • 每道题就是一个独立变量,不需要合成“维度”或“分数”;
  • 不要求题目之间保持一致性,也不需要反映潜在结构;
  • 题型多样,包括单选题、多选题、填空题、排序题等。

2)题目举例

  • 客观事实: 如年龄、性别、职业、收入。
  • 具体行为: 如“您每天使用手机多长时间?”、“您最近一年内购买过几次电子产品?”
  • 简单的意见或选择: 如“您更喜欢哪种产品包装?”、“您从哪些渠道了解到我们的服务?”

3)信效度分析

不需要。因为每题都是独立测量点,没有构成“量表”的结构,不涉及整体信度与效度的分析。非量表问卷分析主要使用描述性统计:例如计算百分比、频数、进行交叉分析等。

4)非量表问卷分析思路

非量表类问卷的研究思路可以分成7个部分,分别是样本背景分析,样本特征、行为分析,基本现状分析,样本态度分析,差异分析,影响关系分析和其他,在具体分析时可以结合实际情况进行选择。

2、量表问卷

量表问卷是学术研究中常用的方法,其核心目的是测量“看不见的”“潜在变量/心理特质/行为倾向”等,题目之间具有结构性,必须做信效度分析。

1)题目特点

  • 由多个题目共同测量一个抽象概念(如工作满意度、使用意愿、自我效能)。
  • 题目高度相关,具有理论背景(心理学、管理学、社会学成熟模型)。
  • 通常采用 Likert 量表(1–5/1–7分)。
  • 最终计算的不是某一道题,而是某个维度得分或总体得分。

2)常见例子

  • 科技接受模型 TAM(感知易用性、感知有用性)
  • SERVQUAL 服务质量量表
  • 五大人格量表
  • 满意度量表、忠诚度量表、使用意愿量表
  • 心理测量问卷(焦虑量表、抑郁量表等)

3)信效度分析

必须做。因为量表测的是“潜在变量”,题目间的质量与结构需要信度和效度来验证。

4)量表问卷分析思路

量表问卷依据研究目的和主要方法的不同可分为多种类型,例如影响关系类、综合评价类、聚类样本类等,其中影响关系研究比较常见,分析思路举例如下:

更多问卷分析思路可点击查看下方文章,总结了常见的八类问卷分析思路详解:

【干货收藏】八类问卷分析思路,盘活你的问卷数据!

3、总结

是否需要做信效度分析,关键不在于问卷题目的多少,而在于这些题目是否共同指向某个潜在概念,构成可被测量的“维度”。

  • 当问卷中存在一组相互关联的题项,并能共同反映同一潜在变量时(一般每个维度需至少2–3个题目以支撑统计检验),就应当进行信度和效度分析,以验证该量表结构是否稳定、测量是否可靠。
  • 此外,即使量表来自文献、被前人反复使用过,也仍需基于你的样本重新做一次信效度检验,因为量表质量会随样本群体的不同而变化。
  • 相反,如果问卷主要由独立的普通题目构成,或仅包含零散的单个量表题,并未形成可分析的维度结构,则不需要开展信效度分析。

下面介绍信度与效度分析常用指标与评价标准。

一般先进行信度分析,再进行效度分析。信度与效度的关系为:信度高效度不一定高,但信度低效度一定低。

二、5类信度系数

信度分析用于检验量表题项在测量同一构念时是否可靠、一致。常用的信度指标有

Cronbach's α系数、折半信度、McDonald's ω信度系数、theta信度系数、重测信度5类。下面分别进行介绍。

1Cronbach's α系数

Cronbach's α 是最常用的内部一致性信度指标,用于评价同一维度内各题项之间的相关程度。α 系数越高,说明题项之间越一致、量表越稳定。

信度系数判断标准为:

  • 如果α 系数高于0.8,则说明信度高;
  • 如果α 系数介于0.7~0.8之间,则说明信度较好;
  • 如果α 系数介于0.6~0.7,则说明信度可接受;
  • 如果α 系数小于0.6,说明信度不佳。

2、折半信度系数

这是一种较为传统的内部一致性估计方法。操作上,将量表题项随机分为两半(如按奇偶题号),计算两部分总分的相关系数,再通过斯皮尔曼-布朗公式进行校正,以估算整个量表的信度。如果两部分高度相关,说明量表内部结构稳定,测量可信。判断标准可参考Cronbach's α 系数。

3McDonald 's ω信度系数

ω 信度是近年来更被推荐的内部一致性指标,它不依赖于 α 系数的严格假设,能更准确地反映潜在变量对题项的贡献。基于验证性因子分析的结果进行计算,考虑了每个题项不同的因子载荷,比α系数更能准确反映潜在变量被其题项共同解释的程度。判断标准可参考Cronbach's α 系数。

4theta系数

theta系数是基于主成分分析结果计算的信度估计值,用于评估量表的整体一致性。它利用第一主成分的特征根来估算信度,可作为α系数的一种补充视角。但在报告时,其使用频率通常低于α系数或ω系数。判断标准可参考Cronbach's α 系数。

5、重测信度

重测信度用于检验量表的时间稳定性。其方法是对同一批被试,在间隔一段时间(如两周)后,用同一量表进行两次测量,并计算两次得分的相关系数。若重测相关系数较高,说明量表在时间维度上具有稳定性。常用判断标准:

  • r ≥ 0.7:稳定性良好
  • r < 0.7:量表可能易受时间、情绪或情境变化影响

重测信度常应用于心理测评、稳定性强的构念(如人格、价值观)。

6、信度分析软件操作

1)数据格式

量表题的数据格式为:一列代表一个问题,一行代表一个样本,分别用数字1-5表示量表题被选择项,将数据整理成如下格式:

2SPSSAU软件操作

将问卷数据上传至SPSSAU系统,在【问卷研究】模块选择【信度】,将量表题目按维度进行信度分析,然后选择信度系数,例如选择最常用的Cronbach's α系数,SPSSAU操作如下图:

3)分析结果解读

SPSSAU输出Cronbach信度分析结果如下:

分析上表可知,维度A的Cronbach's α系数为0.859,表明维度A的信度高。分析结果中还会报告校正项总计相关性(CITC)和项已删除的α系数,指标解释说明如下:

  • 校正项总计相关性(CITC)该分析项与余下各项和之间的Pearson相关系数,反映了该项与余下各项之间的相关程度。此指标用于判断题项是否应该作删除处理,如果值小于0.3,通常应该考虑将对应项进行删除处理。
  • 项已删除的α系数:该分析项删除后,余下分析项的α系数。此指标用于判断题项是否应该作删除处理,如果该值明显高于”α系数”值,此时应该考虑将对应项进行删除处理。

按维度进行信度分析,将量表其他维度依次进行信度分析,最终整理成如下表格,汇报在论文中:

其他信度系数操作解读类似,重测信度可使用SPSSAU【相关分析】进行研究。一般若没有特殊需要,在科研论文中使用Cronbach's α系数较为常见。

三、4类效度分析

效度分析用于检验量表题项是否准确地测量了我们想要测量的变量,且与其他变量区分开来。具体来说,效度可分为内容效度、结构效度、区分效度和聚合效度。下面分别进行介绍。

1、内容效度

内容效度关注量表题项在内容上是否充分覆盖了所要测量构念的所有核心方面,且题项表述是否清晰、贴切。这本质上是一种基于逻辑和经验的判断。

1)检验方法

常用为专家判断法,邀请该领域的多位专家(通常3-6位或更多),对每个题项与目标构念的相关性、代表性、清晰度进行评级。常用的量化指标是内容效度指数。内容效度通常在量表开发的早期进行,也是判断量表能否用于后续统计分析的前置步骤之一。

2)软件操作

在SPSSAU【问卷研究】模块选择【内容效度】,将测量项(量表题)的专家打分数据按提示填写在表格中:表格中数字表示专家对于有效性的认可度,只能1/2/3/4共四个数字,分值越高认为越有效,操作示例如下图:

3)内容效度分析结果

点击【开始分析】按钮,即可得到【内容效度】分析结果:

内容效分析结果主要关注以下指标是否通过评价:

  • CVI(条目内容效度指数):每个题项的专家一致性评分
  • S-CVI(量表内容效度指数):整体量表内容效度

2、结构效度

1)简单说明

结构效度关注量表的“维度结构”是否成立,即题项能否按预期聚集成相应的因子(维度),这是效度检验中最核心、最常用的部分。结构效度的验证方式包括:

  • 探索性因子分析(EFA):探索量表潜在结构,适用于初次构建或改编量表。
  • 验证性因子分析(CFA):检验既定模型是否与数据匹配;进行区分效度和聚合效度检验。

2)结构效度分析步骤

  • 第一:首先分析KMO值;如果此值高于0.8,则说明研究数据非常适合提取信息(从侧面反映出效度很好);如果此值介于0.7~0.8之间,则说明研究数据适合提取信息(从侧面反映出效度较好);如果此值介于0.6~0.7,则说明研究数据比较适合提取信息(从侧面反映出效度一般),如果此值小于0.6,说明数据不适合提取信息(从侧面反映出效度一般)(如果仅两个题;则KMO无论如何均为0.5);
  • 第二:接着分析题项与因子的对应关系;如果对应关系与研究心理预期基本一致,则说明效度良好;
  • 第三:如果效度不佳;或者因子与题项对应关系与预期严重不符,也或者某分析项对应的共同度值低于0.4(有时以0.5为标准);则可考虑对题项进行删除;
  • 第四:删除题项共有常见标准;一是共同度值低于0.4(有时以0.5为标准);二是分析项与因子对应关系出现严重偏差;
  • 第五:重复上述1~4共4个步骤;直至KMO达标;以及题项与因子对应关系与预期基本吻合,最终说明效度良好;

3)软件操作

在SPSSAU【进阶方法】模块选择【探索性因子分析】(或【问卷研究】模块【效度】),将量表题拖拽到右侧分析框,选择预设维度,操作如下图:

按照上文探索性因子分析步骤,最终经过调整发现删除D3题目后,得到因子与题项对应关系与预期相符的结果,旋转后因子载荷系数表格如下:

关于结构效度分析的完整分析过程可点击查看下方帮助手册说明:效度分析‌下面介绍聚合效度‌和‌区分效度‌,具体使用验证性因子分析进行检验。

3、聚合效度

1)简单说明

聚合效度用于判断同一潜在变量下的题项是否有效收敛,即题项之间是否指向相同概念。

2)软件操作

在SPSSAU【问卷研究】模块,选择【验证性因子分析】,将变量按维度拖拽至右侧对应分析框中,输入因子名称,操作如下图(注意上文删除的变量不参与分析):

3)检验方法

聚合效度常用的有2种检验方法:

标准载荷系数值:均大于0.7为佳,0.5以上也可以接受;

②AVECR指标:常情况下AVE大于0.5且CR值大于0.7,说明聚合效度较高。

  • 标准载荷系数值

标准载荷系数是指经过标准化处理的因子载荷系数。验证性因子分析使用标准载荷系数判断聚合效度。各个测量项的标准载荷系数值大于0.7,说明量表的聚合效度好,或者放宽要求在0.5以上也能接受(社会学科研究编制的量表因子载荷量都不会太高)。SPSSAU输出因子载荷系数表格如下:

分析上表:标准载荷系数值绝大部分均在0.7以上,说明该量表的聚合效度较高。

  • AVECR指标

AVE平均方差萃取,AVE值= Average(loading平方然后求和),loading值为标准化载荷系数。通常需要AVE值大于0.5。

CR组合信度,CR值=Sum(loading)^2 / [sum(loading)^2 + sum(e)],e为残差标准载荷系数。通常需要CR值大于0.7。

综上,AVE值大于0.5,且CR值大于0.7时,量表的聚合效度较高SPSSAU输出模型AVE和CR指标结果如下:

分析上表:本例中4个因子的平均方差萃取AVE值均大于0.5,且组合信度CR值均大于0.7,说明本次分析的量表数据具有良好的聚合效度。

4、区分效度

1)简单说明

区分效度确保量表的各维度之间是有界限的,能够相互区分,而不是测量相同的东西。即两个不同的构念在测量上不应高度混同。

2)检验方法

区分效度常用的有3类检验方法:AVE平方根判断法、HTMT法、MSVASV。接下来将分别进行介绍。

  • AVE平方根判断法

AVE平方根值可表示因子的‘聚合性’,相关系数表示相关关系,如果因子‘聚合性’很强(明显强于与其它因子间的相关系数绝对值),则能说明具有区分效度;当每个因子的AVE平方根值均大于该因子与其他因子的相关系数的最大值,此时说明具有良好的区分效度。SPSSAU输出Pearson相关与AVE平方根值结果如下:

分析上表可知:针对因子A,其AVE平方根值为0.778,大于因子间相关系数绝对值的最大值0.734,意味着其具有良好的区分效度。同理分析因子B、C、D都具有良好的区分效度。

  • HTMT

HTMT(heterotrait-monotrait ratio)异质-单质比率,也就是特质间相关与特质内相关的比率。他是不同构面间指标相关的均值相对于相同构面间指标相关的均值乘积的开方的比值。如果HTMT值小于0.85(有时以0.9作为标准),则说明该两因子之间具有区分效度。SPSSAU输出HTMT分析结果如下:

分析上表可知:HTMT值均小于0.85,意味着因子间存在良好的区分效度。

  • MSVASV

MSV最大共同方差和ASV平均共同方差,这两个指标也可用于区分效度判断;MSV值小于AVE的值,并且ASV值小于AVE值则说明具有区分效度

SPSSAU输出区分效度指标MSV和ASV结果如下:

分析上表可知:大部分因子的MSV值和ASV值都不小于AVE值,说明因子之间的区分效度并不好,进而量表的区分效度也比较差。

【提示】:在实际应用中需注意,不同的效度检验方法可能产生不一致的结果。例如,同一份量表的数据,采用不同方式进行检验,结论可能存在差异。

面对此类情况,一般的处理原则是:只要有一种检验方法能够证明量表的区分效度或聚合效度达到可接受水平,即可认为该量表具有良好的效度水平。这属于一种相对宽松且务实的判断标准,并不要求所有检验方法必须全部通过。

区分效度和聚合效度完整版分析可点击查看下方帮助手册:验证性因子分析帮助手册

需要专业的网站建设服务?

联系我们获取免费的网站建设咨询和方案报价,让我们帮助您实现业务目标

立即咨询