新知一下
海量新知
5 9 7 5 6 1 7

心理学科普系列(2): 心理学研究基础之心理测量

芥末堆看教育 | 我们只看教育 2021/11/24 19:46

定量研究需要测量工具

心理学的科学研究一般有两种方法:一种是定性的,比如访谈;另一种是定量的,也即采取数学化的形式来描述和分析概念之间的关系,这是目前的主流方法。

就好比说:张三比李四高,这就是一种定性的描述;张三比李四高5厘米,这就是一种定量的描述。当然这是一个非常粗浅的比喻。

既然是定量,那就必须有测量工具和度量单位,就好比我们测身高需要尺子,尺子上有长度单位。

同样,心理学也需要有测量工具,这些工具也需要有度量单位。比如很多人可能做过问卷调查,5点量表打分,这里的问卷就是测量工具,5点打分就是度量单位,反应心理变化的程度。

这里我列几个用来测量“责任心”这种人格的问卷条目来举个例子。

问卷这样要求:“你在多少程度上同意以下描述,1表示完全不同意,5表示完全同意”。

条目1:我善于督促自己,以便如期完成事情

条目2:我试图认真地完成交代给我的所有工作

条目3:我有一套清楚的目标,并以有条理的方式朝它迈进

条目4:我努力达成我的目标

当然还有很多其他的测量工具,比如:

你在一堆圆圈中找到一个方块所使用的时间;

你和别人聊了5分钟大天儿,过程中一共笑了多少次;

你参与了一个心理学实验之后,从离开实验室房门到离开整个大楼,走了多少步,走了多久;

你看到一个蜘蛛时的皮肤电阻;

你被别人拒绝之后唾液中的皮质醇浓度;

你看到一个美女或者帅哥时大脑中奖赏系统的血氧流量变化。

如何判断测量工具是否靠谱

这些测量工具都是研究者们设计的,并不一定所有的都靠谱。

靠不靠谱用什么来判断呢?主要有两个指标。

首先是可信度,简称信度(reliability);其次是有效性,简称效度(validity)。

信度

可信度,顾名思义,就是看一个测量工具是否稳定可靠,比如你用一个尺子去测身高,这个尺子的刻度需要精准固定,不能热胀冷缩,在室内测一个数,到室外又变了,所以你看很多尺子都是钢尺,它就要好于皮尺,因为皮尺有一定的弹性而且容易扭曲变形。

比如前面举的测量“责任心”的问卷条目,因为有好多个条目,所以就必须保证,尽管这些条目的描述不一样,但测量的东西其实是一样的,测的都是“责任心”,这就是内部一致性。不能搞成一个问题问的是你是否负责任,另一个问题问你吃饭了没。

同时,它需要比较稳定,今天测和十天后测,得到的结果应该差不多,而不应该是今天测出来“责任心”挺高,过几天测出来“责任心”又很低,这就是重测信度。类似于前面说的,你得用钢尺去测身高,在北极也罢赤道也罢,测的不会有太大差别,皮尺可就说不定了。

这里只是用问卷举个例子,因为大家都对它最熟悉。上面提到的其他的测量工具也都需要保证信度的,否则的话,尺子都不准,得到的结果自然是不靠谱的。

效度

效度指的是一个心理测量工具是否真的测到了你想要测的那个东西。就比如说你想要测“责任心”,那你首先得保证,这些条目最起码看起来像是在测“责任心”。或者举个其他的例子,我们测的是一个人在聊天中笑了多少次,用它来指代一个人的高兴程度,这个至少表面上看起来还是可行的,不是胡乱编排的。

但是,问题来了,表面上看起来靠谱不见得就真的靠谱。

就这几个测量“责任心”的条目,你仔细看,是不是每个描述都让人觉得很好,觉得自己至少应该得个4分。

这是非常致命非常普遍的一个问题,很难避免但一定要尽量避免。要知道我这里举的“责任心”的这些条目可都是被研究者经常使用的量表,但是这个问题看起来还是如此扎眼。

同时,一个人高兴时会更容易笑,但不见得聊天中笑的次数就一定能反应其高兴程度。我可以礼貌性地笑一笑,也可以装得很开心,尽管可能我内心已经悲痛欲绝。

还有一个经常会影响效度的因素,那就是测量工具的灵敏度或者测量范围的问题。就好比考试,题目不能太难也不太简单。太难了,全班人都考30分左右,区分不出来谁学习更好一些,这是地板效应,所有数据都挤在最下面。太简单了也不行,全都是1加1等于2这类的,所有人都会,都考100分,也区分不出来谁学习更好一些,这是天花板效应,所有数据都挤在最上面。

或者比如一个人其实是250斤重,但有一天他测了一下发现自己只有200斤,高兴坏了,但其实没啥高兴的,那个称最高就到200斤。

由此可见, 信度很重要,效度更为重要,只有信度没有效度,就好比你想找张三,但每次你都能非常精准地把李四拉过来。

经济学中就有这样一个大家非常熟悉的老朋友,那就是 GDP,它被用来作为衡量经济发展程度或者发展速度的指标。但越来越多的人现在认为这个指标并不是一个好指标,套用到这里就是,效度不好,并不能真实地反应经济发展情况。

大家应该都听过一个笑话。两个人走路上,看到一泡狗屎。张三对李四说,你吃了它,我给你十个亿。李四吃了,张三给了李四十个亿。李四心理不太爽。过了一会,又看到一泡狗屎。李四说,你吃了它,我给你十个亿。张三也觉得自己之前草率了,就吃了屎,李四又给了张三十个亿。结果是,两个人谁都没得着一毛钱,社会也没有增加任何财富,但这个国家的GDP却增加二十个亿,还有成本呢,就是两个人各吃了一泡狗屎。

总结

科学的定量研究需要使用一系列的心理测量工具,比如问卷或者反应时间等。

测量工具必须:首先稳定可信,其次准确有效,不然的话,你搞半天就是搞个寂寞。

(本文到此结束,下次我们讨论心理学研究基础之研究设计)

文章为作者独立观点,不代表芥末堆立场,转载请联系原作者。

更多“心理学”相关内容

更多“心理学”相关内容

新知精选

更多新知精选