作者:心理学系 邵志芳
关于SSES和测试结果有哪些误解?最近一段时间,经合组织(OECD)开展的国际青少年社会与情感能力测评(SSES)引起我国教育界的广泛关注,与此同时,对于测评结果和中国苏州中小学生表现的也出现了一些误解 。有人将SSES比作OECD开展的PISA测评的“升级版”,直称其为PISA2.0;有人根据测评数据宣称中国学生“表现亮眼”,多项能力位居世界前列,等等 。笔者认为有必要纠正一下这些看法 。
首先还是要介绍一下SSES测评的情况 。SSES是英文Survey (Study) on Social and Emotional Skills的缩写,该项目的测试对象分10 岁组(基本上都是小学五年级学生)和15岁组(基本上都是高中和中职学校一年级学生),其目的是探讨影响社会与情感能力发展的因素 。
首先请大家注意,PISA测试针对的是15岁组的中学生,没有10岁组 。其主要测试目标是与认知能力相关的知识和技能,如阅读、数学、科学等,虽然其中也有一些问卷搜集参试学生的个人、家庭、学校、社会等方面的信息,还粗略测量了社会与情感能力,但这并不意味着SSES是PISA的升级版 。SSES侧重的是人格因素,它与PISA是互为补充的关系 。
对“社会与情感能力”最大的误解,是将这种能力的测量得分与认知方面的得分等量齐观 。这与英文用词和汉语翻译有一定的关系 。OECD设计了15个分测验来测定学生的社会与情感发展状况,这15个指标都用了“skill”这个词,也就是说,它测了15种skills 。这个skills本身的含义就是技能、能力等,汉语通常译为“技能”,但是汉语中的“技能”一词含义比较狭窄,多指完成某种活动的动作技能或行动程序,故翻译团队将其译作较为广义的“能力” 。
由于英语叫skills,汉语又译成了“能力”,难怪不了解内情的人往往直接将其理解为真正的、客观的、实实在在的“能力”了 。不巧的是,15种skills的得分出现了年龄倒挂现象,例如,中国苏州10岁组各指标得分基本上都高于15岁组(图1) 。
文章插图
图1. 苏州市学生社会与情绪能力15项子能力得分的平均数(来源:袁振国等,2021)
看了图1,你会发现高一学生得分反而低于小五学生,于是很多人就说“高中生比不过小学生了 。”“高中生社会与情感能力下降了 。”
笔者在这里要强调的是,常识是很重要的!小学生的社会与情感能力比高中生还强,这可能吗?如果是一种能力,高一大孩子怎么可能比不过小五小朋友呢?!这也太离奇了!我们还是来看看SSES是怎样测量这些skills的吧 。
SSES的题目长什么样?SSES用15个分测验测量社会与情感能力,每个分测验都有8个题项(后经检验,各分测验留下6~7个题项),这些题项都要求参试学生阅读一句话(陈述),然后根据这句话所说的情形与自己实际表现的相符程度,报告自己的同意程度(从强烈不同意到强烈同意,分5个等级) 。而且,10岁组和15岁组的题项是完全相同的 。
下面我们选几个分测验的题项来考察其测试的内容,这里列举的是开放能力下的3个子能力(包容度、好奇心和创造性)的部分题项 。
测量包容度的题项举例:
● 我乐意和来自其他文化的人交朋友
● 我会问一些关于其他文化的问题
● 我在新的文化环境中感到舒适
测量好奇心的题项举例:
● 我有强烈的学习欲望
● 我喜欢了解事物的原理
● 我喜欢学习新东西
测量创造性的题项举例:
● 我能找到做事情的新方法
● 我是有创意的且能提出新想法
● 我有时能找到别人找不到的解决办法
从这些题项的内容来看,SSES采用的是自我报告法,这种方法反映的是参试者的主观想法,真正测量到的是参试学生关于社会与情感能力的自我概念,而且SSES研究报告也是这样表述的 。
既然是自我概念,就一定程度上带有主观性,而且往往有浓重的自我美化倾向,部分参试者甚至可能将社会期许的“理想”或“最佳”答案作为自己的回答 。所以,尽管自我概念与真实能力有关联,但是不能画等号,两者甚至可能是反方向的 。就像幸福感研究发现,生活极为清苦的某国人民自我报告的幸福感却是全球第一;还有研究表明,男生的学业效能感好于女生,但是考试成绩……算了,就不提这个gender gap了 。而PISA测试得高分还真得凭真本事,这也是为什么PISA测试给全球中学生排名次,SSES却不提倡排名次的原因 。
SSES得分有效度吗?虽然自我概念与真实能力不能画等号,但是本次SSES的测试结果在一定程度上还是能够反映参试学生的社会与情感能力的 。这是因为测试采取匿名方式,而且向参试学生强调了答案没有对错之分,要求他们根据实际情况作答 。另外,SSES还采用了三角验证的方式,在收集学生数据的同时,还收集了家长和教师对参试学生的评定,三者间可相互印证 。最后,从实际结果看,我国参试学生很大程度上是比较实事求是地回答问题的,因为他们的得分上下有一定的落差,而且有的“成绩”也不甚“理想”,例如15岁组抗压力的平均分还没有超过500,10岁组也仅略高于500而已,是所有指标中得分最低的 。
这里顺便说一下,500是原始分经一系列转换后得到的平均标准分 。如果你的某个指标得分刚好是500,这意味着你的“成绩”等于全部10个参试城市10岁组学生的平均数——换句话说,在这个指标上,你就是一个普普通通、普通得不能再普通的10岁孩子 。
这么说来,我们相信大多数学生至少没有盲目地高估自己,也没有仅仅为了父母和老师喜欢而填写理想答案,他们的得分在反映其社会与情感能力真实水平上有一定的客观性 。这也是SSES将其测定的人格特质看作能力的底气 。
为什么得分发生年龄倒挂的现象?不过,上面的讨论还是没能解释两个年龄组得分倒挂的现象 。确实,与高中生相比,小学生答题时可能更容易受主观因素的影响,也更容易用“理想答案”作为自己的反应 。
从华东师范大学学报(教育科学版)上发表的《开放能力:中国青少年社会与情感能力测评分报告之四》(邵志芳等,2021)发布的结果来看,小学生确实容易受社会期许的影响 。图2是该文贴出的3项子能力得分的分布图 。可以发现,10岁组分布图的高分段都出现了一个明显的小高峰,而15岁组高分段人数没有明显的小高峰 。
文章插图
包容度得分(10岁组)
文章插图
包容度得分(15岁组)
文章插图
好奇心得分(10岁组)
文章插图
好奇心得分(15岁组)
文章插图
【小学五年级美文(五年级作文表达情感的作文)】创造性得分(10岁组)
文章插图
创造性得分(15岁组)
图2. 两个年龄组学生得分的分布(左右划动屏幕可见全图)
从图2的得分分布图来看,10岁组有一小部分学生可能还是受了社会期许的影响,给出的答案是社会认为“理想”、“最佳”的答案 。这也验证了笔者刚才说的,大多数参试学生没有仅仅为了父母和老师喜欢而填写“理想”答案 。
但是,社会期许效应对总体测评结果的影响是不是很大呢?该文在分析部分写道:
如果分别将各个子能力得分高于800的个案剔除,可以发现年龄差异明显缩小,但并未消失:10岁组包容度平均得分从641.96降至616.68,15岁组从614.28降至601.15,年龄差异从27.68降至15.53;10岁组好奇心平均得分从643.88降至618.53,15岁组从575.99降至568.72,年龄差异从67.89降至49.81;10岁组创造性平均得分从635.94降至611.51,15岁组从567.38降至559.86,年龄差异从68.56降至51.65 。
将上述计算结果归结为一句话就是,社会期许效应尚不足以完全解释两个年龄组分数倒挂的现象 。那么,剩下的分数差距,可能因为15岁组的大孩子“谦虚”了,或是因为10岁组的小朋友“美化”了自己,或两种情况兼而有之 。
你可能认为,只有中国学生会发生这样的情况 。但是你想错了,从本次社会与情感能力测验的结果看,不仅苏州市出现了这一现象,也不仅在开放能力上出现了这一现象 。国际样本15岁组学生对大多数子能力的自我概念都不如10岁组学生,仅在包容度(Tolerance)和果敢性(Assertiveness)这两个子能力上比小朋友略微强一点 。可见,大孩子得分不如小朋友,是世界性的普遍现象 。
两个年龄组得分倒挂,说到底还是因为SSES测试的是自我概念 。小学生人生经验有限,加上家长老师夸赞较多,自然容易觉得自己很行 。随着年龄的增大,我们逐渐懂得山外有山、人外有人,更清楚自己的优缺点,这样一来,对自我的评价就会向客观水平回归 。因此,相比之下我们更相信15岁组的得分更接近参试者真实的社会与情感能力 。
结语总之,在自我概念测验的情况下,我们不能看到小学生得分高就认为他们能力强,小朋友无非就是更相信自己优秀而已 。如果让大小孩子一起出门,你肯定会看到社会与情感能力更强的大孩子带领着、照顾着小朋友 。
参考文献袁振国, 黄忠敬, 李婧娟, 张静. (2021). 中国青少年社会与情感能力发展水平报告. 华东师范大学学报(教育科学版), 39, 1-32.
邵志芳, 刘志, 杨舒豫, 黄忠敬 (2021). 开放能力:中国青少年社会与情感能力测评分报告之四. 华东师范大学学报(教育科学版), 39, 77-92.
同类文章青少年社会与情感能力研究中国苏州结果发布——这次排名吗?(2021-09-08)
关于第一轮国际青少年社会和情感能力研究的问答(2021-9-6)
与PISA同等重要的SSES来了(2021-9-2)
猜你喜欢