基于数据挖掘的学习预警研究:不足与展望

原题:国外基于数据挖掘的学习预警研究回顾与展望

作者:肖 巍 倪传斌 李 锐

刊期:《中国远程教育》2018.2



基于数据挖掘的学习预警研究:不足与展望

  将新兴的数据挖掘技术引入学习预警研究,使得学习预警这一古老的话题焕发出新的生命力,有望成为一个理论基础宽厚、研究内容丰富、方法体系多样、应用前景广阔的前沿交叉领域。然而,从现有文献来看,学习预警研究在理论、内容、方法和应用方面均存在一些问题和不足。对这些问题和不足进行分析和梳理,有利于更加精准地把握该领域的研究现状和展望其未来研究动向,更加科学地利用数据挖掘技术进行学习预警研究。

  



理论上,学习预警的认知基础和运作机制尚待厘清



  理论研究是一个领域的基石,对该领域的研究发展有着引领作用。当前,学习预警理论研究中亟待突破的一个关键点是厘清学习预警的认知基础和运作机制:在内部,从生理、心理、社会文化层面精准把握学生的认知活动;在外部,将认知活动放到学习预警的大环境中进行讨论,对学习预警的各个环节和组块进行构建和优化。将认知视角与社会视角相结合,无疑会为学习预警研究奠定坚实的理论基础。然而,目前尚未见到学习预警的理论研究文献。诚然,部分学者在实证研究中进行了理论探讨,如Agudo-Peregrina等为了研究虚拟现实环境和在线学习环境下交互性(interaction)的预警效果,对交互性的定义和内涵进行了系统梳理和深入探讨。但总体而言,学习预警理论研究并未取得实质性突破。



  理论研究薄弱还与实证和方法上的欠缺有关。实证方面,虽然现有研究数量持续上升,但绝对数量仍然不多,未能对各种课堂环境和学科开展具化研究,无法给学习预警理论构建提供坚实的实证基础。方法方面,现有研究多侧重于纯数据驱动,脱离教学环境和理论阐释,在研究框架构拟、数据采集和数据解释等方面缺乏理论支撑。有的研究建立内部不透明的黑 盒模型,只能给出最终运行结果,无法观察内部运行过程。有的研究虽然采用内部透明的白盒模型,但并未在教学理论的指导下系统地采集数据,只是利用现有的零散数据进行挖掘分析,导致对预警结果的阐释牵强。缺乏理论指导的实证研究容易陷入“各自为战”的局面,难以提供汇流式的证据支撑。



  厘清学习预警的认知基础和运作机制,需从以下三个方面着手:理论方面,学习预警研究者应当积极借鉴教育心理学、社会心理学、学习科学等不同学科的理论和模型(如活动理论、交互理论、形成性评估理论等),夯实学习预警研究的理论基础;实证方面,重视预警机制的教学环境差异,对不同课堂环境(网络课堂、传统课堂、混合课堂)和学科(生物、 数学、计算机等)开展更加微观、具化的研究,尤其要关注数据采集不便的主流教学环境——传统课堂, 以及技术手段偏弱的传统文科课堂,在大量实证研究的基础上进行理论构建;方法方面,选取内部透明的白盒模型,结合具体理论或模型进行挖掘,对挖掘结果进行基于理论的阐释,以增强结果的可解释性。

  



实证上,学习预警指标的甄选对动态数据关注不够



  现有研究对人口统计学信息和过去学习成绩等静态指标关注较多,而对学习过程动态指标关注不够。 诚然,静态数据便于采集,也有一定的预测效力,但具有一定局限性。首先,静态指标已无法通过教学活动和学生主观努力加以改变。若过分依赖静态指标,容易导致学生认为自己的学习结果早已被这些无法改变的因素所决定,从而丧失学习积极性。例如, Hendel(2007)发现本科生的高中学校排名和学生所在族裔能显著影响学生大一结束时的退学率。此类发现虽然具有统计学意义,却难以对学习预警提供具有教学指导意义的反馈,因为学生无法通过改变自身高中学校或者族裔来降低退学的可能性。为了通过学习预警充分激发和调动学生的学习积极性,在甄选指标时应当更加关注学生在学习过程中可以通过自身努 力加以改变的动态指标。其次,关注动态指标与学习的特点和评估机制相契合。从学习的特点看,学习不是简单的输入—输出线性过程,而是充满倒退、停滞甚至跳跃式前进的动态系统行为。因此,单纯依靠静态指标无法监测学习的动态发展过程。从学习的评估机制看,对学习的评估必须通过观察学生的学习行为表现来诊断其学习状况,得出评估结果并加以解释和使用,从而激发和调动学生的学习意识和学习积极性。评估的目的不仅仅是为了测量,而是为了以评促学。因此,单纯的静态指标无法满足形成性评估的需求。综上所述,只有对学习过程进行动态监测与评估,才能更好地进行学习预警。

  

方法上,学习预警尚未形成学科特异的数据挖掘研究范式



  学习预警研究领域的数据具有如下特点:一是来源广泛,可能来自网络学习平台、教学管理系统、调查问卷、课堂测验等线上线下多种渠道;二是结构各异,有结构化数据(如问卷中的李克特量表),也有半结构化(如问卷中的主观性问题)甚至非结构化的数据(如网络学习平台中的图片、视频信息);三是缺失程度不同,有的数据可能较为完整(如教学管理系统中的学生个人信息),有的可能存在缺失(如测验中的空白题);四是样本量可能相对较小,不能简单照搬金融、管理等领域基于大样本的技术;五是正、负例失衡且正例过少 (一般情况下,能够通过课程考试、无须预警的学生居多,而考试不及格、需要预警的学生占少数),容易导致模型拟合不足,加大了对需要预警的学生的识别难度。这些特点对数据挖掘技术提出了新的要求。进行学习预警数据挖掘时,既要遵循数据挖掘的一般工作流程和研究范式,又要结合学习预警的特点进行改进,充分利用和整合各种渠道的数据开发专用数据挖掘技术,逐渐形成学习预警乃至教育技术领域学科特异的数据挖掘研究范式。

  

应用上,学习预警系统有待进一步推广,为学生精准预警提供个性化服务



  基于学习预警研究成果,可以开发学习预警系统,为教育政策制定、教学资源规划和教学方法实施提供决策支撑,并为学生发现学习困难、改善学习状态、提升学习效果提供帮助和指导。目前,国外已开发了一些学习预警系统,如美国普渡大学的课程信号系统、亚利桑那州立大学的电子顾问、可汗学院的学习仪表盘等。这些系统在教学实践中的应用又可以回馈、促进学习预警研究的发展。然而,现有的学习预警系统在技术和应用层面均存在不足。在技术层面,现有学习预警系统虽然较为丰富,但其底层技术并非学习预警专用技术,仍以数据挖掘领域最基本的技术为主。在应用层面,现有系统多为宏观的通用平台,尚未做到针对每一门具体课程进行专门预警。诚然,为避免重复建设,最理想的状态是设计一套通用的预警模型和方法。然而,在现阶段,学界对不同学科、不同课堂的微观研究还未深入。只有当特异化的微观研究已经很充分之后,才可能在此基础上构建一个统一的宏观平台。因此,在相当长的时期内还应以特异化的微观研究为主,未来应当针对不同课堂和学科的特点开发个性化的学习预警系统,为学生精准预警提供个性化服务,进一步应用学习预警研究的成果。





(本文系摘编,未标注参考文献等,详阅及引用务请核对原文。)

编辑:单玲



基于数据挖掘的学习预警研究:不足与展望



基于数据挖掘的学习预警研究:不足与展望

更多精彩内容,尽在阅读原文