教育评价事关教育综合质量提升与教育供给侧改革进程。智能时代的教育评价需要与时俱进,利用教育大数据与智能技术"精准识材",改变以往评价体系标准单一、手段趋同等弊端。本文聚焦学习为主体的"全人"评价,着眼智能时代对人才的需求,围绕学习方式的变化、学习结果的多维尺度等对教育评价转型展开阐释,在分析"评价识材"与"因材施教"辩证关系的基础上,探讨了"识材"—"施教"—"发展"的路径。从学习投入评测、人格特质识别、创新能力评测、表达能力评估等维度剖析了智能技术赋能教育评价的作用点。智能技术赋能新时代教育评价改革,需遵循教育的基本规律,将教育场景与计算机技术有机结合,共同建立"人机协同"的标注与计算方式,关注实际环境中数据模型的通用性与迁移能力,形成有效的评估方法与干预机制,以实现学习者个体价值回归与主体价值增值。
在新一轮科技革命风起云涌、全球经历百年未有之大变局的历史节点,党的十九届五中全会确立了构建高质量教育体系、保证人民群众享有更加公平与优质教育的目标。教育评价作为教育改革的"牛鼻子""指挥棒",事关教育改革导向,决定教育实践的落实以及现代教育治理的水平。深化教育领域综合改革,"要抓好深化新时代教育评价改革总体方案出台和落实落地,构建符合中国实际、具有世界水平的评价体系"(新华网,2020)。《深化新时代教育评价改革总体方案》旨在全面落实2020年全国教育工作会议以及党的十九届五中全会等精神,以评促改,实现改革与育人深度融合、有效联动。
教育评价是对教育相关数据与信息进行系统、科学与全面的价值判断,是一项广泛性、艰巨性、实践性难题。在教育智能时代,以智能技术促进学习方式和教学方式的变革,培养适应未来教育的创新人才,正成为教育面临的重大课题,数据驱动教与学正成为新教育体系区别于传统教育的核心特征(中国教育和科研计算机网,2020)。"互联网 环境"可以方便地获取学习者的全维行为特征与过程性学习数据,使研究者首次可以运用科学的分析技术,精确理解和系统分析学习者的学习规律(陈丽,等,2019)。学习过程的数据化为精准施教提供了有力支持,智能时代的评价需要蜕旧变新、与时俱进,以有效支撑教育的供给侧改革。利用教育大数据与智能技术"精准识材",以及在此基础上的因材施教能够改变以往评价体系标准单一、个性化缺失、手段趋同等弊端,有助于聚焦以"过程、能力、增值"为特征的综合性评价,实现"五育"并举的核心素养教育,从而回应新时代教育对创新人才培养的重大关切。《深化新时代教育评价改革总体方案》的出台为构建科学教育评价体系指明了方向,是对未来教育发展趋势的有力回应。
一、智能时代教育评价的意蕴
《深化新时代教育评价改革总体方案》针对我国教育发展的新态势,在系统部署教育评价框架的基础上勾勒出5个维度共计22项具体任务,指明了落实教育评价改革的创新路径,提出"改进结果评价、强化过程评价、探索增值评价、健全综合评价"的具体评价原则(国务院,2020)。上述"四个评价"在尊重教与学规律以及学习者成长规律的基础上,强调评价的诊断性、调节性、导向性和多元性特征,有利于打破"以成绩定标签"的固化方式,从而更为全面地考察立德树人工作的成效,对于构建符合新时代中国特色的评价体系,全面实现教育现代化,构筑人民满意的教育体系,具有深远影响。
(一)智能时代对人才的需求
从学习者发展的视角来看,以传统的流水线为重要特征的工业时代孕育出以教师为中心的教育,虽实现了教育的规模化,但"标准化"和"同质化"特征明显。创新的国家需要创新的人才,创新的人才需要创新的教育。"个性化"成为信息时代的主要特征(黄荣怀,等,2017)。信息时代需要大批的创新人才,创新人才的培养绝不是生产线上同质化的知识复制,其培养取决于个性评价基础上的因材施教。这需要重塑教育,让学习者能从容应对各种不确定性和挑战,确保公平和全纳的受教机会;需要从传统的侧重内容和培训的教学流程,转移到为学习者提供更合适的学习服务,以及对学习者所需知识的再认识、再评价和再创造;需要从工业时代"流水化""程式化"的教学转向以个性化、数字化、联通化为特征的技术驱动与思维整合的教学。通过多维数据记录学习者成长历程,建立数字综合画像,可以帮助师生从重复的工作中解放出来,使教学更具有效性和创造力。需要重视的是,智能教学支持与服务不能重蹈行为主义或分数本位的"错题强化、分数导向、题目灌输、糖衣新装"覆辙,应重点审视学习者的能力水平、多元智能、认知频谱、情感状态、个性特征等问题,围绕信息时代教育改革目标,对自然语言理解、多维指标凝聚、通用视觉信息检索、情感话题分析、脑神经映射机制、复杂计算模型等展开深入研究,建立教育学、神经科学、人工智能等学科的研究共同体。
(二)学习方式的变化
教育研究者与实践者应重新理解学习者,对"学习者是谁"这个问题做出深刻的回应。当今的青少年学习者,作为数字土著一代的"新群体",让教育实践感受到与之前群体不同的鲜明个性。数字土著一代生活在大数据时代,接受信息能力强,社交媒体承载了他们大部分的喜怒哀乐,形成正确思考方式的难度更大。在数字时代来临之前,阅读对学习者三观的形成有很大的影响,当前的数字阅读多为碎片化阅读,网络意见领袖呈现低龄化特征。教师常常感到对新一代学习者群体难以了解,认为有效沟通困难。构筑适合数字土著的新教育模式需要了解学习者的思维特征与学习方式,需要从传统的侧重内容和培训的教学,转移到关注"非良构"领域知识的考核与有效评价,需要重新理解学习环境,将学习视为"统一的连续体",提高评估的有效性、及时性和公平性。例如,在此次疫情期间的"大规模停课不停学",相对于被广泛关注的硬件条件与课程内容设计,学习者的主动学习能力还没有得到充分重视,学习者倾向的学习方式与身处的学习环境之间依然存在较大的差异,这些都限制了教师对学习者的针对性指导。智能时代的教育评价需要进一步了解学习者的学习方式和个性特征如何根据场景改变,学习者的画像是否能够实时、精准、客观地表征学习状态。
(三)学习结果的多维尺度
学习结果是学习者为满足教学需求而产生的一系列活动,是学习者通过努力获得的行为与能力的综合。学习方式的差异和学习结果的多维尺度必然要求评价方式的多维变化。传统评价观以结果为唯一依据,过度强化结果在评价中的主导地位,带有浓郁的分数至上色彩,进一步导致了重结果、轻过程的不良后果,甚至以单一成绩划定教育乾坤。分数作为机械的数字符号背后理应有更为丰富的意蕴,需要更为深入、多视角、多向度地辩证看待。众所周知,学习的结果是多重努力共同参与的过程,是情商、智商、志商、语商等多因素融入和整合的显现,是与学习者成长相伴的一部分。学习者的学习不仅源自心智活动,更取决于情感凝聚的热切度和专注度,取决于意志力、自我调控度与持久度,取决于语商表达的确切度和精彩度。数字符号不是优差中劣的唯一表征,教育评价也不能仅止步于单一维度,还要科学地评价学习者的综合素质、情感态度、心理韧性、批判能力等,尤其应对学习者生命成长过程中非智力因素与精神力量给予特别的关注。
《深化新时代教育评价改革总体方案》的颁布释放了一个强烈的信号,即学习者的发展具有鲜明特点,应给予高度的尊重。学习者作为学校教育流水线上的"标准件"时代已成过去。在未来的教育中,学习者必将作为栩栩如生、独特内涵和鲜明个体的人参与社会实践。学习者的成长,纵向而言具有过程性与发展性,就其生命呈现的状态而言有水面之上的显性品质与冰山之下的隐性品质。生命的独特性需要我们突破种种固化评价标准,运用更加富有前瞻性的评价方式予以评价。新时代的教育要完善立体刻画、行之有效的评价标准,构建意蕴丰富与探索精神的评价体系,使之与学习者的生命成长匹配,与生命发展同步,与多样化实践活动呼应,与教育改革开放的远景目标共振,与教学实践样态趋同。
二、智能时代"评价识材"与"因材施教"的关系
智能时代的教育需要适应未来的评价,只有在两者的良性互动中新时代的教育与评价才能相互呼应、步入更高的境界。当前,我国教育改革与发展正处于过去与未来交会的关键节点,通过扩大优质教育规模以滿足人民对高质量教育的迫切需求,这种方式已经接近现有潜力的极限。在我国即将实现第一个百年目标之际,全面建成小康社会、全面建设社会主义现代化强国,对培养多样化创新人才、保证教育公平、提高教育质量提出了更高的要求。随着教育信息科学的发展,以数据驱动与精准教学为特征的智能教育提供了规模化的个性化教育方法,情境感知的无缝学习、自适应个性化学习开始步入常态,为同时实现规模化教育和个性化培养提供了可能。《深化新时代教育评价改革总体方案》提出坚持"科学改"的原则,要求借鉴国际先进的教育评价理念,充分利用信息技术,提高教育评价的科学性、专业性、客观性,推动科学、有效地解决问题。利用智能技术助力教育综合评测,推动教育质量提升进而推动教育现代化已成为共识。
智能技术赋能"评价识材"需要厘清"评价识材"与"因材施教"的辩证关系。在我国有关教育的格言与典籍中,孔子提出的"有教无类"和"因材施教"无疑最具光芒与生命力。"因材施教"的"材"是指学习者个体的认知水平、情感态度、学习能力以及自身素质。生理因素、成长环境、生活阅历与知识背景等的差异形成了学习者鲜明的个性特征。而由于"个性"与"能力"的表征维度太多,测量困难且难以常态化实施,因此在"以规模减少成本"为趋向的班级授课制中"大规模"与"个性化"的矛盾难以调和。让每位学习者在学校里接受计划性、系统性指导的同时,为学习者提供适合每个人的教学方法,一直是教育研究者与实践者的教学追求。新千年以来,我国陆续发布了新时代的重大教育政策,其中,《国家中长期教育改革和发展规划纲要(2010—2020年)》、《中国教育现代化2035》、2020年全国教育工作会议以及此次的《深化新时代教育评价改革总体方案》都强调要突出因材施教的价值。评价识材,是因材施教的前提。我国正在实施的新高考改革方案更加强调"服务选材与立德树人",强调考察核心价值与综合能力,关注学习者基础性、应用性、综合性与创新性能力(冯成火,2020),学习者的个人意志和综合能力,以及个人兴趣和特长,都将成为评价识材的重要组成部分。《深化新时代教育评价改革总体方案》聚焦核心素养,从学科知识考查转向素养评测,注重考察学习者发现问题、分析问题并加以解决的能力,这为教育技术研究提出了现实课题。未来应重点关注智能评价技术与体系的构建以及在不同教育场景的应用效果研究,基于诊断性评测、学习档案评价、大数据评价等方式帮助教师精准分析、全域关照,实现学习者个体价值回归与主体价值增值。
识材和施教是同一过程的两个关键点,彼此相互影响、不可分割,只有全面、系统地认识学习者特征才能完成施教的过程。要通过评价明确"材"的特点和程度,找准"教"的定位和起点,从而为学习者成长建立反馈调节机制,帮助学习者建立自信,其结果是真正实现能评估学习者思想品德、身心健康、能力素质等综合要素,鼓励学习者多样化成长的个性化教育。需要利用信息技术推进教育评价改革,帮助教师全面了解和细致掌握学习者状态,根据学习者的情感意志要素、活动场所等非线性关系的相关数据评价,聚焦学习者综合素质发展(田爱丽,2020),以改善教育资源个性化与灵活性不足的问题。对于学习者而言,借助智能技术支持下的自我导向学习,可以将线上学习与线下学习、集中学习与分散学习、课堂学习与场馆学习等多种学习形式结合起来,为自身创造"因材择学"的机会,从而实现"识材"—"施教"—"发展"的逻辑演进。
三、智能技术赋能教育评价的作用点
智能时代的因材施教亟待充分利用计算分析技术赋能,以推动数据驱动的教育研究和实践。伴随国家相关政策的陆续出台,各类信息技术"示范区""试验区""人人通""三个课堂"等实践领域的开辟,以及各地(区)对智能技术融入教学实践的支持力度的不断增长,更加客观、精准、千人千面的因材施教理念有了实现的可能。智能技术赋能教育评价改革需要相关的技术支撑。其中,5G作为高带宽低时延的通信技术正助力网络空间人人通向物联网发展,有助于利用个性化数据实现对学习者的因势利导,实现人人有"学伴"的人机协同教学;虚拟现实技术实现了物理空间和虚拟空间的融合,带来了多感官的沉浸学习体验,使教学从"离身"步入"具身",可形成立体综合的教学场域;区块链技术支撑开放安全的数据记录,可实现分布式、跨平台、融合化数据存储,助力个人学习轨迹的追踪与分析,从而完成对学习者的全方位画像,提高数字资源的共享效率;边缘计算技术针对物理场景中的数据分析,以计算下沉与边端赋能加速数据的分析能力;多模态学习分析以解决复杂教育问题的数据模型与解释模型为起点,成为洞察学习规律的新范式,为"教育场景计算"提供理论与实践的支撑(张琪,等,2020),为深入理解学习机制、研发评价建模工具提供了全息视角。教师水平的提升是技术赋能教育评价的关键因素。借助智能、快速、全面的教育分析系统,可以建立以学习者为中心的智能育人环境,为学习者提供精准推送的教育服务(国务院,2017),赋能教师、学习者、课堂、课程和学校,形成新的教育教学场景,引发教师角色加速转变。概念讲述、知识传授等职能越来越多地可以借助技术来完成,实现教师更为精细化的分工,使教师有更多时间潜心于学习者的能力培育、创造能力培养与德育塑造。
计算社会科学是社会科学发展的必然走向,数据驱动范式已越来越多地应用于教育研究中,为大规模理解学习者行为与内在特征提供了前所未有的机会。与此同时,"互联网 教育"的常态化使得教与学的方式正发生显著变化。其中,学习环境容纳了日益增长的真实要素,学习延伸并拓展至课堂之外的空间,学习者聚焦于真实情境中问题的解决,关注学习测量已成为重要趋势。智能技术赋能综合评价,底层依赖于对评价维度的明确界定以及准确的方法与模型。例如,对学习者话语的自动评价,其隐含的假设是,研究者认为学习者的对话与交流文本在一定程度上反映了学习者的思维方式,并可以通过文本的内容与质量表征出来。因此,无论是人工评分还是作文自动评分,都需要对评价维度有一个清晰的定义,以及对测量结果做出更准确的解释。通过对评价领域理论与实践进展的梳理可以发现,学习投入、人格特质、创造能力、表达能力的建模是智能技术赋能教育评价的关键作用点。
(一)学习投入评测
深度学习需要持续的投入,对学习投入的关注不仅在于其是教育评价的重要内容,更在于学习投入是可以被塑造的重要变量以及预测学习绩效的强有力指标。作为智能评测的核心研究领域,学习投入是个体在学习活动中所展现出的持续和积极的学习状态。基于"连续体"的分析视角,基础的投入涉及与注意力相关的操作行为,在高度投入的情况下学习者使用大量的心理资源进行深度加工,不仅需要使用深层的认知策略,更伴随情感投入和学术投入。在过去20年中,尽管学习投入在概念的表述与应用方面还有诸多问题需要解决,但始终是一个富有成效的研究领域。已有大量研究对学习投入的理论体系展开了归纳,达成共识的是投入不仅是诠释学习状态的有效指标,还融合了多种可区分的特征,学习投入的表征与量化研究依然稀缺(张琪,等,2019)。测量投入度的常用方法通常会对技术环境中学习者产生的交互行为日志文件进行建模,涵盖了学习者的点击数据、交互行为数据、响应反馈等。也有研究利用表情识别、眼动采集、脑电数据等多模态数据展开分析,以脱离"在线"学习场景,挖掘与情感状态、认知水平相关的指标。未来需要聚焦更确切的解释与评价模型,界定学习者"开始"和"脱离"投入的状态,探索投入可能起作用的条件,研究导致学习者脱离投入的个体差异与情境因素,对投入发生的心理与脑机制展开探索,围绕学习的注意力机制、脱离投入的定义与识别展开深入研究,进一步分析学习者投入度、影响要素与中介因素的关系,提升数据表征结构的能力。
(二)人格特质识别
个体差异取决于学习者的人格特质。人格是在先天遗传、后天环境等因素交互作用下,表现在身心方面的思考模式、情绪表达与行为特性的总和。特质决定了人格的稳定性与独特性。特质是个体内在的系统反应,这种反应使个体对不同种类的刺激以某种相对一贯的、稳定且相同的方式进行反应。因此,特质是人格的"基础结构",具有"支配个人行为的能力"(Matthews,Deary,&Whiteman,2003),反映人与人之间的基本区别。人格对学习者的成长至关重要。大量研究表明,了解人格在学习过程中的作用,并投入更多的关注和精力,可以促进学习。人格识别在教育学、心理学、企业管理等方面已经发展多年,得到了成熟的应用。传统的评测技术包括九型人格测试、十六型人格测试以及大五人格测试等,主要方法是通过自我报告的反馈来进行,这类评测不具备针对性,也无法做到多场景的追踪以及避免虚假答题等问题。利用智能技术可以从几个方面提取与人格特质相关的指标:一是基于学习者的文本内容与书写习惯;二是建立学习行为的时序信息,按照时间序列挖掘关键行为序列特征进行采样,记录质性的行为资料,进行编码分析,使用量化的推论统计解释行为序列的转换;三是对不同的学习内容进行标注,将上述特征结合起来,针对每个特征使用不均衡数据分类的方法进行算法融合,使之变成表征能力很强的建模方法。我们的研究团队对大五人格的建模研究发现,仅通过学习行为的建模就可以得到比较高的识别水平。对来自662位被试的建模结果使用5倍交叉验证方法的性能评估表明,增强的可拓神经网络(EENN)算法可以有效识别人格,平均准确度为0.758,该算法与粒子群优化方法(EENN-PSO)相结合可以显著提高识别率,平均准确度为0.976(Lai,Sun,Wu,&Xiao,2020)。人格特质的准确识别可以为自适应内容设计与干预的实施奠定基础。研究团队开发的自适应学习分析仪表盘用"模式识别技术"判定学习者人格特质,基于"复制自适应"方式推送匹配人格特质的数据指标,强化了学习者使用动机(张琪,等,2018)。此外,采用数据挖掘方法建立人格特质的预测模型,验证了深度置信网络(DBN)在各阶段识别高危学生的性能,提出了基于人格特质的学习分析范式(Wu&Lai,2019)。
(三)创新能力评测
创新能力作为21世纪核心素养的组成已成为共识。无论是21世纪技能中的"4C"能力,还是我国提出的《中国学生发展核心素养》都包含了创新能力的维度。创造性思维是个体创造性的具体表现,其核心是发散思维。尽管不是整个创造力结构的代名词,但在过去的60年中,发散思维被广泛用作创造力潜力的主要指标(Albert&Runco,1999)。其中,托兰斯创造思维测验(TTCT)是运用最广泛的发散思维测量工具,该测试包含言语流畅性、变通性、独创性三个维度。其中,流畅性是指学习者在一定时间内产生观点或想法的数量;变通性指不同方向、不同角度思考问题的灵活性;独创性是指学习者具有不循规蹈矩的想法或与众不同的解决问题思路。对于流畅性建模,一般采用潜在狄利克雷分配(LDA)模型进行内容主题挖掘。作为贝叶斯学习模型,该模型主要应用在中文分词技术方面,将文章转化为词向量,是潜在语义分析与概率潜在语义分析的扩展。在变通性维度,可以将词表征为实数值向量,通过深度学习训练将对文本内容的处理简化为K维向量空间中的向量运算,获得词汇在向量空间上的表示。在獨创性维度,一般通过计算响应事件之间的语义距离,使用潜在的语义分析和长短时记忆网络评估其数值。除了文本的分析,部分创新能力评测还包含拼图测试以进行拓展记分。该类测试通常是给出一个不完整的图形,学习者进行笔画添加赋予该图形更多的内涵。这类计算建模会涉及视觉模式的识别,一般利用卷积神经网络(CNN)从图像中识别视觉模式,进行图像特征提取、运动检测、人工评分等模型训练。
(四)表达能力评估
语文素养是学习其他课程的基础,是学习者全面发展和终身学习能力的支撑。学习者的表达能力是培育学习者语文核心素养的重要内容,也是教育的"四大支柱"和"21世纪技能"中"学会合作"的核心要素。表达能力与"以素质教育为核心"的理念匹配,体现了学习者的综合素养。口语与书面表达都可以从文本的角度去评判,利用卷积神经网络(CNN)结合隐马尔科夫模型(HMM)能够准确识别中文字符。国际常用的表达评测体系涉及对文本内容、措词、结构、语气、同义词等不同表达的分析,多采用基于隐含语义分析(LSA)系统和深度神经网络(DNN)以及改进的算法进行文本的自动评分。
中文的表达一般要综合考虑语境、词法、句法、文采、语义以及篇章段落进行全面分析。对于文字段落进行序列化,一般利用Word2vec模型提取文本的字迹、词汇与通顺性等特征,利用上述特征矩阵表征文本的表达情况。从智能建模的视角看,中文形象语言的修辞水平多采用对隐喻的分析来进行。各类隐喻背后涉及学习者的认知过程,是神经语言程序学(NLP)的关注重点。一般采用人工制定的规则或深度学习提取特征分析属性依赖的概念,利用属性的本体映射进行隐喻的解释、识别与生成。对于其他修辞手法,例如借代、夸张、反复、象征、寄寓等的识别,可将混合神经网络与神经语言程序学结合,以判断段落与通篇文章的表达能力。后续的研究需要进一步分析文本中的认知与修辞的成分,扩充专家标注集,开展大规模对比与修正研究,以提升分析系统的整体水平。
四、小结
教育从来没有像今天这样迫切地需要智能技术,此时正是彰显教育信息化价值的最佳契机。以人工智能为代表的新兴信息技术正在重新定义学习者的知识与能力维度,计算素养、协作能力、复杂问题解决能力、人机协作能力等将成为新时代人才的核心能力。后疫情时代,人民群众对教育的需求更为多样,对更高质量、更加公平、更具个性的教育需求也更为迫切,需要发掘更能激发学习者学习进步的原动力,需要构筑能充分满足个人多元化需求的新型教育模式,需要建立教学过程的完整数据表征模型以及相应的评价方法。《深化新时代教育评价改革总体方案》的出台,体现了我国政府立足新的时代背景,对全面发展的人所应具备的创新精神与实践能力等综合素质的重大关切。在推动信息技术与教育深度融合的历史新时期,深入探索智能评价机制、理论体系、建模方法与关键技术,将学习视为复杂的现象,探究不同认知因素、社会情感因素、背景变量等因素影响学习的规律,助力真实教育需求的满足,既是难得的历史机遇,也是教育技术人理应具备的使命担当。
来源: 中国远程教育张琪 王丹
注:文章内的所有配图皆为网络转载图片,侵权即删!
Copyright C 20092014 All Rights Reserved 版权所有 粤ICP备2021158593号
地址: EMAIL:kf@fjzp.cn
Powered by PHPYun.