■随着技术的发展,大数据在教育领域有了越来越广泛的应用,学校拥有可用的、高质量的海量数据逐渐成为现实,但如何进行信息挖掘,给未来教育带来更大的可能,则对教育研究者的想象力提出了挑战。
■大数据需要每个人做基础工作,给未来留下数据,就是每个人对大数据最好的贡献。
“发现你上个月餐饮消费较少,不知是否有经济困难?”不久前,华东师范大学某女生收到了学校勤助中心发来的这样一条短信。而实际上,该女生不过是因为减肥而减少了食堂就餐的开销。
此事让人们惊呼学校“有爱”的同时,更让大家关注的,是学校实现“有爱”的方式,即华东师大利用预警系统跟踪学生的餐饮消费数据,发现低于警戒值就发出短信慰问,以确定学生是否有经济困难、是否需要帮助。
有人将此称作大数据,即通过分析行为数据,让对象选择更具有精准性。但更多的专家认为,这不过是大数据的起步阶段,是一种简单的数据挖掘,真正的大数据,将给教育带来翻天覆地的变化,甚至带来一场新的革命。
那么,究竟什么是真正的大数据?大数据是否已经悄悄进入教育领域?大数据将会给教育带来哪些不可思议的可能?拥抱大数据,我们又会面临哪些困境和挑战?
不要总喊“狼来了”,“狼”已经来了
一直以来,人们普遍认为,只有在物理学、化学、生物学、天文学等自然科学领域,观测、记录、挖掘海量数据才是有价值的,而在教育学、社会学、心理学、管理学等社会科学领域,通过设计实验及“正义的程序”调查出来的结果,常常难以得到普遍承认。
直到2012年,发生了一件重要的事情。
奥巴马的数据团队对数以千万计的选民邮件进行了大数据挖掘,精确预测出了更可能拥护奥巴马的选民类型,并进行了有针对性的宣传,从而帮助奥巴马成为了美国历史上唯一一位在竞选经费处于劣势下实现连任的总统。
“奥巴马的例子告诉我们,只要数据量够大,够及时,挖掘够深刻,我们完全可以洞悉每个选民的投票几率。”上海思来氏信息咨询有限公司教育测评中心首席研究员张韫说,“迅速普及的互联网与移动互联网,悄然为记录人的行为数据提供了最为便利、持久的载体。最重要的是,在这些强大的数据收集终端面前,人们没有掩饰的意图,从而创造着过去无法收集与分析的海量数据,这让所有社会科学领域能够从宏观群体走向微观个体,让跟踪每一个人的数据成为了可能,从而让研究人性成为了可能。”
而在教育领域,海量数据早在技术变革的浪潮中席卷而来。
2009年,孟加拉裔美国人萨尔曼·可汗创立了一家非营利教育组织——可汗学院,利用网络视频进行免费授课,涵盖数学、历史、金融、物理、化学、生物、天文学等科目的内容,他的教学视频像病毒一样广为传播,如今全球已有成千上万的学生通过互联网学习其视频课程。
随后,类似的课程如雨后春笋般冒出,普林斯顿、伯克利、宾夕法尼亚大学等知名学府都宣布加盟在线教育,逐步向全世界开放自己的课程。
在宾夕法尼亚州,从小学到高中都建立了在线学校,有的地方免费为选择参加在线学习的学生配发笔记本电脑、打印机和扫描仪,作为学习的工具。
……
“以在线教育为代表的各种综合技术的集合,让学生关于学习行为的各种数据被自动留存,例如做一道题花多长时间,是否经过修改,做题的顺序是否有跳跃,是否会回头重新检查……但要明确的是,仅仅是远程教育和在线课程,不过是数字而已,并不能称之为数据。”上海海事大学经济管理学院管理科学系副教授魏忠说,“以物联网、云计算等综合技术的成熟为基础,在学生管理数据库中挖掘出有价值的数据,经过过程性和综合性的考虑,找到学生各种行为之间的内在联系,考量背后的逻辑关系,并作出恰当的教学决策,这才能被称为大数据。”
“举个简单的例子,一个学生考试得了78分,这只是一个数字,如果把这78分背后的因素考虑进去,例如学生的家庭背景、努力程度、学习态度、智力水平等,把它们和78分联系在一起,这就成了数据。”魏忠说。
在研究者们看来,大数据有着明显的特征。
“一般来说有四点。第一,数据体量巨大。从数量单位的TB(太)级别,跃升到PB(帕)级别,也就是大了至少100倍。第二,数据类型繁多。包括所有的结构化、半结构化和非结构化(如图片、视频等)数据。第三,价值密度低,商业价值高。以视频为例,连续不间断监控过程中,可能有用的数据仅有一两秒。第四,处理速度快。”魏忠说。
显而易见,考试、课堂、师生互动、校园设备使用、家校关系……只要技术达到的地方,各个环节都将渗透大数据。
“无论是教育管理部门,还是校长、教师,以及学生和家长,都可以提供针对不同应用的个性化分析报告。通过大数据的分析来优化教育机制,做出更科学的决策,这将带来潜在的教育革命。”首都师范大学远程教育所所长方海光说,“谁能在其中把握好大数据,谁就能在将来的竞争中赢得主动权。”
于教育领域而言,大数据时代的到来,正如魏忠所说,不要总喊“狼来了”,“狼”真的已经来了。
学校在玩大数据
近年来,我国已有不少学校开始了数据挖掘的探索,但真正被业内人士承认的教育领域的大数据应用却为数不多,其中被公认的当数东华大学的智能实验室项目。
几年前,东华大学的实验室极为分散,十几个学院,每个学院都有三四个实验室,有的实验室甚至还在系里,教学评估要通过表格填报的方式来解决,数据的科学性和真实性都得不到保障,东华大学教务处处长吴良深感人工管理太吃力、效率也太低。
“2009年,我们提出智能管理的思路,即用物联网的方式把实验室里所有的仪器设备都管理起来。我们和专门研究数据挖掘的公司合作,在材料学院做了试点。”吴良说,“只要学生进入实验室,哪个学生使用了哪台仪器设备,使用了多长时间,基本所有的使用情况都能记录下来,所有仪器的电流、电压都可以监控。之后想要的数据由电信号直接产生,自动计算出来自动生成表格,实验室利用率等情况在表格上一目了然。”
如今,东华大学所有学院的实验室都纳入了智能实验室的管理。“从表格就可以看出,哪些实验室申请的设备根本不必购买,哪些实验室不再需要拨钱。实验室的使用率和第二年的经费完全挂钩,最后实现教育经费使用的集约高效。”吴良说。
另外,东华大学智能实验室还实现了24小时开放无人管理、跨学院使用等人工无法实现的管理,数据显示,智能实验室的管理对学生学习自主性的提高有显著影响,学生在实验室的时间甚至超过了在教室的时间。
“总体来看,目前开始进行数据挖掘的高校基本都是信息化做得较好、规模较大的学校,其主要原因是他们有充足的数据量。”魏忠说。
据了解,浙江大学通过对资产的归纳、整理,最终形成权威、全面的资产数据,并提供数据查询和分析服务。这些数据分析的成果已经被真正地应用起来,能够帮助教务处更好地利用教室、实验室等资源。
复旦大学则对特定的学生进行数据分析,并且得到一些非常有价值的数据。比如,从平均绩点看,来自东部地区、中部地区、西部地区学生的成绩呈递减趋势。在中部和西部地区,城镇学生成绩优于农村学生,东部地区则相反。分析认为,出现这种情况或与学生所受基础教育相关:在中、西部地区,城镇的基础教育资源和水平明显高于农村;而在东部地区,不少农村学生在基础教育阶段反而可能学得更深。
清华大学正在做一些学生成长类的数据分析。比如,针对进校时成绩很优秀的一批学生,追踪其在大学四年的各种数据,观察其成长路径,或者对毕业时表现很优秀的学生进行追溯。
“可以看出,目前高校对信息数据的挖掘主要集中在针对网络系统运行所做的数据分析、针对教学教务管理所做的支持、针对特定学生的分析、针对科研所做的数据分析支持等方面。”魏忠说。
而在中小学,一些数据挖掘的项目也在起步。
“在基于电子书包的一对一课堂数字化课堂教学中,国内也积累了大量大数据分析决策的典型案例。”方海光说,比如首都师范大学数字化学习实验室开发的数字化课堂的大数据分析应用,已经在扬州、常州等地中小学的200多个班级进行了多个学期的系统性试点应用,带来了教育效果的明显改变。
“在数字化课堂教学过程中,可以对学习过程进行数据形式化采集和描述,并基于课堂单元和学期单元进行学习过程的大数据挖掘和分析。教师通过这些数据和分析结果,可以即时进行教学控制和教学反思,从而提高课堂教学水平。学生和家长通过这些数据和分析结果,也可以尽快发现自己学习中的不足,进而也可以提高自己的学习水平。”方海光说。
“在国内尤其是北京、上海、广东等城市,大数据在教育领域有了越来越多的应用,像慕课、在线课程、翻转课堂等,已经有越来越多的学生加入到网上学习的行列中来。”北京师范大学教育技术学院教授、现代教育技术研究所所长何克抗说。
随着技术的发展,大数据在教育领域有了越来越广泛的应用,学校拥有可用的、高质量的海量数据逐渐成为现实,但如何进行信息挖掘,给未来教育带来更大的可能,则对教育研究者的想象力提出了挑战。
大数据时代,教育有哪些可能
“你现在上网的时候,有没有发现,这些网站正在变得越来越了解你?”张韫说,“比如淘宝网会根据你买过什么、浏览过什么,来判断你还有可能购买什么,而新浪微博会根据你关注了谁来判断你还可能对哪些人感兴趣。”
那么,如果技术能够帮助我们了解每一个学生的需求,绵延了2000多年的“因材施教”的理想,是否离我们更近了呢?
在张韫看来,这完全可能。“比如A同学做对了第4题,系统马上可以告诉他,他可以跳过第7题,因为做对第4题的同学几乎不可能做错第7题。如果B同学做错了第5题,那么系统会提示他继续练习第6题,因为这个知识点可能是该学生需要反复进行操练与巩固的。”张韫说,“学习分析系统让学生接受个性化的教育具有了可能。”
“基于在线学习和学习分析技术,大数据在老师的教学与学生的自主学习中,将会有更多应用和更重要的意义。”何克抗说,“在自主学习方面,网络将跟踪学生的整个学习过程,从中了解学生的学习方法和学习习惯,了解学生的个性、兴趣、爱好,从而获取相关数据,帮助学生了解自己的学习成果,更好地进行自主学习。而在教学方面,相关数据将便于老师了解学生的学习能力、认知能力,及时改进教学方法,使教学更加有针对性。另外,将来老师的在线课堂可能会拥有好几万学生,众多学生的思想交流所碰撞出的思想火花,将远远超过只有几十个人的传统课堂,教学效果可能比传统课堂更加明显。”
魏忠认为,大数据将会给更多的教育行为、教育活动带来新的可能。
“今后,高校的录取方式、用人单位的招聘方式,都可能发生极大的变化。”魏忠说,“在学生的学习成长过程中,将会积累大量的结构性、非结构性数据,例如每一次考试的成绩、学习的速度、在哪方面有特长、曾经获得过哪些奖励、参加过哪些社会活动等,在电子档案中将一目了然,包括学生的微博、社交活动中也会留下大量的信息,成长轨迹非常清晰,整个过程如果想要造假,成本会相当高。高校招人只需要看这些过程化的数据,选择适合自己学校的学生,整个高考录取行为可能变成持续不断的录取方式。学生的过程数据还可以显示,这个学生是更适合做医生还是工程师,更应该从哪个方向努力、从事什么工作,这对学生更为重要。”
同样,高校及用人单位的真实情况也将被数据记录下来。“我们都说清华大学好,但它好在哪里?哪些学科排名多少?有哪些名师?特色在哪里?大数据将为学生提供精确的信息,结果是,不再有那么多学生追求名校,而是会选择适合自己的学校和学科。”魏忠说。
“未来,当数据量积累到了一定的程度,教育将从社会科学变成实证学科,大数据将成为研究人类教育行为的基石。”魏忠说。
方海光认为,对于不同层面的决策者,大数据都会带来不同的惊喜。对于教育行政部门、学校而言,大数据将帮助他们在管理行为上做出更加科学而非经验判断式的决策;对于教育研究者来说,他们能够重新审视学生的需求,通过高新的技术以及细致的分析,找到怎样的课程、课堂、教师能够更加吸引学生;对于学生而言,新技术能够解放他们本来就有的学习能力和天分,人力资本将成倍地增长。
“总之,大数据将让学习变成一种服务。”方海光说。
什么在阻挡大数据的来袭
大数据在教育领域应用的前景很光明,但在专家们看来,道路却十分曲折。
“好的内容比平台重要。”张韫说。在他看来,国内教育领域最大的问题在于没有留存数据、收集数据的意识。
对此,魏忠深有同感。“照理说,我国教育领域的数据资源是非常丰富的,但是我们却面临着数据的严重匮乏。比如教计算机的老师,如果不愿意进实验室,那么数据从何而来?如果老师有心把作业变成资源放在网络上,把知识变成题库实施任务教学,那将会给未来的教学带来成千倍的回馈。”
采集工具的研发也是大数据发展的绊脚石之一。“这需要开放市场,鼓励和发展一些中小企业、私营企业来开发平台和系统,技术的研发才会生长出活力,否则,研发的速度太慢。”魏忠说。
有了数据、有了研发工具,大数据的应用仍面临诸多难题。
在不久前中国高等教育学会信息化分会青委会举行的一次技术论坛上,多个高校的相关研究人员提出了自己的困惑。
清华大学信息化技术中心袁芳认为,业务需求是所有数据分析的目的,拥有了需求,高校才能有针对性地对数据进行分析,但最让她困惑的,是不知道数据挖掘有哪些“需求”。她认为,这对于高校研究人员而言,是一种很被动的情形。“我们只好先假设一些目标,做一些我们认为有意义的分析,然后把结果给业务部门看,期待着他们会发现,原来数据挖掘可以帮助他们实现这样的功能。那么,也许可以启发出他有别的需求。反正就是尽自己可能变被动为主动。”袁芳说。
当有了数据挖掘的需求,技术人才的缺乏又将成为挑战。“数据分析对于技术人员的要求很高,要求他们不仅精通技术,也要熟悉校园网业务,而这样的人才目前很缺乏。”张韫说。
此外,数据挖掘机制方面,学校也急需理顺。华东师范大学信息化办公室主任沈富可在论坛上提出,关于数据挖掘,国内的院校研究也已起步,但尚停留在学术研究层面,高校内鲜有带有行政管理职能的院校研究机构成立,其功能定位、研究范畴和研究方法与国外院校研究相比,尚有较大差距。其研究人员多是高等教育学专业背景的人员,虽从美国引进、传播了院校研究的概念,并尝试推动了院校研究的实践,但数据分析作为现代院校研究的基础和重要内容,尚未引起我国大多数致力于院校研究的学者的重视。
沈富可认为,数据分析作为推动高校未来发展的一项很有战略眼光的事业,应当从整个管理体制中完善。以美国纽约大学为例,其数据管理体制中有两个重要角色,即数据管理员和院校研究办公室。他们的数据分析是由院校研究办公室自上而下地开展工作,院校研究办公室直接从学校数据仓库获取数据,信息化部门密切与之配合,双方协同确保学校数据的准确性和完整性,我国高校在数据挖掘方面也可以参考这一机制。
在方海光看来,教育行政部门、学校等教育组织的决策者还将面临打破常规、加大创新力度、增加主动性等方面的挑战,而这,往往是最艰难的一步。
可以想见,走向大数据时代,教育领域还有重重困难需要跨越。
“但是,不管怎样,我们至少需要跨出第一步。”魏忠说,“大数据需要每个人做基础工作,给未来留下数据,就是每个人对大数据最好的贡献。”