京公网安备 11010802034615号
经营许可证编号:京B2-20210330
大数据来了,教育如何站位_数据分析师培训
维克托·迈尔-舍恩伯格,牛津大学互联网研究所教授,担任微软、世界经济论坛等大公司和组织的顾问,是大数据领域公认的权威,写过《大数据时代》等八本书和上百篇论文。
读完维克托·迈尔-舍恩伯格和肯尼思·库克耶的《大数据时代:生活、工作与学习的未来》(华东师范大学出版社),我开始理解了什么叫大数据。在作者眼中,大数据“是当今社会所独有的一种新型能力:以一种前所未有的方式,通过对海量数据进行分析,获得巨大价值的产品和服务,或深刻的洞见。”联想到购物网站推荐的各类产品以及旅游网站上各种优惠信息,我很容易地理解了大数据带来思维变革、商业变革和管理变革的社会现实。作为一名教育工作者,我更希望能够通过他们的新书,在一定程度上回答“大数据离我们有多近”和“大数据离我们有多远”这两个问题。
大数据离我们有多近
不论我们喜不喜欢,教育领域正在开展的一些教育实验,如微课程、翻转课堂、慕课、电子书包等都是当前寻求教育变革的一些尝试。仔细分析这些实验不难发现它们都离不开——数据,类似的教学改革都围绕一个主题,即为学生提供学习资源,并在学生学习过程中获取学习数据,随后积累、分析和应用这些数据,然后为他们提供评价与反馈,也就是说基于数据的教与学实际上是当前众多教育变革的方向。
《与大数据同行:学习和教育的未来》这本书让我们看到了互联网时代的我们通过教育平台能够获得的数据之大,“它们能够告诉我们什么是最有效率的,并且揭示那些过去无从发现的。”他们认为:“在某些方面,慕课仍然等同于强调‘讲台上的贤能者的传统教育’……而慕课的其中一个构成要素却是崭新而强大的,那就是它能产生大数据。因此,虽然在每一门慕课课程中流失的学生非常厉害,但是就像吴恩达教授的教学结果那样,即使只有10%的学生完成课程学习,那这个数字也是1.3万人,“如果凭借传统的教学手段,则需要他终其一生才能达成”。
细细想来,类似的海量数据不单单为可汗学院的在线平台所拥有,并且也为很多政府部门、搜索平台、在线教育机构所拥有,因此有关未来教育的关键词中一定会有基于数据的决策。有关学习行为、学习喜好与风格、学习动机与态度的数据等,都将成为教育决策的依据,而且每个利益相关的群体和个人都能从中获益。如政府部门制定政策、教师调整教学策略、学生进行自我分析、家长了解孩子成长、社会机构分析教育现状等,都可能因为有大数据的帮助,逐步从基于常识的决策走向基于数据的决策,减少盲目性,正如作者所说的那样:“可以打破‘一个尺寸适合所有人’的同质性”(P36),把有效努力从无效努力中分离出来。”这样看来,大数据离我们并不远。然而,普通老师、教育管理者或者家长看到了大数据的教育应用价值吗?或者说,大数据的影响有作者说的那么大吗?
大数据离我们有多远
《与大数据同行:学习和教育的未来》并不是那么容易读明白的书,它富于感性色彩的六个标题语让我在略读阶段经常迷失,在精读时,我全面梳理了这本书的结构,如左下图所示:当我一部分一部分去审视这些内容时,不难发现,作者提到的大数据在教育领域中产生的众多影响似乎都是刚刚开了头,甚至还很难想清楚普通老师和管理者从哪些渠道可以得到自己想要的数据,我们的教与学也还没开始大规模地从大数据中获得有用的信息,更不用说有效应用大数据做到教育创新了。本书实例很典型,但数量比较有限,让我感觉大数据似乎离我们还很远。
在阅读过程中,我尝试跟着作者的思路看看我所关心的教育领域与大数据有效应用之间的距离。
1.关于教师的角色转变
“大数据帮助教师确定最有效的教学方式,这非但不会剥夺他们的工作,反而会提高工作的效率和趣味性”(P9)。“教师不再需要凭借主观判断选择最适合教学的书籍,大数据分析将指引他们选出最有效的、支持进一步完善和私人定制的教材……教材是可以进行个性化处理的(P40-41)”。
教育变革时代教师角色的转变是很多人的共识。过去教师们一直在利用各种各样的数据,特别是测验数据、自己观察到的数据、家长那里得到的数据等进行教学并关注学生的成长。这些数据往往是个人性的,评价重点基本上落在学习成绩和课堂行为上,缺乏大视野下对学生发展整体水平的判断,因此特别强调统一标准和齐头并进。然而大数据将这些数据放大了很多倍,成千上万个体互动的正式或非正式的学习数据都会成为教师可以分析和利用的数据,他们可以从对这些数据的分析中获取让学生学得更好、更有效率的信息,了解不同学习内容、学习方式对不同类型学生学习的帮助,从而在进行教学设计时从宏观上把握大局,设计有益于学生自主与合作学习的教学活动,在教学实施与评价方面则发挥每个学生的能动性,将个性化与差异化教学变成现实。教师们的角色也因此从讲台上的传授者逐步转化为学生学习的指导者、助学者。
但是,我们的老师能得到这样做的机会吗?或者都有能力这样做吗?
2.关于学生的学习
“然而我们在其他行业见到的类似的多样性和定制化,尚未在教育领域大规模地显现”(P33).“学生们受到同样的对待、使用同样的教材、做同样的习题集,这不能称为个性化学习”(P34).“我们可以对知识的传递进行个性化处理,使之更好地适应特定的学习环境、偏好和学生能力”(P36)。
学习对每个个体而言都不是一个线性进步的过程,从大数据中,人们可以发现一个人在学习过程中所经历的所有学习体验和学习结果,对教育者来说,有可能了解学生学习的探索和发现历程,提供更有效的学习支持;对学生自己来说,可以有效地反思学习策略与方法,并不断完善它们;对家长而言,了解自己的孩子,发现孩子的长处,也能够更好地帮助孩子树立面对未来的信心……而所有这些学习分析,都建立在学生互动交流的数据基础上,它们是动态变化的、及时反馈的、多方面的,大数据一方面避免了我们从时间维度上仅以某个阶段的学习数据对学生作出一成不变评价,另一方面,也避免了在空间维度上仅仅观察学生的某些方面,如学业成绩、课堂表现等就给学生一个评价结论的情况,因为学生在线的交流水平,对自己学习掌控,对知识和技能的贡献,学习的视野和能力等都会成为动态分布数据的一部分,这样,学生真正的个性化学习需求和水平就能得到全面的考察与衡量,针对性的个性化学习辅导也才有可能落到实处。但是我们常常做的是不是提出统一的要求,让学生机械地按照我们指定的内容和方式学习?我们观察的数据是不是仍然要以学生的学业为主?
3.关于大数据的分析视角
“质量控制通常交由专门机构负责,其任务是还原事实,而不是把情况描述成管理者希望的样子”(P56)。“大数据有能力将数据的生成与处理、利用分隔开来——在信息上与教育松绑,同时将学校和课本转化为数据平台,促进学习的改善”(P59)。
从教育的视角看,大数据分析主要关注两大领域:学习领域和学术领域(Anirban, 2015)。如果期望从大数据中获得关于学生成长的全面数据,分析的视角十分重要。姜强等人认为:“教育中的大数据分析应以崭新的思维和技术重点对学习过程中的微观表现进行测量,从多个维度,如努力程度、学习态度、智力水平、领域能力、交互协作等深层次挖掘有价值数据信息,揭示其中隐藏的学习行为等模式并以可视化方式呈现。”这其实也反映了基于大数据的学习分析是对学习者群体与个体的众多方面进行全面的数据整合,发现规律,根据规律提出合理的预测,从而指导学习者改进学习。
因此,它需要专业人士(算法专家)来做这样的工作,并避免单一视角或不全面的分析,特别是对数据的流动要敏感,以避免本书两位作者所提到的现象:运用大数据给一部分学生贴上了标签,使“我们的社会倒退为一种近似种姓制度的新形式——精英和高科技封建主义的古怪联姻。”(P90)然而我们当前使用大数据是不是基本局限于信息管理和评价学业成绩呢?
4.关于基于大数据的教育创新
“当下面临的变革并不是技术层面上的。这种改变影响着我们能够收集的数据类型以及我们对这些数据的挖掘方式,促使我们对学习、教学和获取知识的过程展开全新的理解(P102)。
不论什么时代,变革往往都不是线性的,教育变革也不是一级一级向上升的过程。尽管今天的在线教育已经成为教育创新的孵化器,但是仅仅依靠在线教育去思考教育创新是远远不够的。传统教育与在线教育并非非此即彼的关系,很多教育工作者更加强调混合学习模式下的教与学,认为学习者准确提供从大数据中获得的形成性反馈信息才是大数据的优势所在,因为教师们是无法做到一直为学生们提供形成性反馈的具体信息的,只有网络平台才可以做到。所以无论是可汗学院,还是慕课平台,他们是教育创新的重要示范。
如何将在线课程与教师组织的课堂教学有机结合起来?如何充分利用混合学习模式的优势开展教与学?如何把从这种混合学习模式中得到的学习大数据有效分析和利用?
5.关于大数据带来的风险
“它还有可能加深教育鸿沟,使社会和经济上的鸿沟持续存在,更多的妇女和少数族裔将被上层淘汰”(P88)。
和任何崛起的技术一样,大数据带来的风险也是显而易见的,如谁拥有大数据、个人隐私如何保护、从哪个视角去分析大数据、从大数据中获得的信息如何被恰当分析并有效反馈给学习者和公众等,都是应用大数据会碰到的问题。此外,有些人有更多机会获取和利用大数据,而有些人缺乏获取大数据的渠道,还有人缺乏一定知识技来理解和应用大数据,所以大数据确有可能导致更加不平等的现象出现,这本身有违大数据让更多人更便捷、更公平使用网络资源的初衷。要解决这样的问题,仅靠努力改善大数据的应用环境是远远不够的,因此作者指出:“如果教育中的大数据看起来在造就不公平和促成新的不平等,那么公共政策就要跟进了。(P123)公共政策如何跟进?
由于本书的容量不是很大,作者对大数据与教育的关系进行的是初步、广泛的分析,它对于我们特别关注的大数据在教育中的多方面应用,只是提供了一些基本的线索。然而作为一本教育大数据的启蒙读本,它还是值得我们阅读,并且能够启发我们思考。
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
在数据驱动的时代,数据分析早已不是“凭经验、靠感觉”的零散操作,而是一套具备固定逻辑、标准化流程的系统方法——这就是数据 ...
2026-04-09长短期记忆网络(LSTM)作为循环神经网络(RNN)的重要改进模型,凭借其独特的门控机制(遗忘门、输入门、输出门),有效解决了 ...
2026-04-08在数据分析全流程中,数据质量是决定分析结论可靠性的核心前提,而异常值作为数据集中的“异类”,往往会干扰统计检验、模型训练 ...
2026-04-08在数字经济飞速发展的今天,数据已渗透到各行各业的核心场景,成为解读趋势、优化决策、创造价值的核心载体。而数据分析,作为挖 ...
2026-04-08在数据分析全流程中,数据处理是基础,图形可视化是核心呈现手段——前者负责将杂乱无章的原始数据转化为干净、规范、可分析的格 ...
2026-04-07在数据分析与统计推断中,p值是衡量假设检验结果显著性的核心指标,其本质是在原假设(通常为“无效应”“无差异”)成立的前提 ...
2026-04-07在数字经济深度渗透的今天,数据已成为企业生存发展的核心资产,企业的竞争本质已转变为数据利用能力的竞争。然而,大量来自生产 ...
2026-04-07Python凭借简洁的语法、丰富的生态库,成为算法开发、数据处理、机器学习等领域的首选语言。但受限于动态类型、解释性执行的特性 ...
2026-04-03在深度学习神经网络中,卷积操作是实现数据特征提取的核心引擎,更是让模型“看懂”数据、“解读”数据的关键所在。不同于传统机 ...
2026-04-03当数字化转型从企业的“战略口号”落地为“生存之战”,越来越多的企业意识到,转型的核心并非技术的堆砌,而是数据价值的深度挖 ...
2026-04-03在日常办公数据分析中,数据透视表凭借高效的汇总、分组功能,成为Excel、WPS等办公软件中最常用的数据分析工具之一。其中,“计 ...
2026-04-02在数字化交互的全场景中,用户的每一次操作都在生成动态的行为轨迹——电商用户的“浏览商品→点击详情→加入购物车”,内容APP ...
2026-04-02在数字化转型深度推进的今天,企业数据已成为驱动业务增长、构建核心竞争力的战略资产,而数据安全则是守护这份资产的“生命线” ...
2026-04-02在数据驱动决策的浪潮中,数据挖掘与数据分析是两个高频出现且极易被混淆的概念。有人将二者等同看待,认为“做数据分析就是做数 ...
2026-04-01在数据驱动决策的时代,企业与从业者每天都会面对海量数据——电商平台的用户行为数据、金融机构的信贷风险数据、快消品牌的营销 ...
2026-04-01在数字化转型的浪潮中,企业数据已从“辅助运营的附属资源”升级为“驱动增长的核心资产”,而一套科学、可落地的企业数据管理方 ...
2026-04-01在数字化时代,每一位用户与产品的交互都会留下可追溯的行为轨迹——电商用户的浏览、加购、下单,APP用户的注册、登录、功能使 ...
2026-03-31在日常数据统计、市场调研、学术分析等场景中,我们常常需要判断两个分类变量之间是否存在关联(如性别与消费偏好、产品类型与满 ...
2026-03-31在CDA(Certified Data Analyst)数据分析师的职场实战与认证考核中,“可解释性建模”是核心需求之一——企业决策中,不仅需要 ...
2026-03-31多层感知机(MLP,Multilayer Perceptron)作为深度学习中最基础、最经典的神经网络模型,其结构设计直接决定了模型的拟合能力、 ...
2026-03-30