京公网安备 11010802034615号
经营许可证编号:京B2-20210330
大数据来了,教育如何站位_数据分析师培训
维克托·迈尔-舍恩伯格,牛津大学互联网研究所教授,担任微软、世界经济论坛等大公司和组织的顾问,是大数据领域公认的权威,写过《大数据时代》等八本书和上百篇论文。
读完维克托·迈尔-舍恩伯格和肯尼思·库克耶的《大数据时代:生活、工作与学习的未来》(华东师范大学出版社),我开始理解了什么叫大数据。在作者眼中,大数据“是当今社会所独有的一种新型能力:以一种前所未有的方式,通过对海量数据进行分析,获得巨大价值的产品和服务,或深刻的洞见。”联想到购物网站推荐的各类产品以及旅游网站上各种优惠信息,我很容易地理解了大数据带来思维变革、商业变革和管理变革的社会现实。作为一名教育工作者,我更希望能够通过他们的新书,在一定程度上回答“大数据离我们有多近”和“大数据离我们有多远”这两个问题。
大数据离我们有多近
不论我们喜不喜欢,教育领域正在开展的一些教育实验,如微课程、翻转课堂、慕课、电子书包等都是当前寻求教育变革的一些尝试。仔细分析这些实验不难发现它们都离不开——数据,类似的教学改革都围绕一个主题,即为学生提供学习资源,并在学生学习过程中获取学习数据,随后积累、分析和应用这些数据,然后为他们提供评价与反馈,也就是说基于数据的教与学实际上是当前众多教育变革的方向。
《与大数据同行:学习和教育的未来》这本书让我们看到了互联网时代的我们通过教育平台能够获得的数据之大,“它们能够告诉我们什么是最有效率的,并且揭示那些过去无从发现的。”他们认为:“在某些方面,慕课仍然等同于强调‘讲台上的贤能者的传统教育’……而慕课的其中一个构成要素却是崭新而强大的,那就是它能产生大数据。因此,虽然在每一门慕课课程中流失的学生非常厉害,但是就像吴恩达教授的教学结果那样,即使只有10%的学生完成课程学习,那这个数字也是1.3万人,“如果凭借传统的教学手段,则需要他终其一生才能达成”。
细细想来,类似的海量数据不单单为可汗学院的在线平台所拥有,并且也为很多政府部门、搜索平台、在线教育机构所拥有,因此有关未来教育的关键词中一定会有基于数据的决策。有关学习行为、学习喜好与风格、学习动机与态度的数据等,都将成为教育决策的依据,而且每个利益相关的群体和个人都能从中获益。如政府部门制定政策、教师调整教学策略、学生进行自我分析、家长了解孩子成长、社会机构分析教育现状等,都可能因为有大数据的帮助,逐步从基于常识的决策走向基于数据的决策,减少盲目性,正如作者所说的那样:“可以打破‘一个尺寸适合所有人’的同质性”(P36),把有效努力从无效努力中分离出来。”这样看来,大数据离我们并不远。然而,普通老师、教育管理者或者家长看到了大数据的教育应用价值吗?或者说,大数据的影响有作者说的那么大吗?
大数据离我们有多远
《与大数据同行:学习和教育的未来》并不是那么容易读明白的书,它富于感性色彩的六个标题语让我在略读阶段经常迷失,在精读时,我全面梳理了这本书的结构,如左下图所示:当我一部分一部分去审视这些内容时,不难发现,作者提到的大数据在教育领域中产生的众多影响似乎都是刚刚开了头,甚至还很难想清楚普通老师和管理者从哪些渠道可以得到自己想要的数据,我们的教与学也还没开始大规模地从大数据中获得有用的信息,更不用说有效应用大数据做到教育创新了。本书实例很典型,但数量比较有限,让我感觉大数据似乎离我们还很远。
在阅读过程中,我尝试跟着作者的思路看看我所关心的教育领域与大数据有效应用之间的距离。
1.关于教师的角色转变
“大数据帮助教师确定最有效的教学方式,这非但不会剥夺他们的工作,反而会提高工作的效率和趣味性”(P9)。“教师不再需要凭借主观判断选择最适合教学的书籍,大数据分析将指引他们选出最有效的、支持进一步完善和私人定制的教材……教材是可以进行个性化处理的(P40-41)”。
教育变革时代教师角色的转变是很多人的共识。过去教师们一直在利用各种各样的数据,特别是测验数据、自己观察到的数据、家长那里得到的数据等进行教学并关注学生的成长。这些数据往往是个人性的,评价重点基本上落在学习成绩和课堂行为上,缺乏大视野下对学生发展整体水平的判断,因此特别强调统一标准和齐头并进。然而大数据将这些数据放大了很多倍,成千上万个体互动的正式或非正式的学习数据都会成为教师可以分析和利用的数据,他们可以从对这些数据的分析中获取让学生学得更好、更有效率的信息,了解不同学习内容、学习方式对不同类型学生学习的帮助,从而在进行教学设计时从宏观上把握大局,设计有益于学生自主与合作学习的教学活动,在教学实施与评价方面则发挥每个学生的能动性,将个性化与差异化教学变成现实。教师们的角色也因此从讲台上的传授者逐步转化为学生学习的指导者、助学者。
但是,我们的老师能得到这样做的机会吗?或者都有能力这样做吗?
2.关于学生的学习
“然而我们在其他行业见到的类似的多样性和定制化,尚未在教育领域大规模地显现”(P33).“学生们受到同样的对待、使用同样的教材、做同样的习题集,这不能称为个性化学习”(P34).“我们可以对知识的传递进行个性化处理,使之更好地适应特定的学习环境、偏好和学生能力”(P36)。
学习对每个个体而言都不是一个线性进步的过程,从大数据中,人们可以发现一个人在学习过程中所经历的所有学习体验和学习结果,对教育者来说,有可能了解学生学习的探索和发现历程,提供更有效的学习支持;对学生自己来说,可以有效地反思学习策略与方法,并不断完善它们;对家长而言,了解自己的孩子,发现孩子的长处,也能够更好地帮助孩子树立面对未来的信心……而所有这些学习分析,都建立在学生互动交流的数据基础上,它们是动态变化的、及时反馈的、多方面的,大数据一方面避免了我们从时间维度上仅以某个阶段的学习数据对学生作出一成不变评价,另一方面,也避免了在空间维度上仅仅观察学生的某些方面,如学业成绩、课堂表现等就给学生一个评价结论的情况,因为学生在线的交流水平,对自己学习掌控,对知识和技能的贡献,学习的视野和能力等都会成为动态分布数据的一部分,这样,学生真正的个性化学习需求和水平就能得到全面的考察与衡量,针对性的个性化学习辅导也才有可能落到实处。但是我们常常做的是不是提出统一的要求,让学生机械地按照我们指定的内容和方式学习?我们观察的数据是不是仍然要以学生的学业为主?
3.关于大数据的分析视角
“质量控制通常交由专门机构负责,其任务是还原事实,而不是把情况描述成管理者希望的样子”(P56)。“大数据有能力将数据的生成与处理、利用分隔开来——在信息上与教育松绑,同时将学校和课本转化为数据平台,促进学习的改善”(P59)。
从教育的视角看,大数据分析主要关注两大领域:学习领域和学术领域(Anirban, 2015)。如果期望从大数据中获得关于学生成长的全面数据,分析的视角十分重要。姜强等人认为:“教育中的大数据分析应以崭新的思维和技术重点对学习过程中的微观表现进行测量,从多个维度,如努力程度、学习态度、智力水平、领域能力、交互协作等深层次挖掘有价值数据信息,揭示其中隐藏的学习行为等模式并以可视化方式呈现。”这其实也反映了基于大数据的学习分析是对学习者群体与个体的众多方面进行全面的数据整合,发现规律,根据规律提出合理的预测,从而指导学习者改进学习。
因此,它需要专业人士(算法专家)来做这样的工作,并避免单一视角或不全面的分析,特别是对数据的流动要敏感,以避免本书两位作者所提到的现象:运用大数据给一部分学生贴上了标签,使“我们的社会倒退为一种近似种姓制度的新形式——精英和高科技封建主义的古怪联姻。”(P90)然而我们当前使用大数据是不是基本局限于信息管理和评价学业成绩呢?
4.关于基于大数据的教育创新
“当下面临的变革并不是技术层面上的。这种改变影响着我们能够收集的数据类型以及我们对这些数据的挖掘方式,促使我们对学习、教学和获取知识的过程展开全新的理解(P102)。
不论什么时代,变革往往都不是线性的,教育变革也不是一级一级向上升的过程。尽管今天的在线教育已经成为教育创新的孵化器,但是仅仅依靠在线教育去思考教育创新是远远不够的。传统教育与在线教育并非非此即彼的关系,很多教育工作者更加强调混合学习模式下的教与学,认为学习者准确提供从大数据中获得的形成性反馈信息才是大数据的优势所在,因为教师们是无法做到一直为学生们提供形成性反馈的具体信息的,只有网络平台才可以做到。所以无论是可汗学院,还是慕课平台,他们是教育创新的重要示范。
如何将在线课程与教师组织的课堂教学有机结合起来?如何充分利用混合学习模式的优势开展教与学?如何把从这种混合学习模式中得到的学习大数据有效分析和利用?
5.关于大数据带来的风险
“它还有可能加深教育鸿沟,使社会和经济上的鸿沟持续存在,更多的妇女和少数族裔将被上层淘汰”(P88)。
和任何崛起的技术一样,大数据带来的风险也是显而易见的,如谁拥有大数据、个人隐私如何保护、从哪个视角去分析大数据、从大数据中获得的信息如何被恰当分析并有效反馈给学习者和公众等,都是应用大数据会碰到的问题。此外,有些人有更多机会获取和利用大数据,而有些人缺乏获取大数据的渠道,还有人缺乏一定知识技来理解和应用大数据,所以大数据确有可能导致更加不平等的现象出现,这本身有违大数据让更多人更便捷、更公平使用网络资源的初衷。要解决这样的问题,仅靠努力改善大数据的应用环境是远远不够的,因此作者指出:“如果教育中的大数据看起来在造就不公平和促成新的不平等,那么公共政策就要跟进了。(P123)公共政策如何跟进?
由于本书的容量不是很大,作者对大数据与教育的关系进行的是初步、广泛的分析,它对于我们特别关注的大数据在教育中的多方面应用,只是提供了一些基本的线索。然而作为一本教育大数据的启蒙读本,它还是值得我们阅读,并且能够启发我们思考。
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
在数据统计分析、数据清洗、异常值识别与数据分布研究中,箱型图是最直观、高效、专业的可视化分析工具。相较于柱状图、折线图仅 ...
2026-05-29Tkinter是Python内置的标准GUI图形界面库,具备无需额外安装、调用简单、兼容性强、轻量化高效等优势,是Python快速开发桌面小程 ...
2026-05-29 很多分析师在设计标签时思路清晰,但真到落地环节却面临“数据在手,不知如何转化为可用标签”的困境:或因加工方式选择不当 ...
2026-05-29【核心关键词】大数据、经理、专业、金融、客户、传统、建模、数据产品、互联网金融、产品经理、数据分析、金融行业、数据模型 ...
2026-05-28 很多分析师每天和数据打交道,但当被问到“标签是什么”“标签和指标有什么区别”“标签体系如何设计”时,却常常答不上来。 ...
2026-05-28随着大数据技术的快速普及,各行各业积累了海量的用户数据、交易数据、生产数据与行为数据。单纯的数据统计与报表分析只能呈现表 ...
2026-05-28在Python网络请求、接口测试、数据爬取、业务对接开发中,Requests库是最简洁、最高效的HTTP请求工具,凭借简洁的语法、完善的适 ...
2026-05-272025 年,零售与服务行业的竞争已从 “经验驱动” 全面转向 “数据驱动”。中小企业门店普遍面临数据零散、分析浅层、决策凭感觉 ...
2026-05-27 很多数据分析师每天都在写SQL,但当被问到“数据查询语言(DQL)的本质是什么”“SELECT语句中各子句的书写顺序与实际执行顺 ...
2026-05-27在统计学分析、实验研究、业务数据复盘过程中,单因素方差分析是检验自变量对因变量是否存在显著影响的核心方法。其中,两个水平 ...
2026-05-26【核心关键词】算法、客户、大数据、互联网、调优、建模、模型优化、机器学习、评分卡模型、模型开发、智能风控、业务场景、数 ...
2026-05-26 很多数据分析师写过无数个 SELECT,但当被问到“新建一张表,该如何定义字段类型来保证数据质量”“创建视图和存储物理表有 ...
2026-05-26在数据清洗、统计分析与数据质量检测工作中,箱型图(又称箱线图、Box Plot)是最直观、最高效的可视化分析工具之一。相较于柱状 ...
2026-05-25在大数据分析、数据清洗、质量管控、风险监测等领域,异常数据识别是保障数据质量、确保分析结论精准、规避业务决策失误的核心基 ...
2026-05-25 很多数据分析师精通Excel函数和透视表,但当被问到“数据从哪里来”“表和视图有什么区别”“数据库管理系统和SQL是什么关系 ...
2026-05-25数字化经营时代,企业的市场竞争早已从经验决策转向数据决策。门店营收、用户转化、产品销量、成本损耗、存量资产等所有经营行为 ...
2026-05-22在MySQL数据库日常运维、业务数据校验、数据迁移与数据清洗场景中,自增主键ID的连续性校验是一项基础且关键的工作。MySQL的Auto ...
2026-05-22 很多企业团队并非缺乏指标,而是陷入“指标失控”:仪表盘上堆满实时跳动的数据,却无法回答“当前瓶颈在哪、下一步该做什么 ...
2026-05-22【核心关键词】大数据、可视化、存储、架构、客户、离线、产品、同步、实时、数据仓库、数据分析、数据可视化、存储数据、离线 ...
2026-05-21在电商流量红利消退、公域获客成本持续走高的当下,存量用户深度挖掘已成为店铺增收增效的核心抓手。相较于付费投放获取的陌生新 ...
2026-05-21