
大数据时代的学习与评价:学习证据源自何处
大数据技术已逐步进入学校教育当中。数据量的大小不是我们判断其是否为“大数据”的唯一依据,我们还应从数据收集源头、数据节点规模、测量对象、机器作用及数据分析者职责等角度对其进行综合认识。
数据收集源头
得 益于信息技术的迅猛发展,人们可以将学习证据的收集嵌入到整个学习过程中。这些嵌入式数据节点可能很小,或是为学习者提供的反馈;或是个性化学习环境中为 个别学生下一步学习做出的决策;它们或聚合到更高层次,为学习者特征分析提供依据;或在学校、班级、小组、个体层面生成数据,为教育管理中的问责服务。
坐 拥更全面的数据源,人们有可能超越传统的测试手段。嵌入式评估将模糊形成性评价与总结性评价的界限。当学习过程嵌入了数据收集功能时,人们可以追踪学习者 的学习活动、记录学习过程、分析学习成果的成因和品质。学习分析与数据挖掘可以归纳出学习进展的总结性信息;它同时又能全方位地深入到具体项目以及学习者 所产生的任何一个数据节点中,浏览过程性信息。在此背景下,“反思性教学法”将取代传统的“教学—评价”二元教学法。传统的形成性评价与总结性评价是不同 目的、不同形式的数据收集方式;未来,我们可能需要“前瞻式学习分析”与“回顾式学习分析”,它们所处理的不是不同批次的数据,而是针对同一批数据从前瞻 或回顾的角度进行分析和利用。
数据节点的规模
与 大教育中大数据的“大”一样重要的是,其数据节点的“小”。事实上,这是数据变得更“大”的唯一原因。“小”节点可能表现为学习者回答的一个问题、在模拟 情境中的一个动作,或在论坛当中的一次评论。更“小”的形式,还可能是一次按键、一个时间戳、导航路径中的一次点击、维基百科或博客中的某次编辑历史。学 习本身并没有变得更“大”,只是我们可以附着记录的学习事件变得更“小”了,它们的总和也因此前所未有地变大,以至于如果没有计算机综合技术的支持,人类 是难以处理和驾驭它们的。
测量的对象
经 典测试大多沿袭以下路线:学习中的认知发展——测试中的观察——将测试结果作为认知的证据进行解释。传统的测试对象单独位于学习过程之后,并支持回顾式解 释。然而,在以机器为中介的学习中,人们对学习证据的关注点已经转移到真实的知识人工制品上,并倾向于记录学习者利用学科知识所进行的实践,因为知识表征 可能存在于学科知识实践的人工制品及其建构过程之中。换句话说,我们分析的重点不在于学习者所能思考的内容,而在于他们所做的知识表征。
这 些人工制品含纳了许多复杂认知的表现,具体如科学实验报告、人类或社会现象报告、历史学论文、带有注释的艺术品、视频故事、商业案例研究、发明或设计的物 品、数学或统计案例、田野研究报告或根据用户故事编写的可执行的计算机代码等。这些人工制品是可识别的、可评估的、可衡量的。它的源起是可被验证的,其构 建过程中的任何一个步骤都是可被追溯的。围绕知识加工展开的数据收集范围也被极大地拓展:自然语言处理、任务所花时间、同行或自我回顾、同行评议、编辑历 史和导航路径等。
机器的作用
大 数据并不完全依赖由机器生成,尽管机器可以通过人格化的用户界面表现出非凡的智力。计算机仅是一种人类沟通的技巧、对原有文本结构的扩展。它是人类认知的 补充体、社会思想的延伸、文明传承史中的一部分。在大数据时代,通过收集和计算大量前人的判断,人类的智慧得以放大。数以百万计的、微小的人类事件被记录 在可以聚合的数据节点之中,为教师、教育项目设计师或研究人员提供重要证据。机器看起来十分聪慧,但它们聪慧的意义仅限于它们所收集并计算的众多人类智 慧,就像书籍、图书馆和教师过去所做的那样,只不过它们比真人教师和学习者所能处理的数据量更大罢了。计算机的智慧是有限的,它们只不过是记录和外化人类 思想的机器而已。
数据分析师职责
现 如今,人人都是数据分析师。在软件工程师和用户界面设计师创造的环境中,用户没有必要掌握其中的模糊统计公式,因为突出的学习信息将以可视化的方式呈现, 用户可以利用它们深入追溯具体的学习序列。教师通过访问数据来了解学生并调整教学。在这种证据化的环境下,教师可以也应该是位研究者。这可能需要他们具备 一种新型的数据读写能力,掌握数据分析知识,以支持基于证据的决策。这些数据也可以呈现给学生,有助于他们进行迭代反馈、形成性评价和进展概述,学生将成 为掌控自己学习进程的研究者。此外,专业研究者也可以使用同批数据。大数据时代,传统的研究者与实践者、观察者与被观察者之间的区别逐渐模糊。这种特性彰 显的是大数据的可访问维度,在某种程度上也决定了数据的外观、形式与目的。
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
在 “神经网络与卡尔曼滤波融合” 的理论基础上,Python 凭借其丰富的科学计算库(NumPy、FilterPy)、深度学习框架(PyTorch、T ...
2025-10-23在工业控制、自动驾驶、机器人导航、气象预测等领域,“状态估计” 是核心任务 —— 即从含噪声的观测数据中,精准推断系统的真 ...
2025-10-23在数据分析全流程中,“数据清洗” 恰似烹饪前的食材处理:若食材(数据)腐烂变质、混杂异物(脏数据),即便拥有精湛的烹饪技 ...
2025-10-23在人工智能领域,“大模型” 已成为近年来的热点标签:从参数超 1750 亿的 GPT-3,到万亿级参数的 PaLM,再到多模态大模型 GPT-4 ...
2025-10-22在 MySQL 数据库的日常运维与开发中,“更新数据是否会影响读数据” 是一个高频疑问。这个问题的答案并非简单的 “是” 或 “否 ...
2025-10-22在企业数据分析中,“数据孤岛” 是制约分析深度的核心瓶颈 —— 用户数据散落在注册系统、APP 日志、客服记录中,订单数据分散 ...
2025-10-22在神经网络设计中,“隐藏层个数” 是决定模型能力的关键参数 —— 太少会导致 “欠拟合”(模型无法捕捉复杂数据规律,如用单隐 ...
2025-10-21在特征工程流程中,“单变量筛选” 是承上启下的关键步骤 —— 它通过分析单个特征与目标变量的关联强度,剔除无意义、冗余的特 ...
2025-10-21在数据分析全流程中,“数据读取” 常被误解为 “简单的文件打开”—— 双击 Excel、执行基础 SQL 查询即可完成。但对 CDA(Cert ...
2025-10-21在实际业务数据分析中,我们遇到的大多数数据并非理想的正态分布 —— 电商平台的用户消费金额(少数用户单次消费上万元,多数集 ...
2025-10-20在数字化交互中,用户的每一次操作 —— 从电商平台的 “浏览商品→加入购物车→查看评价→放弃下单”,到内容 APP 的 “点击短 ...
2025-10-20在数据分析的全流程中,“数据采集” 是最基础也最关键的环节 —— 如同烹饪前需备好新鲜食材,若采集的数据不完整、不准确或不 ...
2025-10-20在数据成为新时代“石油”的今天,几乎每个职场人都在焦虑: “为什么别人能用数据驱动决策、升职加薪,而我面对Excel表格却无从 ...
2025-10-18数据清洗是 “数据价值挖掘的前置关卡”—— 其核心目标是 “去除噪声、修正错误、规范格式”,但前提是不破坏数据的真实业务含 ...
2025-10-17在数据汇总分析中,透视表凭借灵活的字段重组能力成为核心工具,但原始透视表仅能呈现数值结果,缺乏对数据背景、异常原因或业务 ...
2025-10-17在企业管理中,“凭经验定策略” 的传统模式正逐渐失效 —— 金融机构靠 “研究员主观判断” 选股可能错失收益,电商靠 “运营拍 ...
2025-10-17在数据库日常操作中,INSERT INTO SELECT是实现 “批量数据迁移” 的核心 SQL 语句 —— 它能直接将一个表(或查询结果集)的数 ...
2025-10-16在机器学习建模中,“参数” 是决定模型效果的关键变量 —— 无论是线性回归的系数、随机森林的树深度,还是神经网络的权重,这 ...
2025-10-16在数字化浪潮中,“数据” 已从 “辅助决策的工具” 升级为 “驱动业务的核心资产”—— 电商平台靠用户行为数据优化推荐算法, ...
2025-10-16在大模型从实验室走向生产环境的过程中,“稳定性” 是决定其能否实用的关键 —— 一个在单轮测试中表现优异的模型,若在高并发 ...
2025-10-15