京公网安备 11010802034615号
经营许可证编号:京B2-20210330
校园大数据告诉你!学霸是如何炼成的
近日,国内大数据领域领军专家、电子科技大学周涛教授与有着近十年学工部长教育经验的吕红胤研究员,花费了近大半年的时间,联合研发出一套“大数据”系统——“学生画像”。
该系统利用校园一卡通追踪学生行为轨迹,通过对学生吃饭、打水、出行、消费行为记录,“算”出每名学生的学习、生活状态。更厉害的是,通过对学生日常学习状态的追踪,该系统还会对学生的期末成绩乃至大学四年后的就业情况作出预警~
注:系统用排名均值来计量学生成绩的优异。排名均值=学生在所在专业的年级排名/本专业的总人数,排名均值越接近0,代表该学生的成绩越好。
学霸是如何炼成的?
学霸出门时间通常比较固定
研究人员分析了近半年的宿舍门禁、吃饭、进出图书馆等刷卡记录,发现成绩较好的学生作息时间比成绩差的更规律。
例如,某专业排名第3的小雪,几乎每天固定在8点、12点、14点三个时间点出门,留在宿舍的总时长低于专业平均水平。而该专业成绩排名第61的小石每天进出宿舍的时间很随机,而且通常每次外出的时长不超过2小时,“宅指数”明显高于专业平均水平。
此外,研究人员还发现,9点前出现在食堂吃早餐的同学,成绩也相对更好。
学霸最爱在晚上10-11点洗澡
上图中,横轴代表了时间点,竖轴则代表了在当前的时间点下,学生的洗澡概率。电子科大的澡堂是全天开放的,但研究团队发现,晚上10——11点,学习好的学生与学习差的学生洗澡概率出现了较大的差异。简言之,集中在晚上10到11点之间洗澡的学生成绩更优异。
不管是出门时间还是洗澡时间,抑或是相对固定的早餐时间,都是学生作息规律的具体体现。研究人员发现,较有规律的学生群体,除了成绩上的优势外,考研成功率以及出国留学获得奖学金的概率均高于一般学生。这也从侧面印证了生活的规律性对于成绩有正面影响的结论。
学霸爱泡图书馆和自习室
在样本量足够庞大的情况下,学生在一定时期内的行为追踪确实可以反映他的学习和生活状态。比如,如果一个学生的打卡记录显示,他长期在教学楼的饮水机上打水,那一定程度上就说明了,教学楼是他的长期活动地点。
“学生画像”的研究团队,通过大数据分析,发现了出入图书馆次数多少与学习成绩的好坏存在着一定的相关性,即:出入图书馆次数比较多的学生,成绩要优于出入图书馆次数比较少的学生。同一个学生,随着他出入图书馆次数的增多或减少,他的成绩排名在上下浮动。如图↓↓
这样的相关性,同样适用于学校的教学楼↓↓(注:在教室打水代表该学生出现在了教学楼~)
现实中,每个人都会受到种种环境的影响。无疑,处于校园之中,身边人的学习状态,自然也会影响到学生自身的成绩好坏。
研究团队发现,如果一个大学生,他身边的朋友成绩比较好,那他自身的成绩也相对较好!
想要成为一枚学霸?先找个学霸好友吧~
期末会不会挂科?算一下吧
在这项研究中,研究团队专门设计出了一系列辅助学生更好完成大学学业的功能模块——“挂科预警”。
想知道你学期末会不会挂科?那就算一算喽!
挂科率=努力程度 + 学习基础;
努力程度依据:教学楼打水频率+进出图书馆的时间与次数;
学习基础:用已考科目成绩、已考与将考科目之间的关联性算出;
一旦你的挂科率触碰到了预警红线,那系统便会自动为负责你学习的辅导员推送预警信息!
“前方高能预警,您的挂科率有偏高趋势,请好好学习~”自从有了“挂科预警”系统,妈妈再也不用担心我挂科了~
四年后,你会成为失业大军中的一员吗?
如今,就业形势一年比一年紧张。作为学生,你在担心毕业即失业?作为高校的管理者,你会困惑于如何帮助学生突破重围吗?嗯,好消息来了!
“学生画像”研究团队通过大量的数据分析,研究得出了一个学生的毕业去向与他在校期间的生活规律有着一定的关联性。
电子科技大学教育大数据研究所副所长、原微软亚洲研究院的连德富教授在接受中国青年报(ID:zqbcyol)采访时表示,通过对比往届毕业生的毕业去向,他们发现,就业困难学生群体身上确实存在某些相似的行为特征。比如,与其他同学相比,就业困难学生在校期间的生活普遍不太规律。此外,就业困难学生在图书馆的借阅书目也更偏向于悬疑科幻小说以及与游戏相关的书籍。
近年来,越来越多的大学生毕业后选择创业。麦可思研究院研究发现,包括本科毕业生和高职专院校毕业生在内的中国大学生毕业后选择自主创业的比例基本呈逐年上升的趋势:2007年1.2%,2008年1%,2009年1.2%,2010年1.5%,2011年1.6%,2012年2%,2013年2.3%,2014年2.9%。
在连德富教授看来,大学里的创业一族也有“大数据”特点。偏好创业的学生跑市区的频率要高于普通学生。
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
在分类变量关联分析中(如 “吸烟与肺癌的关系”“性别与疾病发病率的关联”),卡方检验 P 值与 OR 值(比值比,Odds Ratio)是 ...
2025-11-05CDA 数据分析师的核心价值,不在于复杂的模型公式,而在于将数据转化为可落地的商业行动。脱离业务场景的分析只是 “纸上谈兵” ...
2025-11-05教材入口:https://edu.cda.cn/goods/show/3151 “纲举目张,执本末从。” 若想在数据分析领域有所收获,一套合适的学习教材至 ...
2025-11-05教材入口:https://edu.cda.cn/goods/show/3151 “纲举目张,执本末从。” 若想在数据分析领域有所收获,一套合适的学习教材至 ...
2025-11-04【2025最新版】CDA考试教材:CDA教材一级:商业数据分析(2025)__商业数据分析_cda教材_考试教材 (cdaglobal.com) ...
2025-11-04在数字化时代,数据挖掘不再是实验室里的技术探索,而是驱动商业决策的核心能力 —— 它能从海量数据中挖掘出 “降低成本、提升 ...
2025-11-04在 DDPM(Denoising Diffusion Probabilistic Models)训练过程中,开发者最常困惑的问题莫过于:“我的模型 loss 降到多少才算 ...
2025-11-04在 CDA(Certified Data Analyst)数据分析师的工作中,“无监督样本分组” 是高频需求 —— 例如 “将用户按行为特征分为高价值 ...
2025-11-04当沃尔玛数据分析师首次发现 “啤酒与尿布” 的高频共现规律时,他们揭开了数据挖掘最迷人的面纱 —— 那些隐藏在消费行为背后 ...
2025-11-03这个问题精准切中了配对样本统计检验的核心差异点,理解二者区别是避免统计方法误用的关键。核心结论是:stats.ttest_rel(配对 ...
2025-11-03在 CDA(Certified Data Analyst)数据分析师的工作中,“高维数据的潜在规律挖掘” 是进阶需求 —— 例如用户行为包含 “浏览次 ...
2025-11-03在 MySQL 数据查询中,“按顺序计数” 是高频需求 —— 例如 “统计近 7 天每日订单量”“按用户 ID 顺序展示消费记录”“按产品 ...
2025-10-31在数据分析中,“累计百分比” 是衡量 “部分与整体关系” 的核心指标 —— 它通过 “逐步累加的占比”,直观呈现数据的分布特征 ...
2025-10-31在 CDA(Certified Data Analyst)数据分析师的工作中,“二分类预测” 是高频需求 —— 例如 “预测用户是否会流失”“判断客户 ...
2025-10-31在 MySQL 实际应用中,“频繁写入同一表” 是常见场景 —— 如实时日志存储(用户操作日志、系统运行日志)、高频交易记录(支付 ...
2025-10-30为帮助教育工作者、研究者科学分析 “班级规模” 与 “平均成绩” 的关联关系,我将从相关系数的核心定义与类型切入,详解 “数 ...
2025-10-30对 CDA(Certified Data Analyst)数据分析师而言,“相关系数” 不是简单的数字计算,而是 “从业务问题出发,量化变量间关联强 ...
2025-10-30在构建前向神经网络(Feedforward Neural Network,简称 FNN)时,“隐藏层数目设多少?每个隐藏层该放多少个神经元?” 是每个 ...
2025-10-29这个问题切中了 Excel 用户的常见困惑 —— 将 “数据可视化工具” 与 “数据挖掘算法” 的功能边界混淆。核心结论是:Excel 透 ...
2025-10-29在 CDA(Certified Data Analyst)数据分析师的工作中,“多组数据差异验证” 是高频需求 —— 例如 “3 家门店的销售额是否有显 ...
2025-10-29