京公网安备 11010802034615号
经营许可证编号:京B2-20210330
南大大数据算法 “算出”室友
校方称近八成新生填写了调查问卷 以习惯爱好匹配室友是为了降低产生矛盾的概率
近日,南京大学采用大数据算法,为今年入学的新生匹配室友的消息引发关注。日前,北京青年报记者从该校学生工作处获悉,约3300名新生中,近八成学生填写了问卷。根据问卷中涉及到的生活习惯、个人卫生情况、个性化选择及个人兴趣爱好等选项,学校用大数据算法分析学生的相似程度,以此划分寝室、匹配室友。学生工作处负责人解释,这样做,一方面是为了帮助新生更好地适应集体生活,另一方面降低室友之间产生矛盾的概率。
开学在即,如何尽快适应大学校园生活,在集体生活中与室友和谐相处,是每个新生面临的第一道“门槛”。按照惯例,不少学校在为学生分配宿舍时,会考量新生的生源地、年龄,或是自由匹配产生室友。但近日,南京大学采用大数据算法,考量学生的生活习惯和兴趣爱好,并以此匹配室友的方式,为新生提供了一种新的可能。
对此,大多数网友认为学校的做法是人性化的,可以接触到趣味相投的人,也可以避免一些不必要的矛盾。但也有网友担心:匹配时会不会把一些生活习惯不好的学生聚集到了一起,产生负面影响。还有学生认为,集体生活应该和性格不同的人相处,以提前适应未来的社会生活。
|
|
南大2018级人文科学实验班的学生刘韵(化名)告诉北青报记者,此前,学校新生手册里专门提到会对住宿问题进行问卷调查。“学长学姐和迎新公号也提醒新生这件事。填写的时候,觉得问题都挺实际的,而且每个同学有3次填写更改的机会。”刘韵说,南大分宿舍的方式也引来不少高中同学的羡慕,“他们分宿舍都是按照学号或者姓氏来的,很少按照兴趣爱好分。”刘韵说,自己喜欢打篮球、看综艺,之前特别担心遇到乱拿东西、不讲卫生的室友,填完问卷“心里踏实多了”,他希望能遇到性格开朗的学霸型室友。
北青报记者了解到,这项活动经南大校方牵头,具体操作由该校学生工作处负责。学生工作处郭亚敏老师介绍,去年学校通过网络问卷调查,给新生按照生活习惯分宿舍,效果显著。在此基础上,学校经过一年多的调研,在老生间征集方案,产生了今年的优化升级版本,新添加了如“是否愿意为室友拿快递”、“听歌声音大不大”、“空调喜欢开多少度”这类细节问题。
对话
校方:让学生更好地适应集体生活
谈及大数据分配宿舍室友一事,郭亚敏老师在接受北青报记者采访时说“这样的方式不是拍脑袋想出来的”,而是有一定依据。至于网友的担心,郭老师解释,匹配时会冲淡单一方面的考量,不是要将习惯和爱好完全一致的学生分在一起,而是将差异特别大的学生区分开。
问卷新增“兴趣爱好”的选项
北青报:新生什么时候报到,寝室已经分好了吗?
郭亚敏:8月25日、26日报到,马上就来了。新生大概有3300人左右,八成学生是按照大数据算法给他们分配的宿舍和室友,因为他们在新生网上提前填写了问卷调查。余下的学生采取了随机分配的方式。不过,要等他们入学以后,才能进一步反馈对宿舍和室友是否满意。
北青报:大数据算法匹配室友,具体怎么操作?
郭亚敏:学生先填写问卷,收集到问卷选项的信息后,学校使用大数据推荐算法,通过系统对信息进行量化处理,然后给学生分配室友。
北青报:问卷具体包含哪几个方面的内容?
郭亚敏:第一是生活习惯。包括你的作息时间,冬天夏天使用空调的习惯,是希望热一点还是冷一点。第二是卫生习惯。比如:什么时候整理内务、清理桌椅、打扫垃圾、什么时候洗澡。第三是个性化的问题。比如,是否吸烟,愿不愿意帮室友拿快递、外卖,电费是均摊还是轮流支付,你的肥皂、洗衣粉别人拿来用你有没有意见。第四是个人爱好。(我们)希望宿舍里学生之间有共同话题。比如说一个学生喜欢看电影另一个喜欢听音乐,他们两个能不能放一起,有多大概率可以放一起,这个是要算的。
降低学生入校后产生矛盾的概率
北青报:问卷选项的设置和这种匹配室友的方式,有什么依据吗?
郭亚敏:2017年新生入学时,学校就给部分新生用大数据算法匹配了室友,但参与的新生只有3成左右,规模没有今年这么大。那么这个效果到底怎么样?从后来的跟踪反馈的结果来看,用大数据匹配宿舍的学生,整体满意度比随机分配的学生,高出10个百分点。
因为效果不错,加上学生们最清楚宿舍生活中哪些因素容易造成矛盾,之后我们对16、17级的所有学生做了调研,丰富了问卷。比如,补充了包括听歌声音大小,愿不愿意帮室友拿快递,自习的时间,空调温度高低的细节,都是学生自己总结的,相对来说更真实可信。
北青报:为新生匹配室友的初衷是什么?
郭亚敏:因为今年的00后新生占大多数,基本上都是独生子女,从小到大没有什么集体生活的经验,这样做是让学生更好地适应学校的集体生活。从学校管理上来说,也是为了降低学生入校后产生矛盾的概率。他们要在这里待4年,宿舍矛盾对孩子的负面影响是很大的,学生宿舍存在的隐患、矛盾,也远远大于我们掌握的情况。近些年也有不少室友间互相报复的极端案例。我们希望通过前瞻性的措施,从管理上缓解矛盾,尽量消除发生极端事件的可能性。
希望将差异巨大的学生分开
北青报:大数据匹配室友的消息,也在网上引发一些争议。
郭亚敏:是的,我们也了解到网上有两种不同声音:大多数人会觉得好,认为是人性化操作。同样也有反对的声音,觉得我们剥夺了孩子多样化、差异化交友的权利。甚至有人说,如果一个宿舍的人都晚睡、都抽烟,放在一起是不是合适。
这一点需要解释一下。我们问卷的问题设置得很细,选项也不是简单的“是”和“否”,有“喜欢”、“不喜欢”、“没什么了解”、“没接触过”这些。进一步说,最终要分配时,考察两个人是不是很接近不是从单一的维度去考虑的。不会说两个孩子都写了“我晚睡”,就把他们放一起,还有很多其他因素的考量。而且四类问题的衡量权重是相当的,不会刻意突出哪一方面。因为现在引发矛盾的因素很多元化,你不帮我拿快递都有可能引发矛盾。
北青报:预期的效果是什么样的?
郭亚敏:从最终的效果来看,是要在保证宿舍里的孩子有一定差异性的同时,把两个差异性特别大的人分开,因为差异过大容易产生和激化矛盾。
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
很多小伙伴都在问CDA考试的问题,以下是结合 2025 年最新政策与行业动态更新的 CDA 数据分析师认证考试 Q&A,覆盖考试内容、报考 ...
2025-12-11在Excel数据可视化中,柱形图因直观展示数据差异的优势被广泛使用,而背景色设置绝非简单的“换颜色”——合理的背景色能突出核 ...
2025-12-11在科研实验、商业分析或医学研究中,我们常需要判断“两组数据的差异是真实存在,还是偶然波动”——比如“新降压药的效果是否优 ...
2025-12-11在CDA(Certified Data Analyst)数据分析师的工作体系中,数据库就像“数据仓库的核心骨架”——所有业务数据的存储、组织与提 ...
2025-12-11在神经网络模型搭建中,“最后一层是否添加激活函数”是新手常困惑的关键问题——有人照搬中间层的ReLU激活,导致回归任务输出异 ...
2025-12-05在机器学习落地过程中,“模型准确率高但不可解释”“面对数据噪声就失效”是两大核心痛点——金融风控模型若无法解释决策依据, ...
2025-12-05在CDA(Certified Data Analyst)数据分析师的能力模型中,“指标计算”是基础技能,而“指标体系搭建”则是区分新手与资深分析 ...
2025-12-05在回归分析的结果解读中,R方(决定系数)是衡量模型拟合效果的核心指标——它代表因变量的变异中能被自变量解释的比例,取值通 ...
2025-12-04在城市规划、物流配送、文旅分析等场景中,经纬度热力图是解读空间数据的核心工具——它能将零散的GPS坐标(如外卖订单地址、景 ...
2025-12-04在CDA(Certified Data Analyst)数据分析师的指标体系中,“通用指标”与“场景指标”并非相互割裂的两个部分,而是支撑业务分 ...
2025-12-04每到“双十一”,电商平台的销售额会迎来爆发式增长;每逢冬季,北方的天然气消耗量会显著上升;每月的10号左右,工资发放会带动 ...
2025-12-03随着数字化转型的深入,企业面临的数据量呈指数级增长——电商的用户行为日志、物联网的传感器数据、社交平台的图文视频等,这些 ...
2025-12-03在CDA(Certified Data Analyst)数据分析师的工作体系中,“指标”是贯穿始终的核心载体——从“销售额环比增长15%”的业务结论 ...
2025-12-03在神经网络训练中,损失函数的数值变化常被视为模型训练效果的“核心仪表盘”——初学者盯着屏幕上不断下降的损失值满心欢喜,却 ...
2025-12-02在CDA(Certified Data Analyst)数据分析师的日常工作中,“用部分数据推断整体情况”是高频需求——从10万条订单样本中判断全 ...
2025-12-02在数据预处理的纲量统一环节,标准化是消除量纲影响的核心手段——它将不同量级的特征(如“用户年龄”“消费金额”)转化为同一 ...
2025-12-02在数据驱动决策成为企业核心竞争力的今天,A/B测试已从“可选优化工具”升级为“必选验证体系”。它通过控制变量法构建“平行实 ...
2025-12-01在时间序列预测任务中,LSTM(长短期记忆网络)凭借对时序依赖关系的捕捉能力成为主流模型。但很多开发者在实操中会遇到困惑:用 ...
2025-12-01引言:数据时代的“透视镜”与“掘金者” 在数字经济浪潮下,数据已成为企业决策的核心资产,而CDA数据分析师正是挖掘数据价值的 ...
2025-12-01数据分析师的日常,常始于一堆“毫无章法”的数据点:电商后台导出的零散订单记录、APP埋点收集的无序用户行为日志、传感器实时 ...
2025-11-28