京公网安备 11010802034615号
经营许可证编号:京B2-20210330
南大大数据算法 “算出”室友
校方称近八成新生填写了调查问卷 以习惯爱好匹配室友是为了降低产生矛盾的概率
近日,南京大学采用大数据算法,为今年入学的新生匹配室友的消息引发关注。日前,北京青年报记者从该校学生工作处获悉,约3300名新生中,近八成学生填写了问卷。根据问卷中涉及到的生活习惯、个人卫生情况、个性化选择及个人兴趣爱好等选项,学校用大数据算法分析学生的相似程度,以此划分寝室、匹配室友。学生工作处负责人解释,这样做,一方面是为了帮助新生更好地适应集体生活,另一方面降低室友之间产生矛盾的概率。
开学在即,如何尽快适应大学校园生活,在集体生活中与室友和谐相处,是每个新生面临的第一道“门槛”。按照惯例,不少学校在为学生分配宿舍时,会考量新生的生源地、年龄,或是自由匹配产生室友。但近日,南京大学采用大数据算法,考量学生的生活习惯和兴趣爱好,并以此匹配室友的方式,为新生提供了一种新的可能。
对此,大多数网友认为学校的做法是人性化的,可以接触到趣味相投的人,也可以避免一些不必要的矛盾。但也有网友担心:匹配时会不会把一些生活习惯不好的学生聚集到了一起,产生负面影响。还有学生认为,集体生活应该和性格不同的人相处,以提前适应未来的社会生活。
|
|
南大2018级人文科学实验班的学生刘韵(化名)告诉北青报记者,此前,学校新生手册里专门提到会对住宿问题进行问卷调查。“学长学姐和迎新公号也提醒新生这件事。填写的时候,觉得问题都挺实际的,而且每个同学有3次填写更改的机会。”刘韵说,南大分宿舍的方式也引来不少高中同学的羡慕,“他们分宿舍都是按照学号或者姓氏来的,很少按照兴趣爱好分。”刘韵说,自己喜欢打篮球、看综艺,之前特别担心遇到乱拿东西、不讲卫生的室友,填完问卷“心里踏实多了”,他希望能遇到性格开朗的学霸型室友。
北青报记者了解到,这项活动经南大校方牵头,具体操作由该校学生工作处负责。学生工作处郭亚敏老师介绍,去年学校通过网络问卷调查,给新生按照生活习惯分宿舍,效果显著。在此基础上,学校经过一年多的调研,在老生间征集方案,产生了今年的优化升级版本,新添加了如“是否愿意为室友拿快递”、“听歌声音大不大”、“空调喜欢开多少度”这类细节问题。
对话
校方:让学生更好地适应集体生活
谈及大数据分配宿舍室友一事,郭亚敏老师在接受北青报记者采访时说“这样的方式不是拍脑袋想出来的”,而是有一定依据。至于网友的担心,郭老师解释,匹配时会冲淡单一方面的考量,不是要将习惯和爱好完全一致的学生分在一起,而是将差异特别大的学生区分开。
问卷新增“兴趣爱好”的选项
北青报:新生什么时候报到,寝室已经分好了吗?
郭亚敏:8月25日、26日报到,马上就来了。新生大概有3300人左右,八成学生是按照大数据算法给他们分配的宿舍和室友,因为他们在新生网上提前填写了问卷调查。余下的学生采取了随机分配的方式。不过,要等他们入学以后,才能进一步反馈对宿舍和室友是否满意。
北青报:大数据算法匹配室友,具体怎么操作?
郭亚敏:学生先填写问卷,收集到问卷选项的信息后,学校使用大数据推荐算法,通过系统对信息进行量化处理,然后给学生分配室友。
北青报:问卷具体包含哪几个方面的内容?
郭亚敏:第一是生活习惯。包括你的作息时间,冬天夏天使用空调的习惯,是希望热一点还是冷一点。第二是卫生习惯。比如:什么时候整理内务、清理桌椅、打扫垃圾、什么时候洗澡。第三是个性化的问题。比如,是否吸烟,愿不愿意帮室友拿快递、外卖,电费是均摊还是轮流支付,你的肥皂、洗衣粉别人拿来用你有没有意见。第四是个人爱好。(我们)希望宿舍里学生之间有共同话题。比如说一个学生喜欢看电影另一个喜欢听音乐,他们两个能不能放一起,有多大概率可以放一起,这个是要算的。
降低学生入校后产生矛盾的概率
北青报:问卷选项的设置和这种匹配室友的方式,有什么依据吗?
郭亚敏:2017年新生入学时,学校就给部分新生用大数据算法匹配了室友,但参与的新生只有3成左右,规模没有今年这么大。那么这个效果到底怎么样?从后来的跟踪反馈的结果来看,用大数据匹配宿舍的学生,整体满意度比随机分配的学生,高出10个百分点。
因为效果不错,加上学生们最清楚宿舍生活中哪些因素容易造成矛盾,之后我们对16、17级的所有学生做了调研,丰富了问卷。比如,补充了包括听歌声音大小,愿不愿意帮室友拿快递,自习的时间,空调温度高低的细节,都是学生自己总结的,相对来说更真实可信。
北青报:为新生匹配室友的初衷是什么?
郭亚敏:因为今年的00后新生占大多数,基本上都是独生子女,从小到大没有什么集体生活的经验,这样做是让学生更好地适应学校的集体生活。从学校管理上来说,也是为了降低学生入校后产生矛盾的概率。他们要在这里待4年,宿舍矛盾对孩子的负面影响是很大的,学生宿舍存在的隐患、矛盾,也远远大于我们掌握的情况。近些年也有不少室友间互相报复的极端案例。我们希望通过前瞻性的措施,从管理上缓解矛盾,尽量消除发生极端事件的可能性。
希望将差异巨大的学生分开
北青报:大数据匹配室友的消息,也在网上引发一些争议。
郭亚敏:是的,我们也了解到网上有两种不同声音:大多数人会觉得好,认为是人性化操作。同样也有反对的声音,觉得我们剥夺了孩子多样化、差异化交友的权利。甚至有人说,如果一个宿舍的人都晚睡、都抽烟,放在一起是不是合适。
这一点需要解释一下。我们问卷的问题设置得很细,选项也不是简单的“是”和“否”,有“喜欢”、“不喜欢”、“没什么了解”、“没接触过”这些。进一步说,最终要分配时,考察两个人是不是很接近不是从单一的维度去考虑的。不会说两个孩子都写了“我晚睡”,就把他们放一起,还有很多其他因素的考量。而且四类问题的衡量权重是相当的,不会刻意突出哪一方面。因为现在引发矛盾的因素很多元化,你不帮我拿快递都有可能引发矛盾。
北青报:预期的效果是什么样的?
郭亚敏:从最终的效果来看,是要在保证宿舍里的孩子有一定差异性的同时,把两个差异性特别大的人分开,因为差异过大容易产生和激化矛盾。
CDA学员免费下载查看报告全文:2026全球数智化人才指数报告【CDA数据科学研究院】.pdf
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
箱线图(Box Plot)作为一种经典的数据可视化工具,广泛应用于统计学、数据分析、科研实证等领域,核心价值在于直观呈现数据的集 ...
2026-04-27实证分析是社会科学、自然科学、经济管理等领域开展研究的核心范式,其核心逻辑是通过对多维度数据的收集、分析与解读,揭示变量 ...
2026-04-27 很多数据分析师精通Excel函数和数据透视表,但当被问到“数据从哪里来”“表和视图有什么区别”“数据库管理系统和SQL是什么 ...
2026-04-27在大数据技术飞速迭代、数字营销竞争日趋激烈的今天,“精准触达、高效转化、成本可控”已成为企业营销的核心诉求。传统广告投放 ...
2026-04-24在游戏行业竞争白热化的当下,用户流失已成为制约游戏生命周期、影响营收增长的核心痛点。据行业报告显示,2024年移动游戏平均次 ...
2026-04-24 很多业务负责人开会常说“我们要数据驱动”,最后却变成“看哪张报表数据多就用哪个”,往往因为缺乏一套结构性的方法去搭建 ...
2026-04-24在Power BI数据可视化分析中,切片器是连接用户与数据的核心交互工具,其核心价值在于帮助使用者快速筛选目标数据、聚焦分析重点 ...
2026-04-23以数为据,以析促优——数据分析结果指导临床技术改进的实践路径 临床技术是医疗服务的核心载体,其水平直接决定患者诊疗效果、 ...
2026-04-23很多数据分析师每天盯着GMV、DAU、转化率,但当被问到“哪些指标是所有企业都需要的”“哪些指标是因行业而异的”“北极星指标和 ...
2026-04-23近日,由 CDA 数据科学研究院重磅发布的《2026 全球数智化人才指数报告》,被中国教育科学研究院官方账号正式收录, ...
2026-04-22在数字化时代,客户每一次点击、浏览、下单、咨询等行为,都在传递其潜在需求与决策倾向——这些按时间顺序串联的行为轨迹,构成 ...
2026-04-22数据是数据分析、建模与业务决策的核心基石,而“数据清洗”作为数据预处理的核心环节,是打通数据从“原始杂乱”到“干净可用” ...
2026-04-22 很多数据分析师每天盯着GMV、转化率、DAU等数字看,但当被问到“什么是指标”“指标和维度有什么区别”“如何搭建一套完整的 ...
2026-04-22在数据分析与业务决策中,数据并非静止不变的数值,而是始终处于动态波动之中——股市收盘价的每日涨跌、企业月度销售额的起伏、 ...
2026-04-21在数据分析领域,当研究涉及多个自变量与多个因变量之间的复杂关联时,多变量一般线性分析(Multivariate General Linear Analys ...
2026-04-21很多数据分析师精通描述性统计,能熟练计算均值、中位数、标准差,但当被问到“用500个样本如何推断10万用户的真实满意度”“这 ...
2026-04-21在数据处理与分析的全流程中,日期数据是贯穿业务场景的核心维度之一——无论是业务报表统计、用户行为追踪,还是风控规则落地、 ...
2026-04-20在机器学习建模全流程中,特征工程是连接原始数据与模型效果的关键环节,而特征重要性分析则是特征工程的“灵魂”——它不仅能帮 ...
2026-04-20很多数据分析师沉迷于复杂的机器学习算法,却忽略了数据分析最基础也最核心的能力——描述性统计。事实上,80%的商业分析问题, ...
2026-04-20在数字化时代,数据已成为企业决策的核心驱动力,数据分析与数据挖掘作为解锁数据价值的关键手段,广泛应用于互联网、金融、医疗 ...
2026-04-17