京公网安备 11010802034615号
经营许可证编号:京B2-20210330
南大大数据算法 “算出”室友
校方称近八成新生填写了调查问卷 以习惯爱好匹配室友是为了降低产生矛盾的概率
近日,南京大学采用大数据算法,为今年入学的新生匹配室友的消息引发关注。日前,北京青年报记者从该校学生工作处获悉,约3300名新生中,近八成学生填写了问卷。根据问卷中涉及到的生活习惯、个人卫生情况、个性化选择及个人兴趣爱好等选项,学校用大数据算法分析学生的相似程度,以此划分寝室、匹配室友。学生工作处负责人解释,这样做,一方面是为了帮助新生更好地适应集体生活,另一方面降低室友之间产生矛盾的概率。
开学在即,如何尽快适应大学校园生活,在集体生活中与室友和谐相处,是每个新生面临的第一道“门槛”。按照惯例,不少学校在为学生分配宿舍时,会考量新生的生源地、年龄,或是自由匹配产生室友。但近日,南京大学采用大数据算法,考量学生的生活习惯和兴趣爱好,并以此匹配室友的方式,为新生提供了一种新的可能。
对此,大多数网友认为学校的做法是人性化的,可以接触到趣味相投的人,也可以避免一些不必要的矛盾。但也有网友担心:匹配时会不会把一些生活习惯不好的学生聚集到了一起,产生负面影响。还有学生认为,集体生活应该和性格不同的人相处,以提前适应未来的社会生活。
|
|
南大2018级人文科学实验班的学生刘韵(化名)告诉北青报记者,此前,学校新生手册里专门提到会对住宿问题进行问卷调查。“学长学姐和迎新公号也提醒新生这件事。填写的时候,觉得问题都挺实际的,而且每个同学有3次填写更改的机会。”刘韵说,南大分宿舍的方式也引来不少高中同学的羡慕,“他们分宿舍都是按照学号或者姓氏来的,很少按照兴趣爱好分。”刘韵说,自己喜欢打篮球、看综艺,之前特别担心遇到乱拿东西、不讲卫生的室友,填完问卷“心里踏实多了”,他希望能遇到性格开朗的学霸型室友。
北青报记者了解到,这项活动经南大校方牵头,具体操作由该校学生工作处负责。学生工作处郭亚敏老师介绍,去年学校通过网络问卷调查,给新生按照生活习惯分宿舍,效果显著。在此基础上,学校经过一年多的调研,在老生间征集方案,产生了今年的优化升级版本,新添加了如“是否愿意为室友拿快递”、“听歌声音大不大”、“空调喜欢开多少度”这类细节问题。
对话
校方:让学生更好地适应集体生活
谈及大数据分配宿舍室友一事,郭亚敏老师在接受北青报记者采访时说“这样的方式不是拍脑袋想出来的”,而是有一定依据。至于网友的担心,郭老师解释,匹配时会冲淡单一方面的考量,不是要将习惯和爱好完全一致的学生分在一起,而是将差异特别大的学生区分开。
问卷新增“兴趣爱好”的选项
北青报:新生什么时候报到,寝室已经分好了吗?
郭亚敏:8月25日、26日报到,马上就来了。新生大概有3300人左右,八成学生是按照大数据算法给他们分配的宿舍和室友,因为他们在新生网上提前填写了问卷调查。余下的学生采取了随机分配的方式。不过,要等他们入学以后,才能进一步反馈对宿舍和室友是否满意。
北青报:大数据算法匹配室友,具体怎么操作?
郭亚敏:学生先填写问卷,收集到问卷选项的信息后,学校使用大数据推荐算法,通过系统对信息进行量化处理,然后给学生分配室友。
北青报:问卷具体包含哪几个方面的内容?
郭亚敏:第一是生活习惯。包括你的作息时间,冬天夏天使用空调的习惯,是希望热一点还是冷一点。第二是卫生习惯。比如:什么时候整理内务、清理桌椅、打扫垃圾、什么时候洗澡。第三是个性化的问题。比如,是否吸烟,愿不愿意帮室友拿快递、外卖,电费是均摊还是轮流支付,你的肥皂、洗衣粉别人拿来用你有没有意见。第四是个人爱好。(我们)希望宿舍里学生之间有共同话题。比如说一个学生喜欢看电影另一个喜欢听音乐,他们两个能不能放一起,有多大概率可以放一起,这个是要算的。
降低学生入校后产生矛盾的概率
北青报:问卷选项的设置和这种匹配室友的方式,有什么依据吗?
郭亚敏:2017年新生入学时,学校就给部分新生用大数据算法匹配了室友,但参与的新生只有3成左右,规模没有今年这么大。那么这个效果到底怎么样?从后来的跟踪反馈的结果来看,用大数据匹配宿舍的学生,整体满意度比随机分配的学生,高出10个百分点。
因为效果不错,加上学生们最清楚宿舍生活中哪些因素容易造成矛盾,之后我们对16、17级的所有学生做了调研,丰富了问卷。比如,补充了包括听歌声音大小,愿不愿意帮室友拿快递,自习的时间,空调温度高低的细节,都是学生自己总结的,相对来说更真实可信。
北青报:为新生匹配室友的初衷是什么?
郭亚敏:因为今年的00后新生占大多数,基本上都是独生子女,从小到大没有什么集体生活的经验,这样做是让学生更好地适应学校的集体生活。从学校管理上来说,也是为了降低学生入校后产生矛盾的概率。他们要在这里待4年,宿舍矛盾对孩子的负面影响是很大的,学生宿舍存在的隐患、矛盾,也远远大于我们掌握的情况。近些年也有不少室友间互相报复的极端案例。我们希望通过前瞻性的措施,从管理上缓解矛盾,尽量消除发生极端事件的可能性。
希望将差异巨大的学生分开
北青报:大数据匹配室友的消息,也在网上引发一些争议。
郭亚敏:是的,我们也了解到网上有两种不同声音:大多数人会觉得好,认为是人性化操作。同样也有反对的声音,觉得我们剥夺了孩子多样化、差异化交友的权利。甚至有人说,如果一个宿舍的人都晚睡、都抽烟,放在一起是不是合适。
这一点需要解释一下。我们问卷的问题设置得很细,选项也不是简单的“是”和“否”,有“喜欢”、“不喜欢”、“没什么了解”、“没接触过”这些。进一步说,最终要分配时,考察两个人是不是很接近不是从单一的维度去考虑的。不会说两个孩子都写了“我晚睡”,就把他们放一起,还有很多其他因素的考量。而且四类问题的衡量权重是相当的,不会刻意突出哪一方面。因为现在引发矛盾的因素很多元化,你不帮我拿快递都有可能引发矛盾。
北青报:预期的效果是什么样的?
郭亚敏:从最终的效果来看,是要在保证宿舍里的孩子有一定差异性的同时,把两个差异性特别大的人分开,因为差异过大容易产生和激化矛盾。
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
在用户行为分析实践中,很多从业者会陷入一个核心误区:过度关注“当前数据的分析结果”,却忽视了结果的“泛化能力”——即分析 ...
2026-03-13在数字经济时代,用户的每一次点击、浏览、停留、转化,都在传递着真实的需求信号。用户行为分析,本质上是通过收集、整理、挖掘 ...
2026-03-13在金融、零售、互联网等数据密集型行业,量化策略已成为企业挖掘商业价值、提升决策效率、控制经营风险的核心工具。而CDA(Certi ...
2026-03-13在机器学习建模体系中,随机森林作为集成学习的经典算法,凭借高精度、抗过拟合、适配多场景、可解释性强的核心优势,成为分类、 ...
2026-03-12在机器学习建模过程中,“哪些特征对预测结果影响最大?”“如何筛选核心特征、剔除冗余信息?”是从业者最常面临的核心问题。随 ...
2026-03-12在数字化转型深度渗透的今天,企业管理已从“经验驱动”全面转向“数据驱动”,数据思维成为企业高质量发展的核心竞争力,而CDA ...
2026-03-12在数字经济飞速发展的今天,数据分析已从“辅助工具”升级为“核心竞争力”,渗透到商业、科技、民生、金融等各个领域。无论是全 ...
2026-03-11上市公司财务报表是反映企业经营状况、盈利能力、偿债能力的核心数据载体,是投资者决策、研究者分析、从业者复盘的重要依据。16 ...
2026-03-11数字化浪潮下,数据已成为企业生存发展的核心资产,而数据思维,正是CDA(Certified Data Analyst)数据分析师解锁数据价值、赋 ...
2026-03-11线性回归是数据分析中最常用的预测与关联分析方法,广泛应用于销售额预测、风险评估、趋势分析等场景(如前文销售额预测中的多元 ...
2026-03-10在SQL Server安装与配置的实操中,“服务名无效”是最令初学者头疼的高频问题之一。无论是在命令行执行net start启动服务、通过S ...
2026-03-10在数据驱动业务的当下,CDA(Certified Data Analyst)数据分析师的核心价值,不仅在于解读数据,更在于搭建一套科学、可落地的 ...
2026-03-10在企业经营决策中,销售额预测是核心环节之一——无论是库存备货、营销预算制定、产能规划,还是战略布局,都需要基于精准的销售 ...
2026-03-09金融数据分析的核心价值,是通过挖掘数据规律、识别风险、捕捉机会,为投资决策、风险控制、业务优化提供精准支撑——而这一切的 ...
2026-03-09在数据驱动决策的时代,CDA(Certified Data Analyst)数据分析师的核心工作,是通过数据解读业务、支撑决策,而指标与指标体系 ...
2026-03-09在数据处理的全流程中,数据呈现与数据分析是两个紧密关联却截然不同的核心环节。无论是科研数据整理、企业业务复盘,还是日常数 ...
2026-03-06在数据分析、数据预处理场景中,dat文件是一种常见的二进制或文本格式数据文件,广泛应用于科研数据、工程数据、传感器数据等领 ...
2026-03-06在数据驱动决策的时代,CDA(Certified Data Analyst)数据分析师的核心价值,早已超越单纯的数据清洗与统计分析,而是通过数据 ...
2026-03-06在教学管理、培训数据统计、课程体系搭建等场景中,经常需要对课时数据进行排序并实现累加计算——比如,按课程章节排序,累加各 ...
2026-03-05在数据分析场景中,环比是衡量数据短期波动的核心指标——它通过对比“当前周期与上一个相邻周期”的数据,直观反映指标的月度、 ...
2026-03-05