京公网安备 11010802034615号
经营许可证编号:京B2-20210330
南大大数据算法 “算出”室友
校方称近八成新生填写了调查问卷 以习惯爱好匹配室友是为了降低产生矛盾的概率
近日,南京大学采用大数据算法,为今年入学的新生匹配室友的消息引发关注。日前,北京青年报记者从该校学生工作处获悉,约3300名新生中,近八成学生填写了问卷。根据问卷中涉及到的生活习惯、个人卫生情况、个性化选择及个人兴趣爱好等选项,学校用大数据算法分析学生的相似程度,以此划分寝室、匹配室友。学生工作处负责人解释,这样做,一方面是为了帮助新生更好地适应集体生活,另一方面降低室友之间产生矛盾的概率。
开学在即,如何尽快适应大学校园生活,在集体生活中与室友和谐相处,是每个新生面临的第一道“门槛”。按照惯例,不少学校在为学生分配宿舍时,会考量新生的生源地、年龄,或是自由匹配产生室友。但近日,南京大学采用大数据算法,考量学生的生活习惯和兴趣爱好,并以此匹配室友的方式,为新生提供了一种新的可能。
对此,大多数网友认为学校的做法是人性化的,可以接触到趣味相投的人,也可以避免一些不必要的矛盾。但也有网友担心:匹配时会不会把一些生活习惯不好的学生聚集到了一起,产生负面影响。还有学生认为,集体生活应该和性格不同的人相处,以提前适应未来的社会生活。
|
|
南大2018级人文科学实验班的学生刘韵(化名)告诉北青报记者,此前,学校新生手册里专门提到会对住宿问题进行问卷调查。“学长学姐和迎新公号也提醒新生这件事。填写的时候,觉得问题都挺实际的,而且每个同学有3次填写更改的机会。”刘韵说,南大分宿舍的方式也引来不少高中同学的羡慕,“他们分宿舍都是按照学号或者姓氏来的,很少按照兴趣爱好分。”刘韵说,自己喜欢打篮球、看综艺,之前特别担心遇到乱拿东西、不讲卫生的室友,填完问卷“心里踏实多了”,他希望能遇到性格开朗的学霸型室友。
北青报记者了解到,这项活动经南大校方牵头,具体操作由该校学生工作处负责。学生工作处郭亚敏老师介绍,去年学校通过网络问卷调查,给新生按照生活习惯分宿舍,效果显著。在此基础上,学校经过一年多的调研,在老生间征集方案,产生了今年的优化升级版本,新添加了如“是否愿意为室友拿快递”、“听歌声音大不大”、“空调喜欢开多少度”这类细节问题。
对话
校方:让学生更好地适应集体生活
谈及大数据分配宿舍室友一事,郭亚敏老师在接受北青报记者采访时说“这样的方式不是拍脑袋想出来的”,而是有一定依据。至于网友的担心,郭老师解释,匹配时会冲淡单一方面的考量,不是要将习惯和爱好完全一致的学生分在一起,而是将差异特别大的学生区分开。
问卷新增“兴趣爱好”的选项
北青报:新生什么时候报到,寝室已经分好了吗?
郭亚敏:8月25日、26日报到,马上就来了。新生大概有3300人左右,八成学生是按照大数据算法给他们分配的宿舍和室友,因为他们在新生网上提前填写了问卷调查。余下的学生采取了随机分配的方式。不过,要等他们入学以后,才能进一步反馈对宿舍和室友是否满意。
北青报:大数据算法匹配室友,具体怎么操作?
郭亚敏:学生先填写问卷,收集到问卷选项的信息后,学校使用大数据推荐算法,通过系统对信息进行量化处理,然后给学生分配室友。
北青报:问卷具体包含哪几个方面的内容?
郭亚敏:第一是生活习惯。包括你的作息时间,冬天夏天使用空调的习惯,是希望热一点还是冷一点。第二是卫生习惯。比如:什么时候整理内务、清理桌椅、打扫垃圾、什么时候洗澡。第三是个性化的问题。比如,是否吸烟,愿不愿意帮室友拿快递、外卖,电费是均摊还是轮流支付,你的肥皂、洗衣粉别人拿来用你有没有意见。第四是个人爱好。(我们)希望宿舍里学生之间有共同话题。比如说一个学生喜欢看电影另一个喜欢听音乐,他们两个能不能放一起,有多大概率可以放一起,这个是要算的。
降低学生入校后产生矛盾的概率
北青报:问卷选项的设置和这种匹配室友的方式,有什么依据吗?
郭亚敏:2017年新生入学时,学校就给部分新生用大数据算法匹配了室友,但参与的新生只有3成左右,规模没有今年这么大。那么这个效果到底怎么样?从后来的跟踪反馈的结果来看,用大数据匹配宿舍的学生,整体满意度比随机分配的学生,高出10个百分点。
因为效果不错,加上学生们最清楚宿舍生活中哪些因素容易造成矛盾,之后我们对16、17级的所有学生做了调研,丰富了问卷。比如,补充了包括听歌声音大小,愿不愿意帮室友拿快递,自习的时间,空调温度高低的细节,都是学生自己总结的,相对来说更真实可信。
北青报:为新生匹配室友的初衷是什么?
郭亚敏:因为今年的00后新生占大多数,基本上都是独生子女,从小到大没有什么集体生活的经验,这样做是让学生更好地适应学校的集体生活。从学校管理上来说,也是为了降低学生入校后产生矛盾的概率。他们要在这里待4年,宿舍矛盾对孩子的负面影响是很大的,学生宿舍存在的隐患、矛盾,也远远大于我们掌握的情况。近些年也有不少室友间互相报复的极端案例。我们希望通过前瞻性的措施,从管理上缓解矛盾,尽量消除发生极端事件的可能性。
希望将差异巨大的学生分开
北青报:大数据匹配室友的消息,也在网上引发一些争议。
郭亚敏:是的,我们也了解到网上有两种不同声音:大多数人会觉得好,认为是人性化操作。同样也有反对的声音,觉得我们剥夺了孩子多样化、差异化交友的权利。甚至有人说,如果一个宿舍的人都晚睡、都抽烟,放在一起是不是合适。
这一点需要解释一下。我们问卷的问题设置得很细,选项也不是简单的“是”和“否”,有“喜欢”、“不喜欢”、“没什么了解”、“没接触过”这些。进一步说,最终要分配时,考察两个人是不是很接近不是从单一的维度去考虑的。不会说两个孩子都写了“我晚睡”,就把他们放一起,还有很多其他因素的考量。而且四类问题的衡量权重是相当的,不会刻意突出哪一方面。因为现在引发矛盾的因素很多元化,你不帮我拿快递都有可能引发矛盾。
北青报:预期的效果是什么样的?
郭亚敏:从最终的效果来看,是要在保证宿舍里的孩子有一定差异性的同时,把两个差异性特别大的人分开,因为差异过大容易产生和激化矛盾。
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
在数据可视化领域,单一图表往往难以承载多维度信息 —— 力导向图擅长展现节点间的关联结构与空间分布,却无法直观呈现 “流量 ...
2025-10-27这个问题问到了 Tableau 中两个核心行级函数的经典组合,理解它能帮你快速实现 “相对位置占比” 的分析需求。“index ()/size ( ...
2025-10-27对 CDA(Certified Data Analyst)数据分析师而言,“假设检验” 绝非 “套用统计公式的机械操作”,而是 “将模糊的业务猜想转 ...
2025-10-27在数字化运营中,“凭感觉做决策” 早已成为过去式 —— 运营指标作为业务增长的 “晴雨表” 与 “导航仪”,直接决定了运营动作 ...
2025-10-24在卷积神经网络(CNN)的训练中,“卷积层(Conv)后是否添加归一化(如 BN、LN)和激活函数(如 ReLU、GELU)” 是每个开发者都 ...
2025-10-24在数据决策链条中,“统计分析” 是挖掘数据规律的核心,“可视化” 是呈现规律的桥梁 ——CDA(Certified Data Analyst)数据分 ...
2025-10-24在 “神经网络与卡尔曼滤波融合” 的理论基础上,Python 凭借其丰富的科学计算库(NumPy、FilterPy)、深度学习框架(PyTorch、T ...
2025-10-23在工业控制、自动驾驶、机器人导航、气象预测等领域,“状态估计” 是核心任务 —— 即从含噪声的观测数据中,精准推断系统的真 ...
2025-10-23在数据分析全流程中,“数据清洗” 恰似烹饪前的食材处理:若食材(数据)腐烂变质、混杂异物(脏数据),即便拥有精湛的烹饪技 ...
2025-10-23在人工智能领域,“大模型” 已成为近年来的热点标签:从参数超 1750 亿的 GPT-3,到万亿级参数的 PaLM,再到多模态大模型 GPT-4 ...
2025-10-22在 MySQL 数据库的日常运维与开发中,“更新数据是否会影响读数据” 是一个高频疑问。这个问题的答案并非简单的 “是” 或 “否 ...
2025-10-22在企业数据分析中,“数据孤岛” 是制约分析深度的核心瓶颈 —— 用户数据散落在注册系统、APP 日志、客服记录中,订单数据分散 ...
2025-10-22在神经网络设计中,“隐藏层个数” 是决定模型能力的关键参数 —— 太少会导致 “欠拟合”(模型无法捕捉复杂数据规律,如用单隐 ...
2025-10-21在特征工程流程中,“单变量筛选” 是承上启下的关键步骤 —— 它通过分析单个特征与目标变量的关联强度,剔除无意义、冗余的特 ...
2025-10-21在数据分析全流程中,“数据读取” 常被误解为 “简单的文件打开”—— 双击 Excel、执行基础 SQL 查询即可完成。但对 CDA(Cert ...
2025-10-21在实际业务数据分析中,我们遇到的大多数数据并非理想的正态分布 —— 电商平台的用户消费金额(少数用户单次消费上万元,多数集 ...
2025-10-20在数字化交互中,用户的每一次操作 —— 从电商平台的 “浏览商品→加入购物车→查看评价→放弃下单”,到内容 APP 的 “点击短 ...
2025-10-20在数据分析的全流程中,“数据采集” 是最基础也最关键的环节 —— 如同烹饪前需备好新鲜食材,若采集的数据不完整、不准确或不 ...
2025-10-20在数据成为新时代“石油”的今天,几乎每个职场人都在焦虑: “为什么别人能用数据驱动决策、升职加薪,而我面对Excel表格却无从 ...
2025-10-18数据清洗是 “数据价值挖掘的前置关卡”—— 其核心目标是 “去除噪声、修正错误、规范格式”,但前提是不破坏数据的真实业务含 ...
2025-10-17