
利用移动应用软件进行众包给心理学研究带来“大数据”
根据美国心理学协会出版的一篇文章,有这样一款节奏快速的游戏应用软件以创纪录的速度为研究人员提供了数十亿项数据,游戏中玩家扮演机场安检人员操作X光扫描仪筛查旅客的行李箱包。
这是一份发表于美国心理学会期刊《实验心理学:人类知觉与绩效》Experimental Psychology: Human Perception and Performance的报告,其主要合著者杜克大学博士史提芬R.米特罗夫Stephen R. Mitroff说:“利用真实地考验认知能力或其他大脑功能的游戏应用软件,众多的移动装置(智能手机和平板电脑等)为研究人员提供了一个令人兴奋的崭新的众包一项实验的方法。过去在实验室里耗费数十年进行研究的问题,或者说根本无法在实验室里找到现实答案的问题,现在可利用在较短时间内收集的大数据得以考察。
研究人员与这款广受大众喜爱的游戏《机场安检扫描仪》Airport Scanner的开发商Kedlin Co.协作以展示移动科技收集数据的潜力,游戏考验玩家发现并指出正在通过X光扫描仪的行李里面的违禁品的能力。玩家逐件地审视箱包,点按触摸屏指出违禁品。游戏开始时玩家日志上列举了一些常见的违禁品(如枪支,手榴弹,弹簧刀等)和非违禁品(如耳机,衣服等),随着游戏的进行,这个列表会从寥寥几项扩张到数百项。
这份报告中提到,2013年1月至2014年11月期间,这款游戏提供了从超过7百万智能手机或平板电脑的超过20亿次的考验所产生的匿名数据,一直以来米特罗夫和他在“杜克认知神经科学中心”的研究团队正在对这些数据进行分析。玩家们在这款游戏安装到智能手机或平板电脑时同意提交相关数据。
游戏中有一个研究项目是考察玩家们发现罕见物品(在少于0.1%的行李中出现)的能力。
米特罗夫说:“像这样的罕见物品出现在屏幕上,意味着你在1000次考验中才能碰到1次。在实验室环境里,需要太多次考验才能统计出如此接近现实的概率(这样的工作量对于研究人员来说过于繁重)。在大型数据集中,我们能在数百件个案中找到大约30个最罕见的目标”
通过另一个实验还发现,当两件违禁品出现在同一件箱包里时,玩家们容易漏掉1件,而两件不同违禁品出现在同一件箱包里漏掉其中1件这种情况发生的可能性大于两件相同违禁品的情况。举例来说,相对于发现一个炸弹却漏掉另一个炸弹的个案,更多的情况是玩家们发现了一罐汽油却漏掉了一个炸弹。
米特罗夫说:“尽管利用游戏界面来评估认知能力对于心理学研究领域已算不上什么创新,奇迹般的移动互联技术为大规模地研究认知过程提供了可行性。早在1998年,哈佛大学医学院博士杰瑞米M.沃尔菲Jeremy M. Wolfe就分析了1百万次考验,以研究视觉搜寻。这样庞大得足以震撼人心的数据量是历时10年收集取得的。而今天我们却能够通过《机场安检扫描仪》仅仅用1天的时间就收集到超过1百万次考验的数据。”
根据这份报告,众包的优势还包括,它是一种成本低廉的自动地连续地收集数据的方法,它还能模拟现实中的复杂情况,而这些复杂情况是在实验室里难以应对的。
然而,报告的合著者们指出,为取得用于研究的数据而采取的众包方式确实存在短板。研究人员必须具备开发充满乐趣的游戏应用软件的技能,否则就需要与游戏开发商合作。收集来的大量数据未必就是高质量的,优质数据的获得有赖于精心设计的贯穿于整个游戏的留给玩家们作答的问题。以众包方式采集数据意味着研究人员无法选择玩家。
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
R 语言:数据科学与科研领域的核心工具及优势解析 一、引言 在数据驱动决策的时代,无论是科研人员验证实验假设(如前文中的 T ...
2025-09-08T 检验在假设检验中的应用与实践 一、引言 在科研数据分析、医学实验验证、经济指标对比等领域,常常需要判断 “样本间的差异是 ...
2025-09-08在商业竞争日益激烈的当下,“用数据说话” 已从企业的 “加分项” 变为 “生存必需”。然而,零散的数据分析无法持续为业务赋能 ...
2025-09-08随机森林算法的核心特点:原理、优势与应用解析 在机器学习领域,随机森林(Random Forest)作为集成学习(Ensemble Learning) ...
2025-09-05Excel 区域名定义:从基础到进阶的高效应用指南 在 Excel 数据处理中,频繁引用单元格区域(如A2:A100、B3:D20)不仅容易出错, ...
2025-09-05CDA 数据分析师:以六大分析方法构建数据驱动业务的核心能力 在数据驱动决策成为企业共识的当下,CDA(Certified Data Analyst) ...
2025-09-05SQL 日期截取:从基础方法到业务实战的全维度解析 在数据处理与业务分析中,日期数据是连接 “业务行为” 与 “时间维度” 的核 ...
2025-09-04在卷积神经网络(CNN)的发展历程中,解决 “梯度消失”“特征复用不足”“模型参数冗余” 一直是核心命题。2017 年提出的密集连 ...
2025-09-04CDA 数据分析师:驾驭数据范式,释放数据价值 在数字化转型浪潮席卷全球的当下,数据已成为企业核心生产要素。而 CDA(Certified ...
2025-09-04K-Means 聚类:无监督学习中数据分群的核心算法 在数据分析领域,当我们面对海量无标签数据(如用户行为记录、商品属性数据、图 ...
2025-09-03特征值、特征向量与主成分:数据降维背后的线性代数逻辑 在机器学习、数据分析与信号处理领域,“降维” 是破解高维数据复杂性的 ...
2025-09-03CDA 数据分析师与数据分析:解锁数据价值的关键 在数字经济高速发展的今天,数据已成为企业核心资产与社会发展的重要驱动力。无 ...
2025-09-03解析 loss.backward ():深度学习中梯度汇总与同步的自动触发核心 在深度学习模型训练流程中,loss.backward()是连接 “前向计算 ...
2025-09-02要解答 “画 K-S 图时横轴是等距还是等频” 的问题,需先明确 K-S 图的核心用途(检验样本分布与理论分布的一致性),再结合横轴 ...
2025-09-02CDA 数据分析师:助力企业破解数据需求与数据分析需求难题 在数字化浪潮席卷全球的当下,数据已成为企业核心战略资产。无论是市 ...
2025-09-02Power BI 度量值实战:基于每月收入与税金占比计算累计税金分摊金额 在企业财务分析中,税金分摊是成本核算与利润统计的核心环节 ...
2025-09-01巧用 ALTER TABLE rent ADD INDEX:租房系统数据库性能优化实践 在租房管理系统中,rent表是核心业务表之一,通常存储租赁订单信 ...
2025-09-01CDA 数据分析师:企业数字化转型的核心引擎 —— 从能力落地到价值跃迁 当数字化转型从 “选择题” 变为企业生存的 “必答题”, ...
2025-09-01数据清洗工具全景指南:从入门到进阶的实操路径 在数据驱动决策的链条中,“数据清洗” 是决定后续分析与建模有效性的 “第一道 ...
2025-08-29机器学习中的参数优化:以预测结果为核心的闭环调优路径 在机器学习模型落地中,“参数” 是连接 “数据” 与 “预测结果” 的关 ...
2025-08-29