京公网安备 11010802034615号
经营许可证编号:京B2-20210330
利用移动应用软件进行众包给心理学研究带来“大数据”
根据美国心理学协会出版的一篇文章,有这样一款节奏快速的游戏应用软件以创纪录的速度为研究人员提供了数十亿项数据,游戏中玩家扮演机场安检人员操作X光扫描仪筛查旅客的行李箱包。
这是一份发表于美国心理学会期刊《实验心理学:人类知觉与绩效》Experimental Psychology: Human Perception and Performance的报告,其主要合著者杜克大学博士史提芬R.米特罗夫Stephen R. Mitroff说:“利用真实地考验认知能力或其他大脑功能的游戏应用软件,众多的移动装置(智能手机和平板电脑等)为研究人员提供了一个令人兴奋的崭新的众包一项实验的方法。过去在实验室里耗费数十年进行研究的问题,或者说根本无法在实验室里找到现实答案的问题,现在可利用在较短时间内收集的大数据得以考察。
研究人员与这款广受大众喜爱的游戏《机场安检扫描仪》Airport Scanner的开发商Kedlin Co.协作以展示移动科技收集数据的潜力,游戏考验玩家发现并指出正在通过X光扫描仪的行李里面的违禁品的能力。玩家逐件地审视箱包,点按触摸屏指出违禁品。游戏开始时玩家日志上列举了一些常见的违禁品(如枪支,手榴弹,弹簧刀等)和非违禁品(如耳机,衣服等),随着游戏的进行,这个列表会从寥寥几项扩张到数百项。
这份报告中提到,2013年1月至2014年11月期间,这款游戏提供了从超过7百万智能手机或平板电脑的超过20亿次的考验所产生的匿名数据,一直以来米特罗夫和他在“杜克认知神经科学中心”的研究团队正在对这些数据进行分析。玩家们在这款游戏安装到智能手机或平板电脑时同意提交相关数据。
游戏中有一个研究项目是考察玩家们发现罕见物品(在少于0.1%的行李中出现)的能力。
米特罗夫说:“像这样的罕见物品出现在屏幕上,意味着你在1000次考验中才能碰到1次。在实验室环境里,需要太多次考验才能统计出如此接近现实的概率(这样的工作量对于研究人员来说过于繁重)。在大型数据集中,我们能在数百件个案中找到大约30个最罕见的目标”
通过另一个实验还发现,当两件违禁品出现在同一件箱包里时,玩家们容易漏掉1件,而两件不同违禁品出现在同一件箱包里漏掉其中1件这种情况发生的可能性大于两件相同违禁品的情况。举例来说,相对于发现一个炸弹却漏掉另一个炸弹的个案,更多的情况是玩家们发现了一罐汽油却漏掉了一个炸弹。
米特罗夫说:“尽管利用游戏界面来评估认知能力对于心理学研究领域已算不上什么创新,奇迹般的移动互联技术为大规模地研究认知过程提供了可行性。早在1998年,哈佛大学医学院博士杰瑞米M.沃尔菲Jeremy M. Wolfe就分析了1百万次考验,以研究视觉搜寻。这样庞大得足以震撼人心的数据量是历时10年收集取得的。而今天我们却能够通过《机场安检扫描仪》仅仅用1天的时间就收集到超过1百万次考验的数据。”
根据这份报告,众包的优势还包括,它是一种成本低廉的自动地连续地收集数据的方法,它还能模拟现实中的复杂情况,而这些复杂情况是在实验室里难以应对的。
然而,报告的合著者们指出,为取得用于研究的数据而采取的众包方式确实存在短板。研究人员必须具备开发充满乐趣的游戏应用软件的技能,否则就需要与游戏开发商合作。收集来的大量数据未必就是高质量的,优质数据的获得有赖于精心设计的贯穿于整个游戏的留给玩家们作答的问题。以众包方式采集数据意味着研究人员无法选择玩家。
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
在数据统计分析、数据清洗、异常值识别与数据分布研究中,箱型图是最直观、高效、专业的可视化分析工具。相较于柱状图、折线图仅 ...
2026-05-29Tkinter是Python内置的标准GUI图形界面库,具备无需额外安装、调用简单、兼容性强、轻量化高效等优势,是Python快速开发桌面小程 ...
2026-05-29 很多分析师在设计标签时思路清晰,但真到落地环节却面临“数据在手,不知如何转化为可用标签”的困境:或因加工方式选择不当 ...
2026-05-29【核心关键词】大数据、经理、专业、金融、客户、传统、建模、数据产品、互联网金融、产品经理、数据分析、金融行业、数据模型 ...
2026-05-28 很多分析师每天和数据打交道,但当被问到“标签是什么”“标签和指标有什么区别”“标签体系如何设计”时,却常常答不上来。 ...
2026-05-28随着大数据技术的快速普及,各行各业积累了海量的用户数据、交易数据、生产数据与行为数据。单纯的数据统计与报表分析只能呈现表 ...
2026-05-28在Python网络请求、接口测试、数据爬取、业务对接开发中,Requests库是最简洁、最高效的HTTP请求工具,凭借简洁的语法、完善的适 ...
2026-05-272025 年,零售与服务行业的竞争已从 “经验驱动” 全面转向 “数据驱动”。中小企业门店普遍面临数据零散、分析浅层、决策凭感觉 ...
2026-05-27 很多数据分析师每天都在写SQL,但当被问到“数据查询语言(DQL)的本质是什么”“SELECT语句中各子句的书写顺序与实际执行顺 ...
2026-05-27在统计学分析、实验研究、业务数据复盘过程中,单因素方差分析是检验自变量对因变量是否存在显著影响的核心方法。其中,两个水平 ...
2026-05-26【核心关键词】算法、客户、大数据、互联网、调优、建模、模型优化、机器学习、评分卡模型、模型开发、智能风控、业务场景、数 ...
2026-05-26 很多数据分析师写过无数个 SELECT,但当被问到“新建一张表,该如何定义字段类型来保证数据质量”“创建视图和存储物理表有 ...
2026-05-26在数据清洗、统计分析与数据质量检测工作中,箱型图(又称箱线图、Box Plot)是最直观、最高效的可视化分析工具之一。相较于柱状 ...
2026-05-25在大数据分析、数据清洗、质量管控、风险监测等领域,异常数据识别是保障数据质量、确保分析结论精准、规避业务决策失误的核心基 ...
2026-05-25 很多数据分析师精通Excel函数和透视表,但当被问到“数据从哪里来”“表和视图有什么区别”“数据库管理系统和SQL是什么关系 ...
2026-05-25数字化经营时代,企业的市场竞争早已从经验决策转向数据决策。门店营收、用户转化、产品销量、成本损耗、存量资产等所有经营行为 ...
2026-05-22在MySQL数据库日常运维、业务数据校验、数据迁移与数据清洗场景中,自增主键ID的连续性校验是一项基础且关键的工作。MySQL的Auto ...
2026-05-22 很多企业团队并非缺乏指标,而是陷入“指标失控”:仪表盘上堆满实时跳动的数据,却无法回答“当前瓶颈在哪、下一步该做什么 ...
2026-05-22【核心关键词】大数据、可视化、存储、架构、客户、离线、产品、同步、实时、数据仓库、数据分析、数据可视化、存储数据、离线 ...
2026-05-21在电商流量红利消退、公域获客成本持续走高的当下,存量用户深度挖掘已成为店铺增收增效的核心抓手。相较于付费投放获取的陌生新 ...
2026-05-21