京公网安备 11010802034615号
经营许可证编号:京B2-20210330
因为有大数据 所以更聪明_数据分析师考试
无论是亚马逊、Pandora,还是Netflix等网站,它们均采用收集并分析各种渠道的数据去理解消费者的喜好并提供建议。
这种数据利用其实正在普及到越来越多的应用程序,它们可以让消费者看到其健身方式与其他人有哪些不同,或者他们的生育模式是正常还是令人担忧。有一种应用程序,其用户可以迅速发现他是在米兰还是伦敦度假更便宜。与此同时,有一些应用和网站,可以使人们有可能追踪流感在某个国家的传播速度,并查看哪些社区最危险。
到底有哪些领域的应用因为数据的使用变得更聪明?以下几个类型表现得更为明显。
健康及健身应用
耐克公司的FuelBand、索尼公司的SmartBand和Jawbone 公司的Up24等智能腕带或智能手环均提供大数据服务,它们可以让用户直观地看到自己的饮食状况、运动量和睡眠质量,从而帮助用户进行更有效的训练,帮助他们达到健身目标。
一些新型应用还可以就更具体的健康问题——如不孕不育——提供帮助。根据美国疾病控制和预防中心的报告,美国15岁至44岁的已婚妇女中有10%以上(约670万名妇女)无法在婚后12个月内怀孕。一些新的应用程序可以收集来自公共医疗服务、临床研究和其他设备用户的数据,以帮助妇女在无需接受不必要的药物治疗的情况下顺利怀孕。
美国科罗拉多州的Kindara公司开发的应用程序 Fertility Tracker,要求妇女记录并提供关于自己的月经周期、体温、健身活动、服用的维生素、情绪和更多其他细节信息,然后,它可以分析这些数据并识别该妇女的生育高峰日。它还可以告诉用户其身体状况是否正常。
Kindara公司联合创始人兼首席执行官威廉·萨克斯(William Sacks)称,自Fertility Tracker在2012年年底推出以来,超过30万用户下载。
旅游应用
旅游业在互联网早期时代就使用了大数据,消费者可以在几千种不同的航班和酒店中进行选择,并可在网上预订。
现在有一些是基于移动设备的新型旅游应用,可以让消费者更容易比较价格并作出最好的选择。例如,英国爱丁堡的Skyscanner公司开发了一种移动应用Skyscanner,可以将网络上所有的旅游业交易列表显示,并按照价格、时间或航空公司分类,从而使游客不必登陆多个网站进行预定。
Skyscanner公司总裁加雷思·威廉斯表示,Skyscanner收集来自300多个航空公司、旅行社和时间表信息,并将它们以一目了然的表格形式列出。Skyscanner使用计算机算法保持价格滚动,并可作出针对给定市场的预测。
如需更详细了解个别航班的信息,也有相关的应用可以提供帮助。总部位于纽约的Routehappy公司收集与旅游有关的新闻、博客和网站中的数据,汇编座椅宽度、电源插座数量、无线网络连接和其他设施可用性等资料。(Routehappy数据部门主任约翰·沃尔顿称,在世界各地的航班上,经济舱旅客可以预期的座位宽度为16.5英寸到19.7英寸,大约5%的美国航班上有电源插座。)
一个叫Cellcontrol新型手机应用程序甚至可以帮助用户学习驾驶技巧。这个应用是美国路易斯安那州的obdEdge公司开发的。这个应用需要与安装在汽车挡风玻璃上一个传感器配合使用。传感器用于确定汽车是否在运动,其运动速度,以及驾驶员的制动和加速是否适当。Cellcontrol收集并分析公开可用的数据,可以告知司机他们是否违反了当地关于在汽车上使用手机的法律。
购物应用
特价商品搜寻者现在可以使用以大数据为依托的应用程序,以比较店铺、跟踪价格和发现购物网站上的和优惠券。
这类新的购物应用程序包括RetailMeNot公司开发应用,它可以收集大量的优惠券信息,并可根据地理位置信息提醒用户,附近是否有该用户已经收藏的商品可以以优惠价格买到。
另一款购物应用PoachIt可以帮助用户验证促销代码和优惠券的的可用性。它还可以让用户跟踪他们想要购买的商品的价格,并在价格下降时提醒他们。
PoachIt公司首席执行官和创始人Gidi Fisher 说,他的公司对大数据的使用解决了网上购物者的一个无奈:在热门网站列出的优惠券往往已过期,帮助用户对它们进行验证可以节省用户的许多时间。
市民生活应用
各国政府就是大数据的收集者。现在,许多机构正在把更多的信息放到市民的手中。
Data.gov是美国政府于2009年建立的一个网站。该网站可以看到以前锁在数据库中的信息:来自175机构的超过8.8万个数据集,包括当地的犯罪统计,流感在美国的传播速度,有机食品的批发价格等。该网站还为开发人员提供一种简单的方式来显示有关药品和药品召回的数据。
有一个叫Neighborland的应用程序,旨在帮助社会团体和政府部门很好地协同工作。该应用程序汇集了来自Twitter、谷歌地图和Instagram等信息源的数据,例如,它可以收集有关房地产项目的照片、数据和API,包括交通系统和有关样噪音、垃圾滋扰的“311”投诉和举报信息。
2012年,新奥尔良食品卡车联盟(New Orleans Food Truck Coalition)使用Neighborland收集社区居民的意见,以找出“食物沙漠”——缺乏食品和健康食品的小区。他们发现,如果联盟成员被允许到更多社区工作,新奥尔良的经济和居民健康都会受益。
新奥尔良市议会去年七月通过了一项法令,增加对城市流动摊贩的授权,扩大流动摊贩服务地区范围,并延长食品卡车的法定工作时间。
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
在使用Excel透视表进行数据汇总分析时,我们常遇到“需通过两个字段相乘得到关键指标”的场景——比如“单价×数量=金额”“销量 ...
2025-11-14在测试环境搭建、数据验证等场景中,经常需要将UAT(用户验收测试)环境的表数据同步到SIT(系统集成测试)环境,且两者表结构完 ...
2025-11-14在数据驱动的企业中,常有这样的困境:分析师提交的“万字数据报告”被束之高阁,而一张简洁的“复购率趋势图+核心策略标注”却 ...
2025-11-14在实证研究中,层次回归分析是探究“不同变量组对因变量的增量解释力”的核心方法——通过分步骤引入自变量(如先引入人口统计学 ...
2025-11-13在实时数据分析、实时业务监控等场景中,“数据新鲜度”直接决定业务价值——当电商平台需要实时统计秒杀订单量、金融系统需要实 ...
2025-11-13在数据量爆炸式增长的今天,企业对数据分析的需求已从“有没有”升级为“好不好”——不少团队陷入“数据堆砌却无洞察”“分析结 ...
2025-11-13在主成分分析(PCA)、因子分析等降维方法中,“成分得分系数矩阵” 与 “载荷矩阵” 是两个高频出现但极易混淆的核心矩阵 —— ...
2025-11-12大数据早已不是单纯的技术概念,而是渗透各行业的核心生产力。但同样是拥抱大数据,零售企业的推荐系统、制造企业的设备维护、金 ...
2025-11-12在数据驱动的时代,“数据分析” 已成为企业决策的核心支撑,但很多人对其认知仍停留在 “用 Excel 做报表”“写 SQL 查数据” ...
2025-11-12金融统计不是单纯的 “数据计算”,而是贯穿金融业务全流程的 “风险量化工具”—— 从信贷审批中的客户风险评估,到投资组合的 ...
2025-11-11这个问题很有实战价值,mtcars 数据集是多元线性回归的经典案例,通过它能清晰展现 “多变量影响分析” 的核心逻辑。核心结论是 ...
2025-11-11在数据驱动成为企业核心竞争力的今天,“不知道要什么数据”“分析结果用不上” 是企业的普遍困境 —— 业务部门说 “要提升销量 ...
2025-11-11在大模型(如 Transformer、CNN、多层感知机)的结构设计中,“每层神经元个数” 是决定模型性能与效率的关键参数 —— 个数过少 ...
2025-11-10形成购买决策的四个核心推动力的是:内在需求驱动、产品价值感知、社会环境影响、场景便捷性—— 它们从 “为什么买”“值得买吗 ...
2025-11-10在数字经济时代,“数字化转型” 已从企业的 “可选动作” 变为 “生存必需”。然而,多数企业的转型仍停留在 “上线系统、收集 ...
2025-11-10在数据分析与建模中,“显性特征”(如用户年龄、订单金额、商品类别)是直接可获取的基础数据,但真正驱动业务突破的往往是 “ ...
2025-11-07在大模型(LLM)商业化落地过程中,“结果稳定性” 是比 “单次输出质量” 更关键的指标 —— 对客服对话而言,相同问题需给出一 ...
2025-11-07在数据驱动与合规监管双重压力下,企业数据安全已从 “技术防护” 升级为 “战略刚需”—— 既要应对《个人信息保护法》《数据安 ...
2025-11-07在机器学习领域,“分类模型” 是解决 “类别预测” 问题的核心工具 —— 从 “垃圾邮件识别(是 / 否)” 到 “疾病诊断(良性 ...
2025-11-06在数据分析中,面对 “性别与购物偏好”“年龄段与消费频次”“职业与 APP 使用习惯” 这类成对的分类变量,我们常常需要回答: ...
2025-11-06