京公网安备 11010802034615号
经营许可证编号:京B2-20210330
大数据在智慧城市的10大应用_数据分析师考试
大数据是智慧城市各个领域都能够实现“智慧化”的关键性支撑技术,智慧城市的建设离不开大数据。建设智慧城市,是城市发展的新范式和新战略。大数据将遍布智慧城市的方方面面,从政府决策与服务,到人们衣食住行的生活方式,再到城市的产业布局和规划,直到城市的运营和管理方式,都将在大数据支撑下走向“智慧化”,大数据成为智慧城市的智慧引擎。
欧盟利用大数据实现智慧城市的做法给我们很多启示。
欧盟对智慧城市的评价分为六个方面:智慧经济、智慧治理、智慧生活、智慧人民、智慧环境、智慧移动性。也就是说智慧城市要促进经济的发展,要改进和帮助更多大众的参与,让老百姓享受智慧的生活,人民得到更好的服务,居住环境更加优化。智慧城市的应用很广泛,我们都知道有物流、交通、电网、工业、农业、建筑、环境、医疗等方面。现在我要讲的是,智慧城市本身会催生大数据,我们可以看到一个企业会涉及到很多环境,管理环境,开放环境,知识环境、服务环境,过去这些环境的关联度不够,那么现在通过数据库使得这些环境能够联合起来,使得企业的效率提高40%-60%,根据赛门铁克的一份最新调研报告,今天全世界所有企业的信息存储总量已达2.2ZB,企业平均10PB,大企业更大点,小企业小点。一般企业都会建立数据库,必须进行数据的集资和数据的挖掘,企业的数据在企业内部已经占有很重要的位置。
(1)智慧经济
首先大数据在商业上怎么能很好运用,它会分析用户的购物行为,什么商品搭配在一起会卖得更好,还有很多公司通过分析找到最佳客户,淘宝数据魔方则是淘宝平台上的大数据应用方案。那么商家可以了解淘宝平台上的行业宏观情况、自己品牌的市场状况、消费者行为情况等,并可以据此作出经营决策。
美国有个投资公司分析了全球3.4亿微博账户留言,判断民众情绪,人们高兴的时候会买股票,而焦虑的时候会抛售股票,依此决定公司股票的买入或卖出,该公司今年第一季度获得7%的收益率。
阿里公司根据在淘宝网上中小企业的交易状况筛选出财务健康和诚信的企业,从而无需担保来放贷,目前已放贷300多亿元,坏帐率仅0.3%,大大低于商业银行。
企业通过信息收集很好的掌握企业的运营状况,分析居民与财务有关的记录包括贷款申请、租赁、房地产、购买零售商品、纳税申报、水电费缴付、有线电视缴费、电话缴费、报纸与杂志订阅、机动车档案等,能够得出消费者的个人信用评分,从而推断客户支付意向与支付能力,发现潜在的欺诈。
IBM日本公司建立了一个经济指标预测系统,从互联网新闻中搜索影响制造业的480项经济数据,计算出采购经理人指数PMI预测值。
印第安纳大学学者利用Google提供的心情分析工具,对270万用户在2008年3~12月所张贴的970万条留言,挖掘出用户happiness、kindness、 alertness、sureness、 vitality 和calmness等六种心情,进而对道琼斯工业指数的变化进行预测,准确率达到87%。
利用大数据分析可实现对合理库存量的管理,华尔街对冲基金依据购物网站顾客评论分析企业产品销售状况,华尔街银行根据求职网站岗位数量推断就业率。
(2)智慧治理
美国纽约的警察分析交通拥堵与犯罪发生地点的关系,有效改进治安。美国纽约的交通部门从交通违规和事故的统计数据中发现规律,改进了道路设计。
利用短信、微博、微信和搜索引擎可以收集热点事件与舆情挖掘。
电信运营商拥有大量的手机数据,通过对手机数据的挖掘,不针对个人而是着眼于群体行为,可从中分析:实时动态的流动人口的来源及分布情况;出行和实时交通客流信息及拥塞情况。利用手机用户身份和位置的检测可了解突发性事件的聚集情况。
MIT的Reality Mining项目,通过对10万多人手机的通话、短信和空间位置等信息进行处理,提取人们行为的时空规则性和重复性,进行流行病预警和犯罪预测。
(3)环境监测
对城市的河流进行采样,通过卫星发布,收集产量的数据,这个数据非常大,通过这个数据分析能够判别城市中有没有污染。
(4)智慧医疗
无论是药品的研发还是商业模式的开发运用数据分析都能够得到很好的分析,我们医院里有大量的病例,这里有大量的数据,传统的普通病例很难挖掘数据,现在变成电子化有利于更高数据挖掘,数据的挖掘有利于发现医疗知识,由于医疗资源的分配不均,因此远程医疗十分必要,另外,居家监护很重要,谷歌公司与美国疾病控制和预防中心等机构合作,依据网民搜索内容分析全球范围内流感等病疫传播状况,谷歌的判断与疾控中心的判断是一致的。
社交网络为许多慢性病患者提供了临床症状交流和诊治经验分享平台,医院借此可获得足够多的临床效果统计。个性化的医疗同样很重要,我们发现,同样的治疗对一些病人无效,75%癌症病人,70%的老年痴呆者、50%的关节炎病人、43%的糖尿病患者、40%的哮喘病患者,38%的抑郁症病人。因为人体对药品代谢方式的差异取决于个体特定的基因、酶和蛋白质组合,因此基因信息对选择最优治疗非常关键。对人体个性体质的挖掘会做到真正意义上的对症下药,一个人的基因信息大概1GB。
(5)智能搜索
除此之外,我们还通过网络进行学习,早期的网络学习是通过网站专业人员编制的内容,如今我们希望能够实现更加智能的搜索。随着移动互联网的出现,搜索引擎会变成基于语音的智能搜索;基于位置的搜索;基于个性化搜索。
(6)舆情监测
大众传播发展的很快,这里包含着大量的数据,例如微博传播具有裂变性、主动性、即时性、便捷性、交互性、草根性,跟进性和临场感,每一个微博用户既是"服务器",也是"受众"。中国的微博比社交网络更热,因为140个字符的微博在英文和中为分别约等于25个和85个英语单词,即中文微博的信息量是Twitter的3~4倍。最近两个月在YouTube上上载的视频超过了ABC、 NBC和 CBS 电视台自1948年以来24/7/365 连续播出的内容,而"云平台+多屏融合"模式已成为智能家居和智能车载等的发展方向。
(7)精准营销
美国信用营销分析专家张川告诉记者,在大数据分析的应用上,美国政府和大公司领先新兴国家至少20年。15年前,美国的信用卡公司就可以进行数据挖掘实现精准营销:在合适的时间,通过合适渠道,把合适的营销信息投送给每个顾客。
(8)犯罪预警
随着智能电话和电脑网络的普及,美国政府和大公司把自己的触角伸到个人生活的每个方面。美国个人的一切在线行为数据都被收集储存,再加上已被有关机构掌握的个人信用数据、犯罪记录和人口统计等数据,有关公司和政府机构可以运用数据挖掘的办法,监控和预测个人的行为,并做出相关决策。
(9)全球安全监测
如美国已具备对全球网络空间的监视控制能力。斯诺登披露的“棱镜”计划,缘于美国政府的“星风”监视计划。2004年,布什政府通过司法程序,将“星风”监视计划分拆成由国家安全局执行的4个监视计划,除“棱镜”外,还包括“主干道”、“码头”和“核子”。其中,“棱镜”用于监视互联网个人信息。“核子”则主要负责截获电话通话者对话内容及关键词。“主干道”和“码头”分别对通信和互联网上数以亿兆计的“元数据”进行存储和分析。“元数据”主要指通话或通信的时间、地点、使用设备、参与者等,不包括电话或邮件等的内容。
(10)市场价格监测
肯尼思·丘基尔是《经济学家》杂志数据编辑、《大数据:一次将改变我们生活、工作和思考方式的革命》一书的合著者之一,他日前在美国《外交政策》杂志掀起一场有关“大数据时代令隐私保护问题更加突出”的讨论。丘基尔举例说,警方如果要侦破一个城市的加油站是否存在合谋操控价格的“卡特尔行为”,以往要靠线人举报。但今天,可以做大数据分析——分析该市油价变化和加油站分布情况。通过分析,可以发现正常的价格变化规律,如果价格变化持续异常,就可以怀疑存在价格垄断的行为。丘基尔认为,大数据的价值在于存储后的再使用。不过,关键的一个问题是,收集、保存一切信息,与隐私保护政策是有冲突的,“保存一切信息是必要的,但是在这么做之前,我们有必要问自己一个问题,即现行的隐私保护政策是不是妨碍了我们正在迈入的大数据世界”。丘基尔提到,社会有必要就此进行大辩论,以便为大数据时代的隐私保护划定新的边界。
结束语
美国IT咨询公司Avanade商业情报部副总裁斯蒂夫·帕尔默告诉记者,大数据是指非常“膨胀”的数据集,用典型的数据分析软件和工具难以对其进行捕捉、储存、管理、分享、分析和可视化。大数据有3个特征:一是数据的数量大;二是产生或被吸收的速度和频率快;三是数据的多样性。为从大数据中“挖出金矿”,一家企业或机构必须能够应对大数据上述3个特征。帕尔默说,大数据给人类带来的真正机遇是把许多信息碎片拼起来,为我们的决策服务。
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
在数据统计分析、数据清洗、异常值识别与数据分布研究中,箱型图是最直观、高效、专业的可视化分析工具。相较于柱状图、折线图仅 ...
2026-05-29Tkinter是Python内置的标准GUI图形界面库,具备无需额外安装、调用简单、兼容性强、轻量化高效等优势,是Python快速开发桌面小程 ...
2026-05-29 很多分析师在设计标签时思路清晰,但真到落地环节却面临“数据在手,不知如何转化为可用标签”的困境:或因加工方式选择不当 ...
2026-05-29【核心关键词】大数据、经理、专业、金融、客户、传统、建模、数据产品、互联网金融、产品经理、数据分析、金融行业、数据模型 ...
2026-05-28 很多分析师每天和数据打交道,但当被问到“标签是什么”“标签和指标有什么区别”“标签体系如何设计”时,却常常答不上来。 ...
2026-05-28随着大数据技术的快速普及,各行各业积累了海量的用户数据、交易数据、生产数据与行为数据。单纯的数据统计与报表分析只能呈现表 ...
2026-05-28在Python网络请求、接口测试、数据爬取、业务对接开发中,Requests库是最简洁、最高效的HTTP请求工具,凭借简洁的语法、完善的适 ...
2026-05-272025 年,零售与服务行业的竞争已从 “经验驱动” 全面转向 “数据驱动”。中小企业门店普遍面临数据零散、分析浅层、决策凭感觉 ...
2026-05-27 很多数据分析师每天都在写SQL,但当被问到“数据查询语言(DQL)的本质是什么”“SELECT语句中各子句的书写顺序与实际执行顺 ...
2026-05-27在统计学分析、实验研究、业务数据复盘过程中,单因素方差分析是检验自变量对因变量是否存在显著影响的核心方法。其中,两个水平 ...
2026-05-26【核心关键词】算法、客户、大数据、互联网、调优、建模、模型优化、机器学习、评分卡模型、模型开发、智能风控、业务场景、数 ...
2026-05-26 很多数据分析师写过无数个 SELECT,但当被问到“新建一张表,该如何定义字段类型来保证数据质量”“创建视图和存储物理表有 ...
2026-05-26在数据清洗、统计分析与数据质量检测工作中,箱型图(又称箱线图、Box Plot)是最直观、最高效的可视化分析工具之一。相较于柱状 ...
2026-05-25在大数据分析、数据清洗、质量管控、风险监测等领域,异常数据识别是保障数据质量、确保分析结论精准、规避业务决策失误的核心基 ...
2026-05-25 很多数据分析师精通Excel函数和透视表,但当被问到“数据从哪里来”“表和视图有什么区别”“数据库管理系统和SQL是什么关系 ...
2026-05-25数字化经营时代,企业的市场竞争早已从经验决策转向数据决策。门店营收、用户转化、产品销量、成本损耗、存量资产等所有经营行为 ...
2026-05-22在MySQL数据库日常运维、业务数据校验、数据迁移与数据清洗场景中,自增主键ID的连续性校验是一项基础且关键的工作。MySQL的Auto ...
2026-05-22 很多企业团队并非缺乏指标,而是陷入“指标失控”:仪表盘上堆满实时跳动的数据,却无法回答“当前瓶颈在哪、下一步该做什么 ...
2026-05-22【核心关键词】大数据、可视化、存储、架构、客户、离线、产品、同步、实时、数据仓库、数据分析、数据可视化、存储数据、离线 ...
2026-05-21在电商流量红利消退、公域获客成本持续走高的当下,存量用户深度挖掘已成为店铺增收增效的核心抓手。相较于付费投放获取的陌生新 ...
2026-05-21