
纽约,大数据挖掘预防火灾
作为一个国际化的大都市,纽约大约有100万栋建筑物,平均每年约有3000栋会发生严重的火灾。那是否有方法预防悲剧的发生呢?据华盛顿邮报报道,纽约消防部门的数据分析师认为,每栋建筑物都有着独特的属性,通过对大量数据的分析就能看出哪些建筑物更易“惹火上身”。
纽约市长手下有一支大数据分析团队,他们的主要职责就是搜集各类城市数据信息,进行趋势分析预测,解决城市治理顽疾。在前市长Michael Bloomberg的推动下,纽约已逐渐发展为数据型城市。过去几年间,不同职能部门通过数据挖掘(data mining)和数据分析解决了包括下水道油污堵塞、罪犯追踪在内的多种城市治理问题。要准确掌握纽约这类超大城市的脉络和动向,数据挖掘是其中重要的一环。
判断一栋建筑物是否属“火”有几条重要的标准:例如贫穷、低收入家庭的住房往往更容易发生火灾,而且低收入人群由于居住密度较高,一旦发生火灾危害更大。建筑物的建成时间也是一个应该着重考量的因素,相对而言,年代久远的房子问题更多,它们很容易由于电路老化或布局不合理引发火灾,而且老房子消防设施落后,发生火灾后,消防员赶赴现场,往往会发现附近根本就没有足够的消防栓。另外,建筑物,尤其是高层建筑中,电梯也是一个重要的影响因素,在很多电梯间明确标注着火灾时严禁使用,这是由于“烟囱效应”使得火势在建筑竖井中蔓延更快,而一旦断电电梯停运,人员的处境就更加危险了。但也有一些电梯配备了备用电源,一般是柴油发电机,并有足够的防火隔离措施,方便住户快速逃生。诸如此类因素,不一而足。
纽约消防部门将可能导致房屋起火的因素细分为 60 个。除去危害性较小的小型独栋别墅或联排别墅,分析人员通过特定算法,对城市中 33 万栋需要检验的建筑物单独进行打分,计算火灾危险指数。这样一来,消防员在出勤时可以根据建筑物的详细资料和危险指数,重点关照“火灾危险分子”。
这项庞大的数据挖掘系统在去年7月份开始实施,并在下半年将数据监测项目扩大到2400余项,诸如学校、图书馆等人口密集度高的场所都会被列入重点监测和检查对象。不过目前公众的质疑在于,如何证明数据分析和防范措施的有效性?纽约消防局发言人表示:“答案还是数据本身,因为我们最终会统计出火灾数量是在下降的。”
芝加哥,给路灯杆装上传感器
可穿戴设备的兴起,使传感器堂而皇之地爬上了人的身体;接着,我们的卧室厨房也被Nest等温控和烟雾传感器占领;我们随身携带的手机,集成的传感器将近10种之多:光线感应器、距离传感器、指纹扫描、GPS、陀螺仪、心率传感器、加速感应器、气压传感器、手势传感器等等;而最近,美国芝加哥市更把传感器安装到了街边路灯杆上,用于收集城市不同角落的路面信息和环境数据。
众多传感器被包括在设计精美、布满小孔的金属盒子里,然后安装在灯柱上,装点城市的同时也能监测空气质量、光照强度、噪音水平、温度、风速,还会通过监测手机Wi-Fi或蓝牙信号清点过往的行人。第一批“灯柱传感器”将在今年7 月中旬安置在芝加哥市密歇根大道上8个繁忙的十字路口。后续会首先在旧城区布置,预计 2015 年底完成,并在未来几年全面占领芝加哥市的大小街区。
面对公众对于侵犯个人隐私的质疑,参与这个计划的科学家,芝加哥城市计算和数据中心负责人Charlie Catlett称,设备在设计之初便做好了规划,只侦测信号,不会记录移动设备的MAC和蓝牙地址,“我们的目的是为了更好地理解城市,这也会让芝加哥市成为最有科研价值的城市。”
在近10年间,全球各大城市都致力于收集城市的各类信息数据,从空气质量、温湿度,到道路车流量和人流量,这种种举措都是为了让城市运作得更加安全高效,而芝加哥市则做得更为彻底——其正在全力打造“大数据之城”。虽然收集和分析大量城市的信息数据,并不会对城市的交通、环境或是安全形势起到立竿见影的效果,但研究人员相信,这些数据将有助于更好地研究和理解现代都市的运作原理,然后逐步从数据中挖掘有价值的信息;而且随着数据量的不断增大,科学家们可以发现和构建不同的模型,并将反过来指导城市规划和政策制定等等。比如芝加哥市安装的此类永久性的数据采集装置将会为政府、独立研究机构或是大学提供概念验证和方案测试服务,并会随着传感器技术的进步及时进行产品升级,满足潜在的科研和学术需求。
另据芝加哥城市信息技术委员会成员Berman介绍,每台传感器设备初次采购和安装调试成本在215425美元之间,运行后的年平均用电成本约为15美元。该研究项目得到了包括思科、英特尔、高通、斑马技术公司(Zebra Technologies)、摩托罗拉以及施耐德等的技术和资金支持。
过去10年,我国一直在不遗余力地鼓励、扶持国内智慧城市的发展,中央和各地方政府投入了大量的资金进行相关的基础设施建设,以平安城市中的科技强警战略和“3111”试点工程两大项目为例,从2004年国家提出创建平安城市、平安社会到2010年止的6年多时间内,科技强警示范城市总量达180多个,“3111”示范城市覆盖80多个地市以及下属的400多个市、县和街区,总投资额达千亿元以上,先后投入使用的各种终端设备和传感器数量巨大、收集到的各种信息和数据更难以统计。如何才能更有效地用好这些基础设施?
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
R 语言:数据科学与科研领域的核心工具及优势解析 一、引言 在数据驱动决策的时代,无论是科研人员验证实验假设(如前文中的 T ...
2025-09-08T 检验在假设检验中的应用与实践 一、引言 在科研数据分析、医学实验验证、经济指标对比等领域,常常需要判断 “样本间的差异是 ...
2025-09-08在商业竞争日益激烈的当下,“用数据说话” 已从企业的 “加分项” 变为 “生存必需”。然而,零散的数据分析无法持续为业务赋能 ...
2025-09-08随机森林算法的核心特点:原理、优势与应用解析 在机器学习领域,随机森林(Random Forest)作为集成学习(Ensemble Learning) ...
2025-09-05Excel 区域名定义:从基础到进阶的高效应用指南 在 Excel 数据处理中,频繁引用单元格区域(如A2:A100、B3:D20)不仅容易出错, ...
2025-09-05CDA 数据分析师:以六大分析方法构建数据驱动业务的核心能力 在数据驱动决策成为企业共识的当下,CDA(Certified Data Analyst) ...
2025-09-05SQL 日期截取:从基础方法到业务实战的全维度解析 在数据处理与业务分析中,日期数据是连接 “业务行为” 与 “时间维度” 的核 ...
2025-09-04在卷积神经网络(CNN)的发展历程中,解决 “梯度消失”“特征复用不足”“模型参数冗余” 一直是核心命题。2017 年提出的密集连 ...
2025-09-04CDA 数据分析师:驾驭数据范式,释放数据价值 在数字化转型浪潮席卷全球的当下,数据已成为企业核心生产要素。而 CDA(Certified ...
2025-09-04K-Means 聚类:无监督学习中数据分群的核心算法 在数据分析领域,当我们面对海量无标签数据(如用户行为记录、商品属性数据、图 ...
2025-09-03特征值、特征向量与主成分:数据降维背后的线性代数逻辑 在机器学习、数据分析与信号处理领域,“降维” 是破解高维数据复杂性的 ...
2025-09-03CDA 数据分析师与数据分析:解锁数据价值的关键 在数字经济高速发展的今天,数据已成为企业核心资产与社会发展的重要驱动力。无 ...
2025-09-03解析 loss.backward ():深度学习中梯度汇总与同步的自动触发核心 在深度学习模型训练流程中,loss.backward()是连接 “前向计算 ...
2025-09-02要解答 “画 K-S 图时横轴是等距还是等频” 的问题,需先明确 K-S 图的核心用途(检验样本分布与理论分布的一致性),再结合横轴 ...
2025-09-02CDA 数据分析师:助力企业破解数据需求与数据分析需求难题 在数字化浪潮席卷全球的当下,数据已成为企业核心战略资产。无论是市 ...
2025-09-02Power BI 度量值实战:基于每月收入与税金占比计算累计税金分摊金额 在企业财务分析中,税金分摊是成本核算与利润统计的核心环节 ...
2025-09-01巧用 ALTER TABLE rent ADD INDEX:租房系统数据库性能优化实践 在租房管理系统中,rent表是核心业务表之一,通常存储租赁订单信 ...
2025-09-01CDA 数据分析师:企业数字化转型的核心引擎 —— 从能力落地到价值跃迁 当数字化转型从 “选择题” 变为企业生存的 “必答题”, ...
2025-09-01数据清洗工具全景指南:从入门到进阶的实操路径 在数据驱动决策的链条中,“数据清洗” 是决定后续分析与建模有效性的 “第一道 ...
2025-08-29机器学习中的参数优化:以预测结果为核心的闭环调优路径 在机器学习模型落地中,“参数” 是连接 “数据” 与 “预测结果” 的关 ...
2025-08-29