京公网安备 11010802034615号
经营许可证编号:京B2-20210330
大数据在公安等行业领域得到普及应用
第1页:项目应用前景看好
近一两年,大数据开始在公安等行业领域得到普及应用,除了行业自身的特殊要求外,大数据也带动了相关行业的需求发展。未来,基于大数据的行业应用会变得更加深入,更多的相关厂商也会涉及其中,大数据在公安领域的商业模式架构逐渐清晰起来。
在安防的细分领域中,大数据在公安及智能交通探索应用得比较早,相关的解决方案和技术也比较成熟,在广西等地也已经有相关的项目落地,大数据应用系统已经上线运营,取得了预期的效果。
项目应用前景看好
以相关的案例来讲,在广西公安厅投入使用的大数据系统中,整个项目是以自治区的总数据为出发点,对每天在所有卡口过道产生的上千万条数据,每年大概三十亿条的数据进行分布式存储和快速检索。在此基础上,后续可以给公安用户提供进一步的解决方案和增值服务,比如已经推出的卡口过车大数据、视频图像大数据和公安情报大数据三方面的解决方案。这些方案提供多种功能的查询,以及基于测控的分析和基站行业的服务,目的就是让公安能快速科学地侦破案件。
在智能交通领域,目前主要应用于车辆的疏导,比如基于不同道路、路口车流量的统计(时、日、月统计等),根据这些统计可以分析不同时段某条道路实时的车流密度、发展方向和趋势等。这些项目的应用已经在很多大城市落地,比如平时大家在公交上看到的移动电视里播放的上下班高峰路段实时画面,就是基于大数据的技术分析所得。从应用上看,用户切实感到便捷好用,所以市场潜力很大,未来的应用会更加广泛。
大数据应用存在的难题
大数据本身是针对数据的存储、检索、关联、推导等有价值的挖掘,这些数据本身来说是通用的。但在安防领域,哪些数据是有用的,哪些是我们需要关心和提取的,这是目前在摸索的问题。也就是说,当前的困难在于如何让技术热点和相关业务进行结合,以提取更有价值的数据。
从技术上分析,有两个技术难点:
第一个难点是如何从非结构化的数据中提取结构化的数据出来。所谓非结构化数据是指在视频里面进行特征的提取,这些可能是人类不能理解和不能处理的;结构化数据则是人可以理解和处理的,比如在视频里有几个活动目标、是人还是车。如果是人,身上穿的是什么样的衣服;如果是车,车牌号是多少、什么样的品牌型号、颜色、行进速度、方向等数据,这些都是可以转化为结构化数据为人所用。目前,安防的数据很多涉及到视频数据,而视频数据本身是不能够被结构化的数据,也就不能被计算机直接所处理。所以未来摆在技术人员面前的课题是如何把视频数据转换成计算机能够处理的结构化或者半结构化数据。
第二个难点是寻找这些数据之间的关联和价值。数据是有关联没关联之分的,我们只能通过工具来找。所有这些存储的特征数据,包括公安行业、平安城市中每天产生的海量视频数据,可以为很多案件的侦查提供有价值的线索。现在技术需要攻克的难题就是能不能把这些数据通过相应的工具模块,通过大数据技术把原来被忽视的数据信息关联起来,找到或提取这些数据之间的相关性,为案件的侦破和方案决策提供科学的数据依据。
公安数据流动的单向性
公安行业每天获取的数据数以千万,如何确保这些数据信息的安全成为行业共同关注的热点。从传统意义上讲,数据产生之后,首先要确保数据本身的安全,目前行业内有非常成熟的技术和解决方案。在海量数据面前,如果你对数据不了解,就算把这些数据摆在面前,你也很难去提取有用的数据,但这并不能作为行业忽视其重要性的借口。因为对安防厂商而言,很多有价值的数据是需要提供保护的,也就是对数据应用模式采取高规格的保护措施,因为这些数据一旦被不法分子挖掘并关联起来,可能整个地区的安全漏洞就会被利用。
现在,公安的数据一般在局域网内运行,并有相关的保护措施来提供安全保障。如会把数据分成不同的网络和不同的层次,让数据在不同的网络安全系统之间,从低安全性网络向高安全性网络实行单向流动,最后在公安的核心网络里汇集所有的数据(这个安全等级是最高的,通过安全边界、物理隔离来保护)。同时在外围的视频网,主要以视频数据为主,辅以视频相关的业务,这些数据只有进入公安网后才与其他的数据发生关联,才能发掘出一些有价值的数据。比如办案民警在视频网络上,可以获取犯罪嫌疑人的照片,但这个人是谁,他的信息是什么,只有进入公安网以后才能获取,才能将相关信息匹配关联起来,然后通过其他数据库的关联,进一步挖掘出他在哪个网吧出现过,在哪个酒店居住过……以上信息都可以挖掘出来,但这种挖掘只能在高安全性网络中进行,这种信息流动都是单向的。
未来的商业模式
从传统的安防业务来讲,还是以公安客户投资建设系统为主,厂商提供产品和集成的解决方案,最终由集成商来做落地实施,最后交付给客户使用并进行相应的维护。同时,未来行业对大数据中数据的获取、存储、分析、处理会变得更加的专业,用户本身在处理和应用时可能会遇到各种困难,那么针对这类问题可能会有一些小型的服务公司出现,给终端用户提供各种各样专业的数据服务。比如专业的视频提取会有专业的公司切入,用专业的算法工具帮助你把视频里面的数据提取出来,或者有那些专业的通讯厂商对数据进行挖掘和处理,包括提供一些工具和服务的模式(未来会更倾向于服务的模式)。但限于公安行业的特点,这些公共服务在公安行业目前还比较难做,不过未来也可以由一些厂家对整个应用系统进行构建,以运营服务收费的方式与公安客户或者政府机构进行合作。
对于大型、特别大型的项目,比如涉及到一个城市、一个省乃至全国范围的项目,一般来说可能会找专业的IT厂商来做,特别是互联网公司(现在也有牵涉其中),他们更多是以技术提供商的角色参与,安防厂商侧重点放在业务上。这样大家分工比较明确,因为即使是技术比较领先的行业厂商,它也很难或者没有必要投大量的研发在大数据基础的研发上,而是应该将重点放在大数据的基础应用或业务解决方案上,然后底层的基础架构由IT厂商来分担完成。彼此互利共赢,持续发展。
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
在分类变量关联分析中(如 “吸烟与肺癌的关系”“性别与疾病发病率的关联”),卡方检验 P 值与 OR 值(比值比,Odds Ratio)是 ...
2025-11-05CDA 数据分析师的核心价值,不在于复杂的模型公式,而在于将数据转化为可落地的商业行动。脱离业务场景的分析只是 “纸上谈兵” ...
2025-11-05教材入口:https://edu.cda.cn/goods/show/3151 “纲举目张,执本末从。” 若想在数据分析领域有所收获,一套合适的学习教材至 ...
2025-11-05教材入口:https://edu.cda.cn/goods/show/3151 “纲举目张,执本末从。” 若想在数据分析领域有所收获,一套合适的学习教材至 ...
2025-11-04【2025最新版】CDA考试教材:CDA教材一级:商业数据分析(2025)__商业数据分析_cda教材_考试教材 (cdaglobal.com) ...
2025-11-04在数字化时代,数据挖掘不再是实验室里的技术探索,而是驱动商业决策的核心能力 —— 它能从海量数据中挖掘出 “降低成本、提升 ...
2025-11-04在 DDPM(Denoising Diffusion Probabilistic Models)训练过程中,开发者最常困惑的问题莫过于:“我的模型 loss 降到多少才算 ...
2025-11-04在 CDA(Certified Data Analyst)数据分析师的工作中,“无监督样本分组” 是高频需求 —— 例如 “将用户按行为特征分为高价值 ...
2025-11-04当沃尔玛数据分析师首次发现 “啤酒与尿布” 的高频共现规律时,他们揭开了数据挖掘最迷人的面纱 —— 那些隐藏在消费行为背后 ...
2025-11-03这个问题精准切中了配对样本统计检验的核心差异点,理解二者区别是避免统计方法误用的关键。核心结论是:stats.ttest_rel(配对 ...
2025-11-03在 CDA(Certified Data Analyst)数据分析师的工作中,“高维数据的潜在规律挖掘” 是进阶需求 —— 例如用户行为包含 “浏览次 ...
2025-11-03在 MySQL 数据查询中,“按顺序计数” 是高频需求 —— 例如 “统计近 7 天每日订单量”“按用户 ID 顺序展示消费记录”“按产品 ...
2025-10-31在数据分析中,“累计百分比” 是衡量 “部分与整体关系” 的核心指标 —— 它通过 “逐步累加的占比”,直观呈现数据的分布特征 ...
2025-10-31在 CDA(Certified Data Analyst)数据分析师的工作中,“二分类预测” 是高频需求 —— 例如 “预测用户是否会流失”“判断客户 ...
2025-10-31在 MySQL 实际应用中,“频繁写入同一表” 是常见场景 —— 如实时日志存储(用户操作日志、系统运行日志)、高频交易记录(支付 ...
2025-10-30为帮助教育工作者、研究者科学分析 “班级规模” 与 “平均成绩” 的关联关系,我将从相关系数的核心定义与类型切入,详解 “数 ...
2025-10-30对 CDA(Certified Data Analyst)数据分析师而言,“相关系数” 不是简单的数字计算,而是 “从业务问题出发,量化变量间关联强 ...
2025-10-30在构建前向神经网络(Feedforward Neural Network,简称 FNN)时,“隐藏层数目设多少?每个隐藏层该放多少个神经元?” 是每个 ...
2025-10-29这个问题切中了 Excel 用户的常见困惑 —— 将 “数据可视化工具” 与 “数据挖掘算法” 的功能边界混淆。核心结论是:Excel 透 ...
2025-10-29在 CDA(Certified Data Analyst)数据分析师的工作中,“多组数据差异验证” 是高频需求 —— 例如 “3 家门店的销售额是否有显 ...
2025-10-29