
以解决问题的姿态玩大数据_数据分析师考试
著名管理咨询公司麦肯锡声称:“数据已经渗透到当今每一个行业和业务职能领域,成为重要的生产因素。人们对于大数据的挖掘和运用,预示着新一波生产力增长和消费者盈余浪潮的到来。”由此引发了大数据的热潮,美国政府2012年宣布投资2亿美元启动“大数据研究和发展计划”,IBM,微软、谷歌、亚马逊等大型企业纷纷投入。中国政府紧接着提出“十二五国家政务信息化建设工程规划”,北京、上海、广东等地陆续推出大数据研发战略,阿里、百度、腾迅、华为等大型企业都已涉足该领域,更有许多新兴企业致力于此,大数据成为了继物联网、云计算、移动互联网之后,又一个信息技术产业发展的制高点!
所谓大数据,必须有足够大的数据量才能发挥它的价值。但是,由于现阶段互联网数据真实性的问题,物联网数据量不够的问题,以及数据安全的问题,对大数据走向应用产生了较大束缚,以至于大部分大数据应用只能存在于“实验室中”,且大数据厂商开始纠结单点上的数据精度,单这一点便是有悖于大数据发展常规的。
在如此现状之下,罗克佳华——这家有着计算机系统集成一级资质,属“应用基因”系的企业涉足大数据,是否能够独善其身,让大数据概念回归本位呢?且看罗克佳华董事长李玮在接受本刊专访时的“如是说”。
我们不是实验室
“罗克佳华做大数据,从不追求一个点的精度,我又不是实验室!我要通过广泛布点的方式获取更多的数据,找到源头,提供解决问题的依据,也就是说,罗克佳华从来不做实验室里的大数据,只从解决问题的角度做可用的大数据。”李玮一句话,态度明确:我——罗克佳华做的所有工作都是以解决问题为目的,以应用为宗旨。
李玮说,首先罗克佳华是一家标准的物联网企业,因此就要做物联网企业该做的事。那么,物联网企业该做什么呢?“我们认为,物联网的规模性必定导致集中的数据服务,也就是说物联网的大量感知终端将产生前所未有的集中的数据量,而这些集中数据通过各种算法,依据各种需求,将延伸出无以数计的服务,这些服务才是物联网的真正价值所在。”而罗克佳华这些年,不管是卖设备,还是卖解决方案,都没落下一件事,就是提供服务。因此,在物联网时代,依据物联网发展线路图,罗克佳华将自己的发展布局做了更为清晰的调整:走云+端之路,“云+端的意思,就是物联网技术和数据服务的结合”。
如何提供更好的服务,罗克佳华也并非一开始就找到了门路。比如在环保监测方面,也做了多种尝试,比如先是重视监测,后来才发现“点多面广的综合监测”得到的效果更好,便将轻监测、广布点的模式推广到其他诸如农业溯源、煤矿安全等领域中。
例如罗克佳华为北京通州做的环保物联网系统,将所有的环保信息化系统进行整合,并结合大家关注的空气质量问题,在全区范围布设了 500个监测点,进行物联网监测,同时将各个工业污染源、农村面源、汽车尾气等导致空气质量变化的排放清单进行实时分析,不仅做到了物联网监测,也充分发挥了数据分析优势,实现了对空气质量的预警预报,以及对环保工作的综合优化管理。
愿景VS红线
至此,罗克佳华的“智能端”和“云服务”形成了一种相辅相成的促进作用,计划在几年内成为节能、环保领域内最强的物联网服务型企业。但成功之路必有坎坷,云+端模式要发展有一个非常重要的基础条件,即政府和行业对数据质量、价值、权益、隐私、安全等产生充分认识,出台量化与保障措施。也就是“数据权属”和“企业观念”两个问题。而正如前文所言,中国目前仍处在大数据的起步阶段,相关立法颇多空白,国内企业的意识也有待转变。
罗克佳华的服务方式是通过监测系统获得真实有效的数据进行分析,可几乎所有用户都在系统布设之后谈及数据保密问题,对项目产生了巨大的干扰。更有甚者,罗克佳华曾试图将一些污染源数据向同行的企业开放,便于他们在对比中提高自己,但这些隐去了名字的数据在不久后就被企业告了状,最后由政府出面叫停。
“物联网数据经常会触到红线,数据运营,如履薄冰啊!”李玮直言数据权属问题是挡在他们身前的“拦路虎”,更是他们将来必须解决的核心问题。不说罗克佳华有许多政府合作项目,导致权属问题更加复杂,光是环境数据及工业设备信号等公共数据如何界定、如何共享都已是非常纠结的问题。
不过,虽然有这方面的忧虑,但毕竟前路漫漫,还有许多未知数,罗克佳华在行动上并没有丝毫的犹豫。本着应用为先的原则,只要是有利于推广和应用的项目,不管是政府买单或是市场化,他们都会积极去做。为了拿出更加专业的精品,他们更以开放的姿态寻求跨界的合作企业和专家团队。“我们做技术的,做好技术,社会要发展,体制待改善,机会就有的。物联网数据要和同行业开放才会更有活力和竞争力,开放的意识形态才会造就开放的国家。”
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
Excel 数据聚类分析:从操作实践到业务价值挖掘 在数据分析场景中,聚类分析作为 “无监督分组” 的核心工具,能从杂乱数据中挖 ...
2025-09-10统计模型的核心目的:从数据解读到决策支撑的价值导向 统计模型作为数据分析的核心工具,并非简单的 “公式堆砌”,而是围绕特定 ...
2025-09-10CDA 数据分析师:商业数据分析实践的落地者与价值创造者 商业数据分析的价值,最终要在 “实践” 中体现 —— 脱离业务场景的分 ...
2025-09-10机器学习解决实际问题的核心关键:从业务到落地的全流程解析 在人工智能技术落地的浪潮中,机器学习作为核心工具,已广泛应用于 ...
2025-09-09SPSS 编码状态区域中 Unicode 的功能与价值解析 在 SPSS(Statistical Product and Service Solutions,统计产品与服务解决方案 ...
2025-09-09CDA 数据分析师:驾驭商业数据分析流程的核心力量 在商业决策从 “经验驱动” 向 “数据驱动” 转型的过程中,商业数据分析总体 ...
2025-09-09R 语言:数据科学与科研领域的核心工具及优势解析 一、引言 在数据驱动决策的时代,无论是科研人员验证实验假设(如前文中的 T ...
2025-09-08T 检验在假设检验中的应用与实践 一、引言 在科研数据分析、医学实验验证、经济指标对比等领域,常常需要判断 “样本间的差异是 ...
2025-09-08在商业竞争日益激烈的当下,“用数据说话” 已从企业的 “加分项” 变为 “生存必需”。然而,零散的数据分析无法持续为业务赋能 ...
2025-09-08随机森林算法的核心特点:原理、优势与应用解析 在机器学习领域,随机森林(Random Forest)作为集成学习(Ensemble Learning) ...
2025-09-05Excel 区域名定义:从基础到进阶的高效应用指南 在 Excel 数据处理中,频繁引用单元格区域(如A2:A100、B3:D20)不仅容易出错, ...
2025-09-05CDA 数据分析师:以六大分析方法构建数据驱动业务的核心能力 在数据驱动决策成为企业共识的当下,CDA(Certified Data Analyst) ...
2025-09-05SQL 日期截取:从基础方法到业务实战的全维度解析 在数据处理与业务分析中,日期数据是连接 “业务行为” 与 “时间维度” 的核 ...
2025-09-04在卷积神经网络(CNN)的发展历程中,解决 “梯度消失”“特征复用不足”“模型参数冗余” 一直是核心命题。2017 年提出的密集连 ...
2025-09-04CDA 数据分析师:驾驭数据范式,释放数据价值 在数字化转型浪潮席卷全球的当下,数据已成为企业核心生产要素。而 CDA(Certified ...
2025-09-04K-Means 聚类:无监督学习中数据分群的核心算法 在数据分析领域,当我们面对海量无标签数据(如用户行为记录、商品属性数据、图 ...
2025-09-03特征值、特征向量与主成分:数据降维背后的线性代数逻辑 在机器学习、数据分析与信号处理领域,“降维” 是破解高维数据复杂性的 ...
2025-09-03CDA 数据分析师与数据分析:解锁数据价值的关键 在数字经济高速发展的今天,数据已成为企业核心资产与社会发展的重要驱动力。无 ...
2025-09-03解析 loss.backward ():深度学习中梯度汇总与同步的自动触发核心 在深度学习模型训练流程中,loss.backward()是连接 “前向计算 ...
2025-09-02要解答 “画 K-S 图时横轴是等距还是等频” 的问题,需先明确 K-S 图的核心用途(检验样本分布与理论分布的一致性),再结合横轴 ...
2025-09-02