京公网安备 11010802034615号
经营许可证编号:京B2-20210330
大数据知识的价值体现
数据时代对人类的数据驾驭能力提出了新的挑战,也为人们获得更为深刻、全面的洞察能力提供了前所未有的空间与潜力。
哈佛大学社会学教授加里·金说:“这是一场革命,庞大的数据资源使得各个领域开始了量化进程,无论学术界、商界还是政府,所有领域都将开始这种进程。”
“大数据产业的生态环境正在加速构成。”同方股份有限公司物联网应用产业本部副总经理李小华先生在主题为”拥抱大数据共赢新时代”的2013年合作伙伴大会上如是说,并对此做了详细的分析。
首先看社会环境。信息技术向融合、智慧、绿色的方向发展。大数据伴随云计算、移动互联网领域的发展,产生新的管理模式和商业模式,能够创造出更大的价值,提升社会的管理水平和效率。纵观产业经济发展史,带来应用的技术一定能够发展繁荣的产业。
再看政策环境。政府高度重视,发展战略目标清晰明确。近期发布了一系列促进大数据产业发展的政策。《十二五国家战略新兴产业发展规划》中指出,加强海量数据处理软件为代表的技术软件开发;《物联网十二五发展产业规划》中把大数据信息处理等作为4项关键技术创新工程;《国家发改委关于加强和完善国家电子政务工程建设管理的意见》强调,政府数据中心的建设注重顶层设计,向跨部门、跨区域的协同互动和资源共享转变。
市场环境。前景巨大,空间广阔。结合对中国相关市场的研究,IDC认为中国在大数据领域具有巨大的市场潜力。越来越多的IT供应商将中国作为大数据业务发展的热点。目前,中国已经是全球最大的PC和智能手机市场,并且中国的互联网用户和移动互联网用户数量也是全球最多,这些终端设备每时每刻都在互联网上创造数据。庞大的数据容量不但令众多国际厂商重视中国市场,也使得中国的大数据应用具备了不同于国外的特点,大数据的机遇就在我们面前。
“数据,已经渗透到当今每一个行业和业务智能领域,成为重要的生产因素。人们对于海量数据的挖掘和运用,预示着新一波生产率增长和消费者盈余浪潮的到来。” 麦肯锡称。
数据挖掘的意义
这是一个关于零售帝国沃尔玛的故事。
沃尔玛,全世界最大的零售商,它的人数和美国联邦政府的雇员等量齐观,它的收入2010年突破了4000亿美元,超过了很多国家的GDP总值。在一次例行的数据分析之后,研究人员突然发现,跟尿布一起搭配购买最多的商品竟然是啤酒!这种关系令人费解,尿布喝啤酒风马牛不相及,这是一个真正的规律吗?
经过跟踪调查,研究人员终于发现事出有因。一些年轻的爸爸经常要到超市去购买婴儿尿布,有30%-40%的爸爸会顺便买点啤酒来犒劳自己,沃尔玛随后对啤酒和尿布进行了捆绑销售,不出意料,销售量双双增加。
这就是对历史数据进行挖掘的结果,反映的是数据层面的规律。沃尔玛是世界上最早应用数据挖掘技术的企业之一,也是数据挖掘技术的集大成者。
数据挖掘是指通过特定的计算机算法对大量的数据进行自动分析,从而揭示数据之间隐藏的关系、模式和趋势,为决策者提供新的知识。数据挖掘,把数据分析的范围从“已知”扩大到了“未知”,从“过去”推向了“将来”,它的发展和成熟,最终推动了“大数据”在各行各业的广泛应用。
正如《纽约时报》2012年2月的一篇专栏中所称,“大数据”时代已经降临,在商业、经济及其他领域中,决策将日益基于数据和分析而作出,而并非基于经验和直觉。随着信息管理系统的普及,企业的规模越来越庞大,组织越来越复杂,市场更加多变,竞争更加激烈,信息是否及时准确、决策是否正确合理,对组织的兴衰存亡影响越来越大,一步走错可能全盘皆输。
数据服务于决策
大数据势不可挡,但践行不易。怎样发挥其价值?20世纪全世界最具影响力的科学家赫伯特。西蒙曾预测,在后工业时代,也就是信息时代,人类社会面临的的中心问题将从如何提高生产率转变为如何更好的利用信息来辅助决策。
如何将数据、信息转化为知识,扩大人类的理性,辅助决策?怎样从各个独立的信息系统中提取、整合有价值的数据,从而实现从数据到知识、从信息到知识、从知识到利润的转化?
面对记者的提问,同方副总裁周侠及物联网应用产业本部副总经理李小华对同方大数据理念做了深度的解读。
同方提出的以“数据资源体系”为核心的大数据战略,弥补了过去在不同行业中对管理和决策支持的空白。针对典型业务需求的六个产品应用平台,是数据从产生到服务全过程的六个最重要的结点,每个平台对一系列的产品。一系列掷地有声地落地实践以及“指标体系”、“顶层设计”、“独立于行业”的先进技术理念足以让企业、机构在具体业务实施时有“据”可依。
数据资源体系是独立于行业的,这是同方大数据理念最核心的一点。实现的方式就是构建独立于行业的通用数据生产流程——在不同的行业中抽取相同的数据资源体系。虽然不同行业的业务不同,所产生的数据及其所支撑的管理形态也千差万别,但从数据的获取,数据的整合,数据的加工,数据的综合应用,数据的服务和推广,数据处理的生命线流程来分析,所有行业的模式是一致的。如果在不同行业的业务和管理层之间,增加数据资源体系,通过数据资源体系的数据加工,把今天的数据和历史数据对接,把现在的数据和领导和企业机构关心的指标关联起来,把面向业务的数据转换成面向管理的数据,辅助于领导层的决策,真正实现了从数据到知识的转变,这样的数据资源体系是非常适合管理和决策使用的。
同方副总裁周侠表示,让数据产生价值,不是大数据自身能够解决的。首先要把数据组织成数据资源体系,再对数据进行层次、类别等方面的划分,同时,要把数据和数据的相关性标注出来,这种相关性是反映客观现象的核心。在此基础上,通过分析数据资源和相关部门的业务对接程度,以此发挥数据资源体系在管理、决策、监测及评价等方面的作用,从而产生大数据的大价值,为领导决策提供服务依据。
物联网应用产业本部副总李小华进一步给记者介绍了同方数据资源体系进行数据处理的流程——同方帮助企业建立数据中心建设的理念,在理念指导下建设配套机制,企业通过这个机制和相关数据进行对接,通过对接在不同的管理层级产生出来的效果设立指标体系,有指标体系以后创建监测评价机制。值得说明的是,指标体系是随着具体情况不断变更的,指标体系的变更会引领着后续的业务和数据自动的去适应新的指标体系,这是一个闭环的系统,在闭环系统里,企业可以发现有自身目标以及目标偏差,并可以依据目标偏差进行新的决策,以此减少目标偏差带来的损失。这样就形成了一个可循环的生态系统,帮助企业良性健康发展。
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
在 MySQL 数据查询中,“按顺序计数” 是高频需求 —— 例如 “统计近 7 天每日订单量”“按用户 ID 顺序展示消费记录”“按产品 ...
2025-10-31在数据分析中,“累计百分比” 是衡量 “部分与整体关系” 的核心指标 —— 它通过 “逐步累加的占比”,直观呈现数据的分布特征 ...
2025-10-31在 CDA(Certified Data Analyst)数据分析师的工作中,“二分类预测” 是高频需求 —— 例如 “预测用户是否会流失”“判断客户 ...
2025-10-31在 MySQL 实际应用中,“频繁写入同一表” 是常见场景 —— 如实时日志存储(用户操作日志、系统运行日志)、高频交易记录(支付 ...
2025-10-30为帮助教育工作者、研究者科学分析 “班级规模” 与 “平均成绩” 的关联关系,我将从相关系数的核心定义与类型切入,详解 “数 ...
2025-10-30对 CDA(Certified Data Analyst)数据分析师而言,“相关系数” 不是简单的数字计算,而是 “从业务问题出发,量化变量间关联强 ...
2025-10-30在构建前向神经网络(Feedforward Neural Network,简称 FNN)时,“隐藏层数目设多少?每个隐藏层该放多少个神经元?” 是每个 ...
2025-10-29这个问题切中了 Excel 用户的常见困惑 —— 将 “数据可视化工具” 与 “数据挖掘算法” 的功能边界混淆。核心结论是:Excel 透 ...
2025-10-29在 CDA(Certified Data Analyst)数据分析师的工作中,“多组数据差异验证” 是高频需求 —— 例如 “3 家门店的销售额是否有显 ...
2025-10-29在数据分析中,“正态分布” 是许多统计方法(如 t 检验、方差分析、线性回归)的核心假设 —— 数据符合正态分布时,统计检验的 ...
2025-10-28箱线图(Box Plot)作为展示数据分布的核心统计图表,能直观呈现数据的中位数、四分位数、离散程度与异常值,是质量控制、实验分 ...
2025-10-28在 CDA(Certified Data Analyst)数据分析师的工作中,“分类变量关联分析” 是高频需求 —— 例如 “用户性别是否影响支付方式 ...
2025-10-28在数据可视化领域,单一图表往往难以承载多维度信息 —— 力导向图擅长展现节点间的关联结构与空间分布,却无法直观呈现 “流量 ...
2025-10-27这个问题问到了 Tableau 中两个核心行级函数的经典组合,理解它能帮你快速实现 “相对位置占比” 的分析需求。“index ()/size ( ...
2025-10-27对 CDA(Certified Data Analyst)数据分析师而言,“假设检验” 绝非 “套用统计公式的机械操作”,而是 “将模糊的业务猜想转 ...
2025-10-27在数字化运营中,“凭感觉做决策” 早已成为过去式 —— 运营指标作为业务增长的 “晴雨表” 与 “导航仪”,直接决定了运营动作 ...
2025-10-24在卷积神经网络(CNN)的训练中,“卷积层(Conv)后是否添加归一化(如 BN、LN)和激活函数(如 ReLU、GELU)” 是每个开发者都 ...
2025-10-24在数据决策链条中,“统计分析” 是挖掘数据规律的核心,“可视化” 是呈现规律的桥梁 ——CDA(Certified Data Analyst)数据分 ...
2025-10-24在 “神经网络与卡尔曼滤波融合” 的理论基础上,Python 凭借其丰富的科学计算库(NumPy、FilterPy)、深度学习框架(PyTorch、T ...
2025-10-23在工业控制、自动驾驶、机器人导航、气象预测等领域,“状态估计” 是核心任务 —— 即从含噪声的观测数据中,精准推断系统的真 ...
2025-10-23