京公网安备 11010802034615号
经营许可证编号:京B2-20210330
大数据的四个价值:记录→监督→纠偏→预测
大数据是当今热门的话题,对于大数据很多人提出过这样那样的观点,那么大数据到底是什么,能够给我们带来怎样的价值呢?瑞意趋势CEO 梁海宏来和大家做一下解读。数量巨大,情境微观结合的运行记录信息最终的结果就是大数据。尽管运行记录信息不是大数据的全部,但却应该是以后大数据的主流。目前我们看到的金融、电信、航空、电商、零售渠道等领域中的大数据,多数也都是运行记录信息。
大数据具有采集过程价值未知、力争全面、即时、系统性并发的记录方式,以及主受体统一和大微观的特征,这些特征决定了大数据的价值发挥。
数据本身被记录下来,并非全部是为了长远的利益所用。很多记录其实发挥的作用是一种操作的基础,脱离了记录,后续的操作将难以进行。这点与人脑的作用有点相似。我们每个人在做一个即时操作的同时,大脑都会加以记录。然后依据这些记录快速决定下一步怎么做,即时的这些记录仅仅是一种情景辅助的作用。
数据记录也是对以前操作过程的一个虚拟备份,记录了各自多方不同的操作过程及次序,乃至不同环节的具体操作内容。这样一种作用可以看作是记录本身最被认可的初始价值。历史上的各种备忘录,金融记录(例如会计),甚至包括历史都是出于这样一种动机来加以记录的。记录让操作的当时情景有了复原的可能性,哪怕只是一种并非完整的复原。这种复原除了纪念意义等的考虑外,还有一个重要的价值就是事后的责任追究,是一种奖惩的基础。这样一种作用看似很微小,但却是人类社会运作的基础。尤其是在连接时代的今天,不同主体之间的交互不断加剧,情景复原会让每个主体对自己的操作更为负责,让各种有效的连接成为一种可能。随着互联网与线下实际经济行为的日益融合,一次鼠标点击有可能代表着很大的利益转移,结合网络协议的操作记录成为了大家网上操作时承担对应责任的依据。
延伸案例:
淘宝网鼓励买家与卖家在旺旺上聊天的时候将聊天记录保存下来。在具体的投诉环节,相互之间的聊天记录可以作为一种证据去为自己辩护。而包括中间买方下单,支付款项,卖家发货,快递公司名称以及单号,甚至包括该单在快递过程中的状态,时间,甚至有些快递公司将具体快递员的姓名和电话也记录在内,最后签收的方式等都被详细的记录下来。所有这些记录发挥了一种情景复原以及事后追究责任的作用,从而确保了交易的正常进行。
一个系统在运行的过程中,有些时候也会出现一些跟平常不一样的差异所在。当这种差异所代表的数据通过极值等各种方式体现出来的时候,系统本身的原有平衡可能会被打破,内部各方面的环节或资源就有可能跟不上。这个时候适当的外力参与很有必要,以免出现系统崩溃的情况。
例如汽车上的自动定速巡航可以根据驾驶者设定的速度,汽车调配油门的大小进行不断的微调。当汽车速度超过预设速度多少的时候,就开始减小油门,当速度低于多少的时候,就开始加大油门。通过将当前的速度记录与标准设定的速度进行对比,通过一种模糊控制的方式来进行调整,从而发挥情景指引的作用。
一个企业的产供销系统,一个城市的交通系统,甚至一个国家的人口政策,资源利用等都可以通过这样一种方式来进行微调,从而确保系统的良性运行。
背景案例:中国的计划生育政策
中国的计划生育政策已经执行了很多年,而且也取得了一定的效果。但最近几年随着中国人口老龄化的加快,未来一些年社会对劳动力的需求会逐渐加强,劳动力短缺有可能成为中国的关键问题。
在这样一种情况下,基于各种人口数据的不断变化,适当地进行人口政策的调整已经变成一种必须。但具体怎样调整,则需要根据数据来说话。
对未来的预测功能是目前业界对大数据最看重的价值之一。基于之前记录下来的各种数据的深入研究,发现其中的规律特征,从而进行系统优化,甚至升级。如果前面的纠偏只是一些相对较小的指引的话,那么基于预测的情景研究和系统优化,则是相对较大的变动。这种基于预测的价值实现对系统(包括个人、企业机构,也包括各种电子性工具)的长远运行来说价值重大,其决定了一个系统是否具有长期的成长性和演变能力。
一个主体(系统)不但要考虑即时的运行,以及下一步的正确操作,更需要考虑长远的运行可能。尤其是在竞争激烈的今天,各种企业机构之间的竞争非常残酷。如何基于以往的运行数据,对未来的运行模式进行预测,从而提前进行准备或者加以利用、调整,对很多企业机构其实是一种生死存亡的问题。这样一种情况同样适用于国家级别。正因为这一点,目前无论是在企业级别还是国家级别都开始研究、部署大数据。
延伸阅读:玛雅预言与人类地球的毁灭
著名的玛雅预言,尽管背后有着一定的天文知识基础,但在2011年除催生了一部很火的电影《2012》外,其实很多人的生活没有受到太大的影响。但现在基于人类地球上的各种能源存量,以及大气受污染、冰川融化的程度,我们确实可以推算出按照目前这种工业生产、生活的方式,人类在地球上可以存活的年数。《第三次工业革命》中对这方面有很深入的解释。基于精准预测,发现现有模式是死路一条后,人类就可以进行一些改变,这其实就是一种系统优化。
这种结合之前情景研究,不断进行系统优化的过程,将赋予系统生命力。而大数据就是其中的血液和神经系统。通过对大数据的深入挖掘,我们将会了解系统的不同机体是如何相互协调运作的,同样也可以通过对他们的了解去控制机体的下一个操作,甚至长远的维护和优化。从这个角度讲,基于网络的大数据可以看作是人类社会的神经中枢,因为有了网络和大数据人类社会才开始灵活起来,而不像以前那么死板。基于大数据,个体之间相互连接有了基础,相互的交互过程得到了简化,各种交易的成本减少很多。厂家等服务提供方可以基于大数据研发出更符合消费者需求的服务,机构内部的管理也更为细致,有了血液和神经系统的社会才真的有了生命。
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
在数据分析、业务监控、运营复盘等场景中,列值趋势计算是核心需求之一。无论是分析销售额的月度增长、用户活跃的变化趋势、库存 ...
2026-06-12在数字经济深度渗透的当下,消费者的购买行为已从过去的 “被动接受” 转变为 “主动决策”。流量红利消退、获客成本攀升、用户 ...
2026-06-12CDA三级认证是三个级别中的塔尖,全面考察数据战略、团队领导和复杂项目的综合能力。它所对应的《敏捷数据挖掘》教材,不再局限 ...
2026-06-12在游戏产业的商业逻辑中,付费玩家是支撑游戏生存与发展的核心支柱。行业普遍遵循 “二八定律”:20% 的付费玩家贡献了游戏 80% ...
2026-06-11【核心关键词】企业、定位、传统、产品、互联网、可视化、业务侧、数字化、结构化、数据分析、传统制造业、市场状态、发展空间 ...
2026-06-11 解读《CDA二级教材:量化策略分析(2025)》的全景结构与学习逻辑 ” CDA二级认证是企业招聘数据分析师时最常提及的证书门槛 ...
2026-06-11【核心关键词】药企、可视化、营销、分类、数据分析师、销售数据、业务人员、指导方向、分析报告、营销数据、营销医生 【专访摘 ...
2026-06-10在统计学分析、问卷调研、实验验证、业务复盘等场景中,卡方检验与 T 检验是应用最广泛的两类基础假设检验方法。前者专门处理分 ...
2026-06-10 很多数据分析师每天都在计算指标、制作报表,但当被问到“什么叫指标数据元”“指标数据标准包含哪些核心维度”“指标数据质 ...
2026-06-10在MySQL数据库日常查询、数据统计、后台接口开发、数据导出等场景中,开发者经常需要查询数据表除某几列之外的所有字段。例如查 ...
2026-06-09在Python网络请求、爬虫开发、接口测试、数据抓取等实操场景中,requests库是最常用的第三方请求工具,而content属性是requests ...
2026-06-09 数据分析正在重塑每一个行业。CDA认证的三本官方教材,分别对应Level I、Level II、Level III,为你铺就从业务数据分析到数 ...
2026-06-09在数字财务、智慧财税、业财融合深度推进的当下,传统财务模式下数据标准混乱、业务流程碎片化、知识无法沉淀、系统互通性差等问 ...
2026-06-08随着数字经济深度渗透各行各业,数据正式成为继土地、劳动力、资本、技术之后的第五大生产要素,是企业数字化转型、精细化运营、 ...
2026-06-08 很多数据分析师能熟练写SQL、做透视表,但当被问到“数据是从哪里来的?经过哪些加工才进入数据仓库?ETL具体做了什么?”时 ...
2026-06-08【核心关键词】贷款、报表、课程、专业、建模、缺失值、营销、互联网、银行、办公自动化、数据分析、数据预处理、特征工程、贷 ...
2026-06-05在数据库数据查询、业务报表统计、多表关联分析中,LEFT JOIN左连接是使用率最高的SQL关联查询语句。其核心特性是保留左表全部数 ...
2026-06-05 很多数据分析师能熟练地写SQL、做透视表、算描述性统计,但当被问到“如何预测用户流失概率”“如何归因销量下滑的关键因素 ...
2026-06-05任何一款产品从诞生、普及到最终退出市场,都会遵循一套固定的发展规律,这就是产品生命周期理论。在市场竞争日益激烈、产品迭代 ...
2026-06-04在Excel数据分析、办公统计、业务报表制作场景中,数据透视表是数据汇总、分类统计、快速复盘的核心工具,能够高效完成海量原始 ...
2026-06-04