京公网安备 11010802034615号
经营许可证编号:京B2-20210330
数据在四个层面上的价值思考
1、思考一下,数据是什么?
“掌握数据就掌握一切”,已经成为大部分互联网公司的基本认识,你只要有用户数据,行为数据,关系链数据,就可以在此基础上衍生出很多新的玩法,新的服务等等甚至之前不存在的产品。
那么数据是什么呢?
我理解的数据其实就是我们个人和社会活动中所有状态和行动的记录。这种记录可以是连续的,也可以是离散的。可以是单点的,也可以是关联的。
数据可以由数字构成,也可以由简单的标签构成,可以是复杂的图像,也可以仅仅由“YES” or “NO” 两种形态。
关键的是,你如何定义这个数据,以及如何使用这些数据。
如果只是将其存储在物理的计算机存储器中,这些数据就是历史,是对资源的浪费。
2、数据在四个层面上的价值分析
数据价值的分析可以从多个角度进行,应用层面,行业层面,小到个人体重管理,大到国家国际战略决策,都可以阐述数据价值。这篇文章,主要是从数据关系和处理方法角度来看数据有哪些价值,以及为实现这些价值,需要做哪些准备和之前遇到的一些坑。
第一层:孤立数据
孤立数据,也可以看成是一个单点数据,其实就是最基本的表示一个状态或者一个记录。这种数据当然也是有价值的,比如:多个孤立的数据可以刻画一个具体的事物,一个人,一个企业等等,都可以通过单点的数据来进行基本描述。
孤立数据是一切数据分析的前提。对于孤立数据,我想表达的一个思考就是,尽可能的标准化。在数据产品设计的时候,或者在数据表的开发时,就需要讲这些孤立的数据定义青清楚。那个字段,通过哪种标识方式,代表哪个含义。同时这种定义,越广泛的范围采用,孤立数据的价值越大。比如:男/女 这种性别定义就非常简单,估计在全球范围内,都可以通用。
第二层:统计数据
我们在大学时代所学的统计学,概率论基本都是对数据的统计处理方法。统计数据是对一定时间或空间维度的数据进行分布计算,在此基础上,发现一些规律和特征,同时依照这种规律进行未来的预测。
最近有个很有意思的现象,国家在严格控制房产价格,各地政府为了保住乌纱帽,无不在统计数据上做文章,抑制中心地区的高价房出售,同时又大量放出郊区低价房。结果不到一个月,全国房价上涨得到有效控制,有些城市还出现大幅下跌。于是,各地官媒喜大普奔,报道房价下跌,政府有功。
“统计数据会撒谎”也是一个大多数人的认识。我们在应用统计数据的时候,首先需要定义如何统计,统计的目标和价值衡量标准在哪里?
比如:我想看下一个月之内,会员在某一个场景下各个时段的操作频次。这个时候就要问一下自己,一个月的数据是否能真实的反应你所想要的市场规律,是不是要扩大到一个季度或者一年。同时如果你是想分析用户转化,那么是不是多加几个场景纵向比较,以确认在哪个场景去投入更多资源等等。
第三层:关联数据
关联数据就开始深入到多维度上面去了,对一个主体的多维数据进行计算,以发现维度之间的关系,是互相促进的,还是互相抑制的。最优组合点以及价值临近点在哪里?
作为数据挖掘的一个重要方法,关联分析在推进系统里面使用很多。关联数据,可以有效的进行服务打包,商品打包。从海量的销售数据中进行关联数据分析,可以发现很奇特的组合。比如有段时间,我在分析会员来电情况,我们会发现,询问A问题的用户,通常会在电话结束后进行B操作,这种关联性,然我们优化了服务流程,在同类用户中,我们通过对A类来电进行B类服务的推荐,很好的进行了服务推广。达到非常好的效果。
第四层:智能数据
智能数据,就是指通过复杂的机器学习算法进行计算得出的数据,这种数据有时候是无法解释其内在原因的,但是智能化是未来的方向,并且速度越来越快。
我所理解的智能数据,是通过大量的数据训练,来实现内在模式的底层规律建设,在此基础上,对新数据的判断和结果产出。就比如最近很热门的Master 大战人类围棋高手,就是在Master进行了大量围棋基本规则定义,以及无数围棋落子模式训练后,形成的一种具有自我判断和计算意识的围棋模式。它之所以能战胜,更多胜在其计算能力和学习深度上面。比人类有了更多层的预测,并在此基础上判断了每一步的胜率。
智能数据是未来进行决策辅助的重要环节,它将像一个先知一样,协助人类预测未来,警示我们在现有模型下的发展结果。从这个角度上看,恐惧大可不必。
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
在数据处理的全流程中,数据呈现与数据分析是两个紧密关联却截然不同的核心环节。无论是科研数据整理、企业业务复盘,还是日常数 ...
2026-03-06在数据分析、数据预处理场景中,dat文件是一种常见的二进制或文本格式数据文件,广泛应用于科研数据、工程数据、传感器数据等领 ...
2026-03-06在数据驱动决策的时代,CDA(Certified Data Analyst)数据分析师的核心价值,早已超越单纯的数据清洗与统计分析,而是通过数据 ...
2026-03-06在教学管理、培训数据统计、课程体系搭建等场景中,经常需要对课时数据进行排序并实现累加计算——比如,按课程章节排序,累加各 ...
2026-03-05在数据分析场景中,环比是衡量数据短期波动的核心指标——它通过对比“当前周期与上一个相邻周期”的数据,直观反映指标的月度、 ...
2026-03-05数据治理是数字化时代企业实现数据价值最大化的核心前提,而CDA(Certified Data Analyst)数据分析师作为数据全生命周期的核心 ...
2026-03-05在实验检测、质量控制、科研验证等场景中,“方法验证”是确保检测/分析结果可靠、可复用的核心环节——无论是新开发的检测方法 ...
2026-03-04在数据分析、科研实验、办公统计等场景中,我们常常需要对比两组数据的整体差异——比如两种营销策略的销售额差异、两种实验方案 ...
2026-03-04在数字化转型进入深水区的今天,企业对数据的依赖程度日益加深,而数据治理体系则是企业实现数据规范化、高质量化、价值化的核心 ...
2026-03-04在深度学习,尤其是卷积神经网络(CNN)的实操中,转置卷积(Transposed Convolution)是一个高频应用的操作——它核心用于实现 ...
2026-03-03在日常办公、数据分析、金融理财、科研统计等场景中,我们经常需要计算“平均值”来概括一组数据的整体水平——比如计算月度平均 ...
2026-03-03在数字化转型的浪潮中,数据已成为企业最核心的战略资产,而数据治理则是激活这份资产价值的前提——没有规范、高质量的数据治理 ...
2026-03-03在Excel办公中,数据透视表是汇总、分析繁杂数据的核心工具,我们常常通过它快速得到销售额汇总、人员统计、业绩分析等关键结果 ...
2026-03-02在日常办公和数据分析中,我们常常需要探究两个或多个数据之间的关联关系——比如销售额与广告投入是否正相关、员工出勤率与绩效 ...
2026-03-02在数字化运营中,时间序列数据是CDA(Certified Data Analyst)数据分析师最常接触的数据类型之一——每日的营收、每小时的用户 ...
2026-03-02在日常办公中,数据透视表是Excel、WPS等表格工具中最常用的数据分析利器——它能快速汇总繁杂数据、挖掘数据关联、生成直观报表 ...
2026-02-28有限元法(Finite Element Method, FEM)作为工程数值模拟的核心工具,已广泛应用于机械制造、航空航天、土木工程、生物医学等多 ...
2026-02-28在数字化时代,“以用户为中心”已成为企业运营的核心逻辑,而用户画像则是企业读懂用户、精准服务用户的关键载体。CDA(Certifi ...
2026-02-28在Python面向对象编程(OOP)中,类方法是构建模块化、可复用代码的核心载体,也是实现封装、继承、多态特性的关键工具。无论是 ...
2026-02-27在MySQL数据库优化中,索引是提升查询效率的核心手段—— 面对千万级、亿级数据量,合理创建索引能将查询时间从秒级压缩到毫秒级 ...
2026-02-27