京公网安备 11010802034615号
经营许可证编号:京B2-20210330
如何提升数据的价值让大数据变现?
近来看很多人都在谈大数据变现的事情,大家都分享了在各行各业,用大数据赚到钱的招数。相信随着大数据在各行各业的深入,还会有更多人分享出更多精彩的案例。今天我想谈一点个人对数据的看法,理清楚几个概念,也许对大家能有所帮助。
数据的价值与体现
数据是有价值的,如果在一年以前很多人会质疑这个观点,但我相信现在更多的人支持这个观点。数据都是有价值的,不同质量的数据,不同的价值,数据的价值是客观存在的。
数据不是凭空而来的,数据是一个场景,一个业务,一个应用产生而来。所以数据的价值是它产生的环境,过程的独特属性而赋予的。数据可以有很多属性,就我们所知,可以有金融属性,也可以是任何一个领域的独特属性。正是这些具有不同属性的数据,造成了数据价值,应用层面的差异化。
举个例子,什么是具有金融属性的数据,比方说你的每月收入,你的信用卡消费,你的网购消费,你的房贷、车贷等等,都形成了你的金融属性数据。金融属性的数据产生的过程离钱最近,也最有价值。它直接可以利用为征信,乃至金融风控。
同样,你每天上网看信息、社交,听歌,打游戏,搜索,看视频等等,都会产生很多行为、偏好和社交属性的数据。通过这些属性就可以勾勒出一个人的用户画像。
我们再来看数据的变现。数据的变现,就是把这些不同属性的数据再次应用到场景(当然更多地还是新场景,跨域关联可能产生更高的价值)中去,体现新价值的过程。变现,是一种能力,也是提升数据价值的基础。没有变现的能力,提升数据价值就是空谈。如何更好地提升数据价值那就更是天方夜谭了。
为什么多数知名大数据公司对“变现”表现的不像他们对大数据技术本身那样游刃有余?因为这本身就是两种截然不同的能力!
掌握了高深的数据处理技术,与了解应用场景,解决客户的实际问题,并能够进一步将其提炼,包装成业务,是两个完全不同的能力。简而言之,在多数大数据公司里面,并不具备这个能力。没有理由证明有高深的数据处理技术,就一定可以做好变现。相反,我看到的大多都是反面教材!
变现能力,是将技术转化成生产力的能力。很多大数据公司忽略了这个能力,甚至是主观上忽略,看不起变现能力,过于夸大技术驱动市场。这也是目前大数据市场上,很普遍的现象。
还有一种情况,是对数据本身知之甚少,介入行业时间短,自然难以变现。
上面两种情况,属于两个目前市场上最常见的两种情况。第一种多为在行业里多年,也确实有比较高深的数据处理技术,但主观上就轻视变现,认为掌握了顶尖的技术,就可以改变世界。我年轻的时候也想过,可惜没成。所以啊,这些公司不是没价值,大数据的发展依然少不了他们的推动,但恐怕就要朝基础科学的阵营里去走了。大数据确实还属于一个前沿科学,真的不是每个大数据技术都可以很好地被应用到市场中来。对于这部分公司,走情怀路线,我很尊敬的。
第二种情况,还是多历练历练再说吧。我一直认为市场是公平的。要想在一个行业中持续获利,还是先搞懂这个市场再说吧。熟能生巧。
市场上,有一个误区,“我之所以在大数据领域赚不到钱,是因为我没有掌握高深的数据处理技术”。我以亲身经历负责任地说,有时大数据赚钱并不一定需要高深的技术。我们就是用了并不是很高深的处理技术,为很重要的客户提供了数据服务,解决了他们很关键很头疼的问题,创造了很大的价值,并且已经将其包装成具有普适性的,可以推广的业务了。
当然,也不是说数据处理能力不重要。没有足够的数据处理能力,不知道什么数据可以做什么用,即使机会摆在你面前,也是抓不住的。只有拥有了足够的数据处理能力以及丰富的行业经验,能准确地挖掘用户的实际需求,对各类数据有一个全面了解的公司,才可能“举重若轻”。既然可以用简单地办法实现用户的目的,又何必炫技呢?
大数据是一种技术,是一种工具,不要把它过于神话,再好的技术也是为应用而来的。作为一家数据公司(区别于上面的第一种公司,那个基本可以叫研究院),首要的能力就是要懂得变现;最大的使命,就是使你手头的数据价值最大化!如果不懂得如何变现,怎么能证明你懂得数据的价值,能够为客户创造更多的价值呢?只能是孤芳自赏。
提升数据价值的三种方法
数据产生于业务或者应用,那么体现价值的最好办法就是回归到业务。数据回归到业务有三个层级的方法,由远及近,首先是数据的挖掘,这个自不必说了;其次是数据的打通,如果说挖掘是提升数据价值的一次体现,那么数据的打通就是使数据发生核聚变的一次“反应”;最后,也是最高级的实现方法,就是流转。数据的流转就是数据又流动到业务。这个流回不是简单地回流,而是经过了数据的加工处理,又返回业务,产生新的数据,形成闭环。
在这里,尤其加上跨界的数据,或者说具有不同属性的数据进行加工,流转,形成新的业务数据,就可以使原有的数据价值得到一个极大的升华。
很多人估计还不是真正清楚为什么要数据挖掘?数据挖掘是揭示人们可能忽视的或者检视人们依靠主观经验判断错误的事物。除了大家已经耳熟能详的啤酒喝尿不湿的关联关系,你能想象出为什么很多客户会同时买一个100元左右的包,再去买一个900多元的包吗?但事实如此。所以数据挖掘是数据价值的第一次提升。数据的世界很精彩!
再举个例子,比方说我们有很多ID,很多单维度的数据。目前单一的ID以及关联的单维度数据价值并不高。因为它只揭示了很小部分的特征,只能继续用回产生数据的业务场景。
如果我们又刚好获得了几个不同的ID以及其关联的另外属性的数据,虽然它们每一个价值依然都不大,但我们就可以尝试将其打通,产生更大的价值。假设几个不同ID以及数据的起点成本是1,那么当我们通过几十种不同的模型将其分类、打通之后,就远远大于1.在这个过程里,是1+1>>2.这是一个核聚变的过程。并不是我在这里空谈,而是市场的认可。
如果在能够将打通的数据,应用到某种场景当中,产生新的数据,那就会是又一个巨大的飞跃!因为数据的价值是场景的价值决定的,它产生的价值越高,其本身的价值也就越高。
比方说我利用打通的数据解决了用户的一个顽疾,避免了它每笔100元的损失,那么他是否愿意为此支付10元每笔呢?如果是,那么我的数据价值就是10元。
我们再以一个实际的例子去串起来数据价值的改变过程。我们的起点是一些互联网数据的碎片,假设价值为1。经过了清洗、分类、筛选、打通,就成为了5;再经过与其他数据的拼接,就构成了用户画像,那么作为征信生产材料的一部分,被应用到征信场景中来,就可能再次翻倍,成为10。在数据的应用过程中,数据的属性在不断地增加、提炼,最终得以升值。
总之,数据的变现也好,提升数据的价值也好,可以有很多渠道,有很多场景。只要你用心,懂市场,这些都不难找到。大数据虽不是万能的,但没有数据是万万不能的。法无定法,不要过于纠结什么商业模型。大数据即便今天依然是一个新业务,在行业的应用过程中,要尊重市场的规律,以市场为导向,并不是喊喊口号而已。大数据是工具,是一门技术而已,不要将其神话。再好的技术,再好的工具也是为解决问题而来的。
数据是有属性的,不同的场景,不同的业务,不同的应用,不同的对象,产生不同的数据,具有不同的属性。不同的业务需要不同属性的数据。比方说征信,首先需要的是金融属性的数据,而非行为数据。你对这个人的行为再了解,不代表对这个人的金融属性了解。这是一门严谨的科学,不可儿戏。
在大数据公司提升自己数据的价值过程中,确实存在价值最大化的可能。同样的数据价值基础,朝不同的业务方向上去走,得到的价值提升是不同的。当然这一点是建立在解决好上面问题的基础上才能实现的。没有上面基于对数据属性的了解,不懂得如何运用数据去解决用户的实际问题,就根本谈不上更好地提升数据价值了。
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
在数据分析中,“正态分布” 是许多统计方法(如 t 检验、方差分析、线性回归)的核心假设 —— 数据符合正态分布时,统计检验的 ...
2025-10-28箱线图(Box Plot)作为展示数据分布的核心统计图表,能直观呈现数据的中位数、四分位数、离散程度与异常值,是质量控制、实验分 ...
2025-10-28在 CDA(Certified Data Analyst)数据分析师的工作中,“分类变量关联分析” 是高频需求 —— 例如 “用户性别是否影响支付方式 ...
2025-10-28在数据可视化领域,单一图表往往难以承载多维度信息 —— 力导向图擅长展现节点间的关联结构与空间分布,却无法直观呈现 “流量 ...
2025-10-27这个问题问到了 Tableau 中两个核心行级函数的经典组合,理解它能帮你快速实现 “相对位置占比” 的分析需求。“index ()/size ( ...
2025-10-27对 CDA(Certified Data Analyst)数据分析师而言,“假设检验” 绝非 “套用统计公式的机械操作”,而是 “将模糊的业务猜想转 ...
2025-10-27在数字化运营中,“凭感觉做决策” 早已成为过去式 —— 运营指标作为业务增长的 “晴雨表” 与 “导航仪”,直接决定了运营动作 ...
2025-10-24在卷积神经网络(CNN)的训练中,“卷积层(Conv)后是否添加归一化(如 BN、LN)和激活函数(如 ReLU、GELU)” 是每个开发者都 ...
2025-10-24在数据决策链条中,“统计分析” 是挖掘数据规律的核心,“可视化” 是呈现规律的桥梁 ——CDA(Certified Data Analyst)数据分 ...
2025-10-24在 “神经网络与卡尔曼滤波融合” 的理论基础上,Python 凭借其丰富的科学计算库(NumPy、FilterPy)、深度学习框架(PyTorch、T ...
2025-10-23在工业控制、自动驾驶、机器人导航、气象预测等领域,“状态估计” 是核心任务 —— 即从含噪声的观测数据中,精准推断系统的真 ...
2025-10-23在数据分析全流程中,“数据清洗” 恰似烹饪前的食材处理:若食材(数据)腐烂变质、混杂异物(脏数据),即便拥有精湛的烹饪技 ...
2025-10-23在人工智能领域,“大模型” 已成为近年来的热点标签:从参数超 1750 亿的 GPT-3,到万亿级参数的 PaLM,再到多模态大模型 GPT-4 ...
2025-10-22在 MySQL 数据库的日常运维与开发中,“更新数据是否会影响读数据” 是一个高频疑问。这个问题的答案并非简单的 “是” 或 “否 ...
2025-10-22在企业数据分析中,“数据孤岛” 是制约分析深度的核心瓶颈 —— 用户数据散落在注册系统、APP 日志、客服记录中,订单数据分散 ...
2025-10-22在神经网络设计中,“隐藏层个数” 是决定模型能力的关键参数 —— 太少会导致 “欠拟合”(模型无法捕捉复杂数据规律,如用单隐 ...
2025-10-21在特征工程流程中,“单变量筛选” 是承上启下的关键步骤 —— 它通过分析单个特征与目标变量的关联强度,剔除无意义、冗余的特 ...
2025-10-21在数据分析全流程中,“数据读取” 常被误解为 “简单的文件打开”—— 双击 Excel、执行基础 SQL 查询即可完成。但对 CDA(Cert ...
2025-10-21在实际业务数据分析中,我们遇到的大多数数据并非理想的正态分布 —— 电商平台的用户消费金额(少数用户单次消费上万元,多数集 ...
2025-10-20在数字化交互中,用户的每一次操作 —— 从电商平台的 “浏览商品→加入购物车→查看评价→放弃下单”,到内容 APP 的 “点击短 ...
2025-10-20