京公网安备 11010802034615号
经营许可证编号:京B2-20210330
可能是因为媒体人长期需要保持对新闻的敏感性,对社会热点的持续关注,有时候也需要间中制造一些社会热点,或许这就是媒体人的职业病,也正式因为这种职业特性,使得传统媒体人对于社会热门概念有着异常的敏感性和关注力,直到“新媒体”、“互联网思维”、“大数据”等概念被创造和传播出来的时候,很多媒体从业者也许就是幕后实际的推手。
然而却鲜有几个媒体人能够真正深切领会这些热门词汇的背后深意,更无法知晓自己与这些热门词汇的真正关系,以至于虽然有时候是自己亲手创造了这些热词,却迷失在对于这些热词之上,本期道哥就要针对媒体人热衷谈论的“大数据”这个关键词来一个深入的剖析,看看传统媒体人应该有的数据思维是怎样的?又应该有怎样的数据方法论去指导自己的实践。
干货即将登场……
大数据概念的报道现在遍及你能够接触到的所有媒体渠道平台之上,一些数据服务提供商也嗅到商机,不断向媒体掌舵者推销其的解决方案,一些新闻事件,诸如用机器人写新闻等的新闻事件的报道又让这种推销接近达到效果,一系列的带有政绩工程色彩的设备和解决方案即将被加入购物车,一群大忽悠的“诡计”即将得逞。
其实在这里不是否定大数据服务提供商的产品和服务不好,只是想阐明一个基本的立场,那就是虽然大数据如此的有用,供应商的整套解决方案如此的完美,但是却未必适用于传统媒体现有业务体系,或者说传统媒体还不具备实施这些高大上解决方案的基础条件;
与此同时,本质上,传统媒体从业者包括掌舵者,本身对于标准意义上的大数据战略的理解,以及对于自身数据内容和实际的需求的理解和掌握程度十分有限,以至于无法做到知己,也无法做到知彼,整个一个需求不对称的尴尬局面,如何破局?还是需要从知己知彼开始。
啰嗦终于结束了,这才是真正的前戏。
一、回望传统媒体与大数据
1、大数据从何而来?概念和现实
大数据从何而来?无论从概念还是实践角度,无疑的答案都自互联网,信息技术革命的三剑客——电脑(硬件工具)、网络(渠道和载体)、信息(数据和主体)的发展成熟,使得信息技术革命开始对一切围绕信息流,或者扩展到一切以“流”和核心业务流程的产业领域展开影响和变革,传媒(信息流)、商业(信息流、物流、资金流)、金融(信息流、资金流)、社交(情感流),而所有的“流”在信息技术通道上进行交换流转的过程就是数据产生的过程,在互联网产业兴起的前期,一些曾经存量的非数字化的信息数字化后也成为重要的数据,包括传统媒体最早先为新闻门户提供的数字报内容,但是由于后来的UGC模式产生内容数据越来越多,以至于数量和质量都超过了传统媒体提供的转过过的数据,也使得传统媒体“内容为王”的美梦彻底破灭。
2、传统媒体的数据有多少?从何而来?
1)、数字化存量,传统媒体本身就是非数字化的媒体,因此从一开始就与互联网数据存在于两个不同的体系之中,由于互联网发展初期自动生成的数据内容的缺失,导致了对传统媒体所拥有的存量内容有了数字化的需求,因此传统媒体的数据中,来自传统非数字化内容的数字化产生的数据就成为一个增量部分。
2)、互联网增量,后来基于最初完成数字化的数字报网站之上,传统媒体有了自己的所谓新闻网站,并正式开始生产完全基于互联网数字平台的增量数据,包括一些滚动新闻、新闻转载、用户交互数据、用户行为数据等。
3)、物联网数据,随着移动互联网技术发展,互联网连接的范围和层次深度越来越高,以至于数据的生产和产生已经从专业化,专职化的局限中解放出来,脱离基于PC互联网而来的,人、终端设备、联网设备,都可以实时产生数据,这些数据是构成未来数据改变人类生活的重要组成部分,这些才是未来大数据的核心组成部分。
3、大数据的新时代特征
从以上分析可以得知,数字化存量数据这一过度数据类型成为传统媒体数据的主体,而物联网数据对于传统媒体基本是空白,而互联网增量数据由于其新媒体网站的孱弱也无法有力支撑,由此可以看到,用数字化、大数量、多维度、交互性等几个基本特征去审视传统媒体已经有的大数据已经基本能够得出可以忽略传统媒体现有数据的结论,在真正的大数据面前,传统媒体的数据几乎可以忽略不计。
与此同时,随着云技术的普及和推广,以及移动互联网技术的普及和应用,在以上四个基本的特征之上,当下的大数据还必须具备一个基本的特性,那就是“实时在线”,也就是数据已经不是静态的数据,而是可以通过随时随地的互联网连接,随时进行数据交互和共享,以及实现数据的实时互通,实时在线让数据价值挖掘亦呈现动态特性,而传统媒体的不同种类数据相互是独立的,不但不具备实时在线的特征,互相之间也是无法实现互通的。
4、重新认识大数据
再用国际上大量、高速、多样、价值四个V属性来审视和衡量传统媒体的数据,我们可以得出一些惊人的结论,或者每个传统媒体从业者都可以自问下自己的数据,是否有足够符合这四个基本特征的数据,或者说是大数据。
首先,历史报纸,是大数据的重要基石,但是请问,又有多少个报社所有的历史报纸已经完成了数字化,并且分类完整的存放于数据库中;
其次,所有的用户数据,是否分立于不同的数据库和不同应用之中,而且,所有的用户数据在传统媒体的数字平台之上,是否有统一的ID,是否可以统一登陆认证和数据自由调取和交互;
再次,网站数据是否拥有10万以上的PV或者是一定的并发量基础,是否可以用肉眼都可以分析出流量的走势或者可以用手指数出前十名的浏览量数据;
再次,经营系统拥有的客户资料等商业数据是否有效,是否在数据库中标识用户年龄为静态的32,却没有出生年月或者数据写入时间现象?是否有大量和无数的“你拨打的电话是空号”的客户电话号码;
最后,对于用户行为的监控,以及传统报纸读者阅读行为收集的数据,传播效果监控数据是否有完整的精细化数据,还是购买了数据公司可以同时卖给无数家报社使用的所谓的用户行为以及传播效果监控数据呢?
其实分析到如下,用基础的大数据标准特征去分析传统媒体自己拥有的数据内容,基本上有两个结论方向,传统媒体是否有数据,或者算得上有数据,如果有,那么这些数据是否有价值,到底是垃圾数据还是金子般的数据?
5、必须面对的基本事实
用不上的数据,有多少都是没有用的,只会浪费我们的存储空间。数据再大,没有价值也是零。大数据是你可以关注的概念,却不是你能够玩得起的东西。一切让你对大数据进行大规模投入的人都近乎是骗子。大数据是石油,但是你坐的是牛车,拉车的牛只喝水吃草不和石油。这就是传统媒体遭遇的大数据尴尬。
二、传统媒体的大数据方法论
正确理解并面对这些基本的事实,那就是大数据概念再花俏,大数据战略再实用都不是传统媒体的菜,起码在当下不是,因为传统媒体还不具备进行大数据战略和实践的基本或者是基础条件。
靠谱的大数据策略或许应该是这样的,那就是直面现实,通过借数据挖数据满足数据的需求,放弃大数据转投小数据。
而在实施数据策略的时候要坚持“思维、价值、多维、交互、进化”这十字关键词,坚持三大原则和步骤,心存基本的数据价值观,那就是“别人大数据,我要小数据;别人抢数据,我来洗数据;别人挖数据,我来整数据”。
而在方法上,首先,要坚持用数据,用小数据的思维,开始对数据进行洗白,对存量数据中有价值的数据进行清理,完成基于全新数据理念基础上的数据重新梳理和洗白,并将这些数据转化到一个基于数字业务基础的新平台之上,完成基于互联网的数据基础平台的搭建,从而开始全新的数据策略。
其次,坚持最小单元的方法,通过精益的方法,对数据进行挖掘和洗白,以阶段性成果为追求目标,通过局部小范围的试水进行数据洗白和验证,完成短平快的数据挖掘过程。
最后,建立数据对内和对外交互共享的机制,通过开放平台进行共享合作,借船出海,以解决自身数据体量以及维度单一的致命伤。
如此,通过洗白、平台、交互、挖掘几个步骤对数据思维进行升级,对存量数据进行洗白,对数据平台进行搭建,对最小单元数据进行交互挖掘,可以实现数据战略的重新起步,其中洗白是这一个过程的起点,而一个新的数字平台是重要支撑,而对内对外的交互是重要的保证,最后价值的挖掘是整个过程的核心。
三、借势开放挖掘你的数据价值
当下,拥有实施大数据战略的平台和互联网巨头,通过收购合作等的方式,将更多的涉及用户经济生活中的所有行为数据等都完成了收集,并且不断完成数据的更新和互动,已经能够建立起一个基于用户的多维度的数据用户虚拟画像能力,而这些能力会随着数据量和维度的不断扩展而精确,而其一定是愿意通过开放平台吸收更多的数据提供者加入到大数据的建设中来,而此时传统媒体的基础垂直行业数据就是这个大平台的数据重要组成部分。
与此同时,大平台和互联网巨头,要实现大数据的真正价值,必须结合行业和区域的垂直落地伙伴的支撑,才能够最大限度的挖掘这些大数据的商业和社会价值,因此未来一定是开放的方式将数据进行共享和交互,并为传统媒体提供了基于自身优势发挥大数据商业价值的机会。
开放是互联网的根本的核心精神,在大数据策略执行的过程中,不具备自身独立大数据战略部署的传统媒体,唯有通过数据的自我洗白和理顺,坚持小数据策略,建立起基本的数据平台和体量数据库,通过与外部平台进行数据交互共享的方式,实现资源的互补利用,进而以数据价值的挖掘,以及区域和行业垂直领域的大数据价值挖掘为核心进行商业价值开发,或许才是当下能想到的几乎是唯一的解决方案。
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
在Python开发中,HTTP请求是与外部服务交互的核心场景——调用第三方API、对接微服务、爬取数据等都离不开它。虽然requests库已 ...
2025-12-12在数据驱动决策中,“数据波动大不大”是高频问题——零售店长关心日销售额是否稳定,工厂管理者关注产品尺寸偏差是否可控,基金 ...
2025-12-12在CDA(Certified Data Analyst)数据分析师的能力矩阵中,数据查询语言(SQL)是贯穿工作全流程的“核心工具”。无论是从数据库 ...
2025-12-12很多小伙伴都在问CDA考试的问题,以下是结合 2025 年最新政策与行业动态更新的 CDA 数据分析师认证考试 Q&A,覆盖考试内容、报考 ...
2025-12-11在Excel数据可视化中,柱形图因直观展示数据差异的优势被广泛使用,而背景色设置绝非简单的“换颜色”——合理的背景色能突出核 ...
2025-12-11在科研实验、商业分析或医学研究中,我们常需要判断“两组数据的差异是真实存在,还是偶然波动”——比如“新降压药的效果是否优 ...
2025-12-11在CDA(Certified Data Analyst)数据分析师的工作体系中,数据库就像“数据仓库的核心骨架”——所有业务数据的存储、组织与提 ...
2025-12-11在神经网络模型搭建中,“最后一层是否添加激活函数”是新手常困惑的关键问题——有人照搬中间层的ReLU激活,导致回归任务输出异 ...
2025-12-05在机器学习落地过程中,“模型准确率高但不可解释”“面对数据噪声就失效”是两大核心痛点——金融风控模型若无法解释决策依据, ...
2025-12-05在CDA(Certified Data Analyst)数据分析师的能力模型中,“指标计算”是基础技能,而“指标体系搭建”则是区分新手与资深分析 ...
2025-12-05在回归分析的结果解读中,R方(决定系数)是衡量模型拟合效果的核心指标——它代表因变量的变异中能被自变量解释的比例,取值通 ...
2025-12-04在城市规划、物流配送、文旅分析等场景中,经纬度热力图是解读空间数据的核心工具——它能将零散的GPS坐标(如外卖订单地址、景 ...
2025-12-04在CDA(Certified Data Analyst)数据分析师的指标体系中,“通用指标”与“场景指标”并非相互割裂的两个部分,而是支撑业务分 ...
2025-12-04每到“双十一”,电商平台的销售额会迎来爆发式增长;每逢冬季,北方的天然气消耗量会显著上升;每月的10号左右,工资发放会带动 ...
2025-12-03随着数字化转型的深入,企业面临的数据量呈指数级增长——电商的用户行为日志、物联网的传感器数据、社交平台的图文视频等,这些 ...
2025-12-03在CDA(Certified Data Analyst)数据分析师的工作体系中,“指标”是贯穿始终的核心载体——从“销售额环比增长15%”的业务结论 ...
2025-12-03在神经网络训练中,损失函数的数值变化常被视为模型训练效果的“核心仪表盘”——初学者盯着屏幕上不断下降的损失值满心欢喜,却 ...
2025-12-02在CDA(Certified Data Analyst)数据分析师的日常工作中,“用部分数据推断整体情况”是高频需求——从10万条订单样本中判断全 ...
2025-12-02在数据预处理的纲量统一环节,标准化是消除量纲影响的核心手段——它将不同量级的特征(如“用户年龄”“消费金额”)转化为同一 ...
2025-12-02在数据驱动决策成为企业核心竞争力的今天,A/B测试已从“可选优化工具”升级为“必选验证体系”。它通过控制变量法构建“平行实 ...
2025-12-01