京公网安备 11010802034615号
经营许可证编号:京B2-20210330
电信运营商大数据变现到底靠不靠谱
电信运营商说大数据变现也有快一年了,这一年不能说没有进展,但相对互联网行业的秒速来说,实在只能说是龟速。有人这时候会跳出来说是因为体制问题,基因问题,这个说法是万金油,一般运营商的问题归结到体制上都不会出大错,仿佛这么一说,大家就觉得一切都有了合理解释,然后各自该干嘛干嘛去了,也就不需要再动脑子了。但是今天,我想再继续就这个话题深入聊一聊。本文就是起到抛砖引玉的作用,大家可以一起来讨论,运营商做大数据运营的切入点究竟该如何选取。
俗话说,存在即合理,任何貌似不合理的事情背后你深究下去都是这样。运营商大数据变现进展为什么这么慢?只能说,因为运营商还是没有从大数据里面看到真金白银。为什么中国移动在LTE上的投入那么大手笔,那是因为他看明白了,这是人家未来10年吃饭的饭碗,所以钱砸下去决不手软。相比而言,大数据只能算是一块试验田,而试验田上的收成还真不好说。
过去大半年我们一直在研究移动的数据,做过企业级别的数据资产咨询,也做过几个落地的应用项目的探索,做来做去,我们对移动的大数据认识也越来越清晰。在14年初的时候,运营商对自己的数据还是充满自信的,说起来,移动手里的数据无外乎两大类:一大类是用户的位置数据,另一大类是用户电话、短彩信及上网行为的数据。让我们再深入看看这两类数据。
先说位置数据,移动网络记录用户的位置说到底也是为了给用户提供移动通信服务的,而不是为了窥探用户隐私的,因此:首先它没有必要实时关注所有用户的位置变化,对于没有在使用业务的静默用户来说,隔段时间看看他在哪里就可以了,这个用专业术语说就是周期性的位置更新,这个对于系统降低负荷是很必要的,这样就有第一个结论:网络对于有业务的用户,需要实时关注其位置变化,根据这个位置变化选择不同的基站和小区为其提供服务,对于无业务的用户,仅需轮询其位置变化,这个轮询周期通常是40分钟(根据网络负荷情况调整)。也就是说,网络感知的用户位置不实时,最坏情况时延可达40分钟!其次:网络需要了解用户位置的精度到底到什么程度就够了呢?答案也很容易想到,只要知道用户在哪个小区的服务范围就可以了,因此,移动网络记录的用户位置信息,精度只能到基站的经纬度(小区的经纬度和基站是一样的),这是什么概念呢?2G小区的覆盖范围是数公里,3G的是数百米,4G的小一些会在百米之内。也就是说,网络感知的用户位置在地理上的精度基本是百米量级。
知道了运营商用户位置数据在时间和空间上的精度后,对这些数据可以支撑什么应用也就心中有数了,哪些是靠谱的,哪些是纯忽悠也就一目了然。如果是用来做要求不高的人流密度分析,常住人口分析,人口迁移去向分析够了,如果是做精度要求稍高些的交通疏导,店铺选址,那就需要看实际情况,具体问题具体分析,说不准能不能支持,先别拍胸脯;可如果说要做实时营销,这牛就吹大了,不光实时你保证不了,空间上的准头也有点差,搞不好营销没成反被当骚扰。
再说说用户行为数据,用户的语音、短信类传统业务有一个特点是个人对个人,因此肯定是有一个对端的号码对应的活生生的人,那其中的价值点在哪里就很清楚了,通过这些传统业务的用户行为,你可以很清楚的了解用户的现实交往圈(现实交往圈是和虚拟交往圈相对的,各有各的用处)。但不幸的是,用户往往认为现实交往圈的隐私性很强,目前比较敏感,属于雷区,运营商轻易不敢越的,所以这部分数据的价值在可以预见的未来还不可能发掘。
再有一大类重头的用户行为是用户的上网行为,现在大有手机取代电脑之势,看看低头一族那么多就知道了。所以新新人类的大量碎片时间基本都被手机上网行为所占据了。对于用户通过手机进行的上网行为,网络侧会纪录下用户访问的地址,理论上可以通过该URL地址,结合网络爬虫或APP抓包技术,将实际内容获取回来,然后采用内容识别技术对其中的关键内容进行识别,这样就可以获取到用户行为的相关数据。但我们再进一步看看理论后面的一些落地阶段遇到的问题。至于网络记录的地址长度有限(128位),超出部分会被截断,这些地址也就废了,这些都是小问题,因为记录最初也不是设计来干这个的,而且超出的比例也不是很大,大数据也不在乎少那百分之几的数据。主要的问题有几个,一是APP和网页层出不穷,每天都是爆发式的增多,需要有一个动态更新的APP和网站的分类库,这个库里有网站和APP的多级分类,还需要有网站和APP的多个服务器地址/域名对应关系,这实际上是做了URL分类的基础工作。有效的URL库及后期良性的维护机制是非常重要的;第二,内容分词/识别的复杂度和识别率,每个网站和APP的内容识别往往需要采取不同的方法,具体情况具体分析,需要看页面有无设计规律等,进一步设计具体的内容提取、识别算法,工作量巨大,一旦网站/APP改版,这些工作还要重新进行,因此也要有一套动态维护机制。这两项工作都是非常琐碎繁杂的工作,又很难体现具体的价值,因此很少有厂家愿意投入大量的资源去做。基本还是需求来了,再根据具体的需求具体分析的模式,支撑的时间周期和质量都不稳定。
在APP内容识别的过程中,我们也发现了一些APP分析厂家目前的一些尝试,他们会和APP开发厂家签署协议,直接在APP代码中嵌入数据采集代码,通过在APP运行过程中采集的数据,有针对性地对用户的行为进行分析,通常他们获取的位置和内容精度会很高,而且他们不会因为APP的升级改版而很被动,造成自身程序的大规模修改。与电信运营商相比,他们的劣势是不能获取到所有竞争对手的数据,但是对于APP分析厂家来说,只要和更多的APP厂家签署的协议,他们慢慢也会积累到这部分数据。而且他们获取数据到形成可供分析的基础数据中所作的附加工作比电信运营商少的多,可以把更多的精力放在业务运营上而不是数据准备上。
也许,电信运营商需要重新评估自己的数据适合做什么,不适合做什么,对需要做复杂的数据准备和精度提升才能支撑的应用场景,也许更好的办法是换一个别的方式去做,那样才更符合客观规律。
以上信息纯属一家之言
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
在数据分析实战中,我们经常会遇到“多指标冗余”的问题——比如分析企业经营状况时,需同时关注营收、利润、负债率、周转率等十 ...
2026-02-04在数据分析场景中,基准比是衡量指标表现、评估业务成效、对比个体/群体差异的核心工具,广泛应用于绩效评估、业务监控、竞品对 ...
2026-02-04业务数据分析是企业日常运营的核心支撑,其核心价值在于将零散的业务数据转化为可落地的业务洞察,破解运营痛点、优化业务流程、 ...
2026-02-04在信贷业务中,违约率是衡量信贷资产质量、把控信用风险、制定风控策略的核心指标,其统计分布特征直接决定了风险定价的合理性、 ...
2026-02-03在数字化业务迭代中,AB测试已成为验证产品优化、策略调整、运营活动效果的核心工具。但多数业务场景中,单纯的“AB组差异对比” ...
2026-02-03企业战略决策的科学性,决定了其长远发展的格局与竞争力。战略分析方法作为一套系统化、专业化的思维工具,为企业研判行业趋势、 ...
2026-02-03在统计调查与数据分析中,抽样方法分为简单随机抽样与复杂抽样两大类。简单随机抽样因样本均匀、计算简便,是基础的抽样方式,但 ...
2026-02-02在数据驱动企业发展的今天,“数据分析”已成为企业经营决策的核心支撑,但实践中,战略数据分析与业务数据分析两个概念常被混淆 ...
2026-02-02在数据驱动企业发展的今天,“数据分析”已成为企业经营决策的核心支撑,但实践中,战略数据分析与业务数据分析两个概念常被混淆 ...
2026-02-02B+树作为数据库索引的核心数据结构,其高效的查询、插入、删除性能,离不开节点间指针的合理设计。在日常学习和数据库开发中,很 ...
2026-01-30在数据库开发中,UUID(通用唯一识别码)是生成唯一主键、唯一标识的常用方式,其标准格式包含4个短横线(如550e8400-e29b-41d4- ...
2026-01-30商业数据分析的价值落地,离不开标准化、系统化的总体流程作为支撑;而CDA(Certified Data Analyst)数据分析师,作为经过系统 ...
2026-01-30在数据分析、质量控制、科研实验等场景中,数据波动性(离散程度)的精准衡量是判断数据可靠性、稳定性的核心环节。标准差(Stan ...
2026-01-29在数据分析、质量检测、科研实验等领域,判断数据间是否存在本质差异是核心需求,而t检验、F检验是实现这一目标的经典统计方法。 ...
2026-01-29统计制图(数据可视化)是数据分析的核心呈现载体,它将抽象的数据转化为直观的图表、图形,让数据规律、业务差异与潜在问题一目 ...
2026-01-29箱线图(Box Plot)作为数据分布可视化的核心工具,能清晰呈现数据的中位数、四分位数、异常值等关键统计特征,广泛应用于数据分 ...
2026-01-28在回归分析、机器学习建模等数据分析场景中,多重共线性是高频数据问题——当多个自变量间存在较强的线性关联时,会导致模型系数 ...
2026-01-28数据分析的价值落地,离不开科学方法的支撑。六种核心分析方法——描述性分析、诊断性分析、预测性分析、规范性分析、对比分析、 ...
2026-01-28在机器学习与数据分析领域,特征是连接数据与模型的核心载体,而特征重要性分析则是挖掘数据价值、优化模型性能、赋能业务决策的 ...
2026-01-27关联分析是数据挖掘领域中挖掘数据间潜在关联关系的经典方法,广泛应用于零售购物篮分析、电商推荐、用户行为路径挖掘等场景。而 ...
2026-01-27