京公网安备 11010802034615号
经营许可证编号:京B2-20210330
运营商自身如何用好大数据_数据分析师考试
大数据时代已经到来,如何更好地发挥数据资产的价值对于电信运营商来说是一个崭新的课题。电信运营商是大数据的传送者、生产者和使用者。在电信运营商为各行各业提供大数据应用时,首先要将大数据应用于自身发展,才能更好地适应时代竞争需求,如果连内部都做不好,对外营销大数据产品也没有说服力。
运营商是大数据的生产者和使用者
电信运营商是移动数据的传送者。据StatCounter公司2014年5月报告,全球移动互联网流量占互联网流量的25%,其中亚洲比例更高,占到37%,而在2010年这一比例仅为4.5%。有互联网女皇之称的Mary Meeker在《2014互联网趋势报告》中指出,全球移动设备贡献的互联网流量份额将年增1.5倍,到2014年年底超过30%。
电信运营商也是移动数据的生产者。电信运营商在为用户提供上网访问、语音通话、短消息发送等管道服务的同时,也收集管道中流过的数据。
运营商中的大数据主要可分为三大类。第一类是CS(Circuit Switch)域中的信令数据,主要包含用户的电话呼叫记录(CDR)、短信发送记录以及终端与网络的其他交互记录(如终端的开机消息、位置更新消息、鉴权消息)等;第二类是PS(Packet Switch)域中的IP包数据,PS域数据主要包含用户上网时的控制面和用户面数据包记录,控制面数据如AAA的鉴权、认证数据包,PDP建立、更新、删除等,用户面数据主要是用户的上网记录数据;第三类是包含用户个人属性的CRM数据,主要包含用户的身份资料数据、产品的订购数据、用户的消费数据、用户的支付数据、用户的套餐数据、用户的终端数据等。
这些数据完美地体现了大数据的“五V”特征,中国联通从SGSN与GGSN间以分光方式获取移动用户的上网IP地址、时长、上网记录和基站流量,2013年每秒收集用户上网记录83万条,对应年数据量3.6PB。中国电信一个中等规模的本地网每天3G用户上网记录就达到TB级,上海电信每分钟产生8万条位置更新信息。中国移动从移动终端上报的异常事件记录中采集数据,还从基站和交换机中通过分光方式采集数据,2013年每天记录话单数据10TB、信令数据100TB、上网日志500TB,累计数据存量80PB,年增50%。
电信运营商还是移动数据的使用者。三大电信运营商都着力建设大数据分析系统。中国联通建立了用户上网大数据分析系统,利用收集的用户上网记录解决用户透明消费问题, 并使用其中的数据做客户的精细化营销,同时准确掌握每个基站的实时流量和忙闲,为网络扩容和提高质量提供依据。中国移动建立网络资源的大数据系统,改进对用户专线提供的速度。建立微营销大数据分析系统,实现定向精确营销、差异化的合作伙伴后向能力保障和智慧城市管理。中国电信利用大数据支撑智能管道,通过感知优化流量使网络畅通,还利用大数据分析中小企业用户的通信行为,对企业诚信和经济能力进行评价,降低金融机构的风险。
大数据提高企业内部科学决策
运营商大数据的价值主要体现在运营商内部应用和外部商业化。其中通过内部应用可以提高运营商的科学决策水平,实现决策从主观判断和经验判断为主转向数据驱动的科学决策。
精准营销,提升市场经营水平。通过对移动用户上网行为的分析,知道用户的上网偏好,并把合适的内容推荐给喜欢的用户,实现精准流量经营;根据使用不同移动终端的用户的月均流量消耗,分析出在哪些移动终端上用户的上网体验最佳、DOU最大,根据该数据就可制定更为科学的终端补贴策略;通过对用户手机的通话、短信和空间位置等信息进行处理,提取用户通信行为的时空规则性和重复性,有针对性地开发业务和优化资费模式及套餐余量置换方案,实现定向精确的终端营销和个性化内容业务推荐。
客户维系,提升客户服务水平。根据用户的终端是否支持4G,主动向用户推荐性价比更好的4G套餐,让持4G终端的用户早日用上4G网络,提升客户体验,降低用户流失率;通过分析客户通话对象结构转移、使用量变化、上网行为漂移、套餐饱和度下降,分析出客户离网倾向及缴费异常倾向,及时进行客户维系与挽留。
优化网络,提高网络建设和维护水平。通过3G基站的流量大数据,可以分析出哪些区域是用户数据流量高消耗区,在这些区域建设4G基站,就能做到既精准又有效;通过对MR大数据的分析,可以知道哪些区域移动网络小区信号覆盖不好,通过关联CRM中的客户信息和套餐信息,便可排出网络优化的优先顺序;以用户的体验视觉实时跟踪网络性能,记录接收信号强度(RSSI)、用户位置等信息,快速预测用户移动行为,并获取当前小区及下一个切换小区的信息,对待切换到的小区为用户预留资源,实现快速切换,准确掌握每个基站的动态流量和忙闲,为精确规划站址和决策扩容、优化网络性能、实现异构网宏微协同提供依据。
案例:
1.国内某运营企业综合应用神经网络、分类树算法、logistic回归、文本挖掘、SNA社交网络分析等数据挖掘技术,建立投诉预测五大模型,包括交际圈模型、忍受度模型、情感分析模型、业务表象模型、内容敏感点模型,另外利用文本挖掘方式实现对客户投诉文本的自动化分类算法的功能,实现文本自动化分类技术,实现事件到问题的转换,同时,建立文本分类识别模型,变更分类,根据训练结果自动重新归类文本,使业务数据得到有效沉淀,并结合每个分析视角与应用场景,给出用户投诉的风险度、可能的投诉原因及相关场景。实现了智能预判提醒功能,防患于未然,使一线员工的工作方式由被动服务变为主动关怀,有效降低了再次来电率和再次生成工单率,缩短了人均处理工单的时间,提升了工作人员的处理效率,降低了升级用户的投诉率,降低了流量调费用户的调费金额,有效降低了成本。
2.T-Mobile采用Informatica平台开展大数据工作,通过海量数据的集成,综合分析客户流失的原因,在一个季度内将流失率减半。
3.SK电讯新成立一家公司SK Planet,专门处理与大数据相关的业务,通过大数据分析用户的使用行为,在用户做出决定之前,推出符合用户兴趣的业务,减少用户流失。
4.法国电信开展针对用户消费的大数据分析评估,利用大数据改善服务水平,提升用户体验。某段网络的掉话率持续过高,借助大数据分析手段诊断出通话中断产生的原因是网络负荷过重造成的,根据分析结果优化网络布局,提升客户体验,从而获得更多的客户以及业务增长。
5. 国内某运营企业利用主成分分析(Principal Component Analysis,PCA)算法,将多个变量通过线性变换以选出较少个数重要变量,并尝试基于全量的用户通信记录数据建立大数据分析模型,自动识别边界漫游小区,做到数据与业务的完美结合,改善工作流程,让工作更加高效,从而保证新增加的边界漫游小区及时添加到计费系统中,解决由于边界漫游话单多收用户漫游费而引发的客户投诉,提升公司对用户的服务品质,减少用户投诉引起的话费返还等维系成本;对网络调整后不再是边界漫游小区的及时发现并删除,避免真实漫游话单当作本地话单进行批价而造成话费损失。
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
在数据可视化领域,树状图(Tree Diagram)是呈现层级结构数据的核心工具——无论是电商商品分类、企业组织架构,还是数据挖掘中 ...
2025-11-17核心结论:“分析前一天浏览与第二天下单的概率提升”属于数据挖掘中的关联规则挖掘(含序列模式挖掘) 技术——它聚焦“时间序 ...
2025-11-17在数据驱动成为企业核心竞争力的今天,很多企业陷入“数据多但用不好”的困境:营销部门要做用户转化分析却拿不到精准数据,运营 ...
2025-11-17在使用Excel透视表进行数据汇总分析时,我们常遇到“需通过两个字段相乘得到关键指标”的场景——比如“单价×数量=金额”“销量 ...
2025-11-14在测试环境搭建、数据验证等场景中,经常需要将UAT(用户验收测试)环境的表数据同步到SIT(系统集成测试)环境,且两者表结构完 ...
2025-11-14在数据驱动的企业中,常有这样的困境:分析师提交的“万字数据报告”被束之高阁,而一张简洁的“复购率趋势图+核心策略标注”却 ...
2025-11-14在实证研究中,层次回归分析是探究“不同变量组对因变量的增量解释力”的核心方法——通过分步骤引入自变量(如先引入人口统计学 ...
2025-11-13在实时数据分析、实时业务监控等场景中,“数据新鲜度”直接决定业务价值——当电商平台需要实时统计秒杀订单量、金融系统需要实 ...
2025-11-13在数据量爆炸式增长的今天,企业对数据分析的需求已从“有没有”升级为“好不好”——不少团队陷入“数据堆砌却无洞察”“分析结 ...
2025-11-13在主成分分析(PCA)、因子分析等降维方法中,“成分得分系数矩阵” 与 “载荷矩阵” 是两个高频出现但极易混淆的核心矩阵 —— ...
2025-11-12大数据早已不是单纯的技术概念,而是渗透各行业的核心生产力。但同样是拥抱大数据,零售企业的推荐系统、制造企业的设备维护、金 ...
2025-11-12在数据驱动的时代,“数据分析” 已成为企业决策的核心支撑,但很多人对其认知仍停留在 “用 Excel 做报表”“写 SQL 查数据” ...
2025-11-12金融统计不是单纯的 “数据计算”,而是贯穿金融业务全流程的 “风险量化工具”—— 从信贷审批中的客户风险评估,到投资组合的 ...
2025-11-11这个问题很有实战价值,mtcars 数据集是多元线性回归的经典案例,通过它能清晰展现 “多变量影响分析” 的核心逻辑。核心结论是 ...
2025-11-11在数据驱动成为企业核心竞争力的今天,“不知道要什么数据”“分析结果用不上” 是企业的普遍困境 —— 业务部门说 “要提升销量 ...
2025-11-11在大模型(如 Transformer、CNN、多层感知机)的结构设计中,“每层神经元个数” 是决定模型性能与效率的关键参数 —— 个数过少 ...
2025-11-10形成购买决策的四个核心推动力的是:内在需求驱动、产品价值感知、社会环境影响、场景便捷性—— 它们从 “为什么买”“值得买吗 ...
2025-11-10在数字经济时代,“数字化转型” 已从企业的 “可选动作” 变为 “生存必需”。然而,多数企业的转型仍停留在 “上线系统、收集 ...
2025-11-10在数据分析与建模中,“显性特征”(如用户年龄、订单金额、商品类别)是直接可获取的基础数据,但真正驱动业务突破的往往是 “ ...
2025-11-07在大模型(LLM)商业化落地过程中,“结果稳定性” 是比 “单次输出质量” 更关键的指标 —— 对客服对话而言,相同问题需给出一 ...
2025-11-07