京公网安备 11010802034615号
经营许可证编号:京B2-20210330
大数据的价值如何体现_数据分析师考试
进入大数据时代,运营商应用大数据发展的驱动因素是什么,是否需要建立新型数据库? 刘伟光: 随着通信行业的竞争日益激烈,传统的语音和短信等主营收入的利润不断下滑,导致运营商必须找到新的利润增长点,同时有效控制运营成本,从而使自身可以在激烈竞争中立于不败之地。这也是为什么运营商把实现精准化营销和精细化运营提升到战略层次的重要原因。
此外,传统数据库技术已无法满足运营商对大数据充分利用的需求。新型数据库应该具备如下特点:首先应该采用支持大规模并行处理的分布式架构;其次,应该使用基于符合工业标准的开放硬件和系统平台,保证成本可控;第三,随着开源技术不断成熟,创新速度快,新型数据库平台应该易于与新的开源技术进行融合;第四,新的数据库平台应该可以实现与Hadoop平台的无缝集成,实现跨结构化、半结构化、非结构化海量数据的混合分析能力。 卢东明: 运营商目前试图做新型数据库,但是不太现实,首先数据库公司一直以来都是很稳定的几家,需要长期积淀。
其次,大数据不是取代以前的技术,而是混合补充使用,不是新型数据库出来后,就完全替代传统数据库从而大规模使用。数据库是核心、稳定的技术,大数据是开源的软件技术,运营商还是会选择使用相对成熟的软件。 《通信世界周刊》: 大数据今年以来得到格外关注,目前发展状况如何? 卢东明: 大数据在运营商的业务中早就有应用,目前在各个省都得到普遍应用了。大数据这个词目前有些炒作成分,它和以前的数据库不是完全脱节的,是对数据库的延伸。大数据是个现象,是数据库的另一个形态,不是否定、颠覆之前的数据库形态。
目前做大数据的厂商依然是以前那几家数据厂商,不同的产品解决不同的问题。在中国电信行业,从数据量和应用角度来看处于世界领先地位,这是由于电信用户多、规模大,电信业遇到的问题和挑战比较大,解决方案难度高。 刘伟光: 目前中国三个电信运营商在业务支撑领域、网管IT支撑领域包括增值业务领域,已经随着市场的需求推出了很多新的大数据实时分析的项目,相信未来的两到三年这个市场将会成倍增长,甚至会到达我们今天不能预期的数量。 需要分析共享大数据的管理工具 《通信世界周刊》: IT企业如何依托大数据为运营商提供管理工具,提升运营效率? 刘伟光: 实现各部门的紧密协作永远都是提升运营效率的不二法门。而IT企业应该为运营商提供实现紧密协作、分析、共享大数据的管理工具,来达成提升运营效率的目标。
此外,大数据时代,IT企业仅仅为运营商提供分析平台、分析工具是不够的。这是因为运营商虽然很了解业务和需求,但普遍缺乏数学建模能力,因此很难利用好这些平台,使其发挥最大效益。所以,如何利用这些平台、系统和数据实现科学建模,同样是提升运营效率的关键所在。 武新: 运营商要解决数据处理效率问题,现在的数据用以前的系统处理需要一天一夜,而应用大数据技术处理可以一个小时完成。在大数据平台,应用云技术,通过集群的方式,几十台服务器同时工作,并进行压缩数据来节省空间。
目前大数据主要是针对结构化数据的应用,用户上哪个网,停留多长时间,通过分析都可做相应的分析结果推送给相关部门。除了对用户上网行为分析,还有网络使用情况、网络设备情况和用户使用手机类型分析。而对非结构化的数据,如视频和图片,目前分析得还较少。 《通信世界周刊》: 大数据具体应用于运营商的哪些业务中,有哪些成功的应用和案例? 卢东明: 大数据主要应用在运营商的“信令”系统分析上,由于其数据量非常大,比“话单”分析的挑战大很多。移动互联网发展起来之后,运营商开始关注大数据,进行“用户行为分析”,根据人群分析做精准营销,推荐流量套餐。
此外,运营商提供IDC服务,通过“云”中心的方式为互联网企业提供服务。 武新: 运营商从最近两三年开始,感受到这方面的压力,开始寻求解决方案。中国移动“信令”分析系统项目对海量数据进行分析和挖掘;中国联通对“话单”数据进行用户行为分析。中国电信“新一代数据库”产品正在测试中,通过精分系统,进行精准营销。此外,在运营商专网也已应用大数据。运营商目前仍处于测试探索中,通过几种方法针对不同的应用进行测试、筛选。
目前运营商的相关项目有“流量分析”、“智能管道”和“新一代数据库”产品等,传统的数据库面对海量数据已经无法支撑,将来会慢慢被大数据代替掉。 要有开放的心态 《通信世界周刊》: 发展大数据需要解决哪些问题,关键点是什么? 卢东明: 由于数据分析要看存储效果,涉及到效率和速度。目前运营商应用大数据存在的问题是避免无限制的花钱。另一方面,运营商要和厂商合作,针对不同的业务类型和应用场景,采取不同的分析方法。此外,运营商要有开放的心态,因为大数据作为开源的软件也不是可以解决所有的问题的。 武新: 在数据处理上,运营商转型中不仅有技术上的问题,还需要经历一个时间阶段和过程。
此外,运营商要转变思维方式,其在数据分析上的经验不如互联网企业,这是方法论问题,关系到如何用数据做生意。运营商以前都是依托传统业务,海量数据的出现,使得行业即将洗牌,运营商不得不转型重视数据挖掘。 但运营商可以发挥自己的优势,首先,要分析用户行为的变化,由分析以前的语音用户转变为分析上网行为。其次,运营商有能力提供类似互联网公司的服务,如QQ聊天。
最后,运营商有专网资源,有自己的数据中心可以运维,但是目前这些优势还没有完全发挥出来,是因为还没把握透用户的需求。
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
在数字化运营中,“凭感觉做决策” 早已成为过去式 —— 运营指标作为业务增长的 “晴雨表” 与 “导航仪”,直接决定了运营动作 ...
2025-10-24在卷积神经网络(CNN)的训练中,“卷积层(Conv)后是否添加归一化(如 BN、LN)和激活函数(如 ReLU、GELU)” 是每个开发者都 ...
2025-10-24在数据决策链条中,“统计分析” 是挖掘数据规律的核心,“可视化” 是呈现规律的桥梁 ——CDA(Certified Data Analyst)数据分 ...
2025-10-24在 “神经网络与卡尔曼滤波融合” 的理论基础上,Python 凭借其丰富的科学计算库(NumPy、FilterPy)、深度学习框架(PyTorch、T ...
2025-10-23在工业控制、自动驾驶、机器人导航、气象预测等领域,“状态估计” 是核心任务 —— 即从含噪声的观测数据中,精准推断系统的真 ...
2025-10-23在数据分析全流程中,“数据清洗” 恰似烹饪前的食材处理:若食材(数据)腐烂变质、混杂异物(脏数据),即便拥有精湛的烹饪技 ...
2025-10-23在人工智能领域,“大模型” 已成为近年来的热点标签:从参数超 1750 亿的 GPT-3,到万亿级参数的 PaLM,再到多模态大模型 GPT-4 ...
2025-10-22在 MySQL 数据库的日常运维与开发中,“更新数据是否会影响读数据” 是一个高频疑问。这个问题的答案并非简单的 “是” 或 “否 ...
2025-10-22在企业数据分析中,“数据孤岛” 是制约分析深度的核心瓶颈 —— 用户数据散落在注册系统、APP 日志、客服记录中,订单数据分散 ...
2025-10-22在神经网络设计中,“隐藏层个数” 是决定模型能力的关键参数 —— 太少会导致 “欠拟合”(模型无法捕捉复杂数据规律,如用单隐 ...
2025-10-21在特征工程流程中,“单变量筛选” 是承上启下的关键步骤 —— 它通过分析单个特征与目标变量的关联强度,剔除无意义、冗余的特 ...
2025-10-21在数据分析全流程中,“数据读取” 常被误解为 “简单的文件打开”—— 双击 Excel、执行基础 SQL 查询即可完成。但对 CDA(Cert ...
2025-10-21在实际业务数据分析中,我们遇到的大多数数据并非理想的正态分布 —— 电商平台的用户消费金额(少数用户单次消费上万元,多数集 ...
2025-10-20在数字化交互中,用户的每一次操作 —— 从电商平台的 “浏览商品→加入购物车→查看评价→放弃下单”,到内容 APP 的 “点击短 ...
2025-10-20在数据分析的全流程中,“数据采集” 是最基础也最关键的环节 —— 如同烹饪前需备好新鲜食材,若采集的数据不完整、不准确或不 ...
2025-10-20在数据成为新时代“石油”的今天,几乎每个职场人都在焦虑: “为什么别人能用数据驱动决策、升职加薪,而我面对Excel表格却无从 ...
2025-10-18数据清洗是 “数据价值挖掘的前置关卡”—— 其核心目标是 “去除噪声、修正错误、规范格式”,但前提是不破坏数据的真实业务含 ...
2025-10-17在数据汇总分析中,透视表凭借灵活的字段重组能力成为核心工具,但原始透视表仅能呈现数值结果,缺乏对数据背景、异常原因或业务 ...
2025-10-17在企业管理中,“凭经验定策略” 的传统模式正逐渐失效 —— 金融机构靠 “研究员主观判断” 选股可能错失收益,电商靠 “运营拍 ...
2025-10-17在数据库日常操作中,INSERT INTO SELECT是实现 “批量数据迁移” 的核心 SQL 语句 —— 它能直接将一个表(或查询结果集)的数 ...
2025-10-16