京公网安备 11010802034615号
经营许可证编号:京B2-20210330
大数据如何创造商业价值_数据分析师
互联网行业的发展是否为大数据时代到来提供了更多有利条件?这些数据有什么新的特点?
石现升(中国互联网协会副秘书长):从目前整个互联网行业发展来看,前一段时间我们做了一个预测,关于到2020年国际互联网环境和整个发展规模的预测。到2020全球网民预计达到52亿人,每秒钟增长7.9人,未来七年互联网网民增长主要来自于亚洲和非洲地区,人口预计到2020年到80亿,所以网民普及率达到65%。从目前增长的趋势来看是比较平缓,很难再有互联网初期爆炸式增长的时代。全球网站数量预计2020年将到17亿,目前网站数量是6.4亿,预计到2020年,平均3个网民将拥有一个网站,这些将是大数据时代数据的主要来源。
大数据时代到来的特点是群体和个体交互方式发生了改变,我们可以看出,从社交网站、电子商务平均、视频、游戏、旅游、人力资源、彩票等各方面对整个大数据的利用平均非常的明显。第二个特点是移动设备的数据交换分享增长迅猛,从固定互联网到移动互联网,到物联网的时代可以看出,在终端层是90年代开始固定互联网时代,到2007年以后的移动互联网,到物联网时代都经历了迅猛的增长。
信息成为新的商务核心,从量上来看,未来十年内将增加44倍的数据和内容,其中80%的数据为非结构化的数据,传统是以结构化数据为主。同时信息处于新一轮数据发展的核心,交互数据是移动通讯记录、社交网络、社交媒体等。传感数据包括环境监控、位置数据、视频监控,从交易数据包括企业ERP、POS系统、网上支付系统等。大数据时代的数据特征分析,包括海量化、多样化、快速化和价值化。
科技日报:把大数据应用到商业层面,能不能举些具体的例子?有哪些特点?
石现升:以腾讯对大数据的合理使用情况来说,以视频行业为例,主要了解消费者的使用习惯、网络广告、视频广告的形式,哪种投放形式是用户最容易接受,包括多媒体内容产生的模式。通过大数据的形式可以建立智能化的平台,实行个性化的营销行为,对消费者进行具体的精准的分析。通过大数据的价值提升腾讯视频的用户体验。目前的效果是月度覆盖用户2.755亿,年增长率高达250%—300%。
我们从大数据业务特征来看,数据爆炸增长,结构类型复杂,用户行为丰富,Web社群关系复杂。需求分析方面利用大数据分析提升用户体验,增加用户黏性。具体应用方面是社交网络广告精准投放。
大数据的价值如何提升企业信息管理能力,包括可以优化归档成本,以前是海量的信息,经过大数据时代用户行为模式的分析,可以做到最有价值的信息进行归档保存,精简合并任务、信息即服务、丰富数据内容、信息追踪机制、公司治理过程,还有面向大数据的企业管理方面,可以提升公司的治理效果。
同时大数据的价值可以改进企业商业决策,传统做法是结构化、可分析,逻辑性。新的路径是提高了创造性和整体思维能力,以及提高用户的知觉。
传统做法是数据仓库来自于事物数据、内部应用数据、主机数据和ERP数据,到大数据时代做到非结构化数据和迭代新的数据来源。
科技日报:面对采集上来的大量信息,该如何合理安全的使用?有没有这方面的规划?
石现升:关于合理使用,目前随着互联网的普及度提高,用户越来越关注个人信息安全和使用网络的安全,包括交易行为的安全等。社会行业应该形成严谨的处理,利用个人信息的氛围形成行业规范,使得公众敢于放心提供个人真实信息,形成公众对大数据的社会信任感。企业、社会组织的力量从规范制度到规范贯彻实行,从宣传层面到从技术层面共同努力。
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
当沃尔玛数据分析师首次发现 “啤酒与尿布” 的高频共现规律时,他们揭开了数据挖掘最迷人的面纱 —— 那些隐藏在消费行为背后 ...
2025-11-03这个问题精准切中了配对样本统计检验的核心差异点,理解二者区别是避免统计方法误用的关键。核心结论是:stats.ttest_rel(配对 ...
2025-11-03在 CDA(Certified Data Analyst)数据分析师的工作中,“高维数据的潜在规律挖掘” 是进阶需求 —— 例如用户行为包含 “浏览次 ...
2025-11-03在 MySQL 数据查询中,“按顺序计数” 是高频需求 —— 例如 “统计近 7 天每日订单量”“按用户 ID 顺序展示消费记录”“按产品 ...
2025-10-31在数据分析中,“累计百分比” 是衡量 “部分与整体关系” 的核心指标 —— 它通过 “逐步累加的占比”,直观呈现数据的分布特征 ...
2025-10-31在 CDA(Certified Data Analyst)数据分析师的工作中,“二分类预测” 是高频需求 —— 例如 “预测用户是否会流失”“判断客户 ...
2025-10-31在 MySQL 实际应用中,“频繁写入同一表” 是常见场景 —— 如实时日志存储(用户操作日志、系统运行日志)、高频交易记录(支付 ...
2025-10-30为帮助教育工作者、研究者科学分析 “班级规模” 与 “平均成绩” 的关联关系,我将从相关系数的核心定义与类型切入,详解 “数 ...
2025-10-30对 CDA(Certified Data Analyst)数据分析师而言,“相关系数” 不是简单的数字计算,而是 “从业务问题出发,量化变量间关联强 ...
2025-10-30在构建前向神经网络(Feedforward Neural Network,简称 FNN)时,“隐藏层数目设多少?每个隐藏层该放多少个神经元?” 是每个 ...
2025-10-29这个问题切中了 Excel 用户的常见困惑 —— 将 “数据可视化工具” 与 “数据挖掘算法” 的功能边界混淆。核心结论是:Excel 透 ...
2025-10-29在 CDA(Certified Data Analyst)数据分析师的工作中,“多组数据差异验证” 是高频需求 —— 例如 “3 家门店的销售额是否有显 ...
2025-10-29在数据分析中,“正态分布” 是许多统计方法(如 t 检验、方差分析、线性回归)的核心假设 —— 数据符合正态分布时,统计检验的 ...
2025-10-28箱线图(Box Plot)作为展示数据分布的核心统计图表,能直观呈现数据的中位数、四分位数、离散程度与异常值,是质量控制、实验分 ...
2025-10-28在 CDA(Certified Data Analyst)数据分析师的工作中,“分类变量关联分析” 是高频需求 —— 例如 “用户性别是否影响支付方式 ...
2025-10-28在数据可视化领域,单一图表往往难以承载多维度信息 —— 力导向图擅长展现节点间的关联结构与空间分布,却无法直观呈现 “流量 ...
2025-10-27这个问题问到了 Tableau 中两个核心行级函数的经典组合,理解它能帮你快速实现 “相对位置占比” 的分析需求。“index ()/size ( ...
2025-10-27对 CDA(Certified Data Analyst)数据分析师而言,“假设检验” 绝非 “套用统计公式的机械操作”,而是 “将模糊的业务猜想转 ...
2025-10-27在数字化运营中,“凭感觉做决策” 早已成为过去式 —— 运营指标作为业务增长的 “晴雨表” 与 “导航仪”,直接决定了运营动作 ...
2025-10-24在卷积神经网络(CNN)的训练中,“卷积层(Conv)后是否添加归一化(如 BN、LN)和激活函数(如 ReLU、GELU)” 是每个开发者都 ...
2025-10-24