京公网安备 11010802034615号
经营许可证编号:京B2-20210330
无法拒绝的诱惑:大数据的应用场景和趋势_数据分析师考试
大数据是啥?大数据有多值钱?大数据咋用?
1.大数据是信息技术革命的一个部分和一个角度,存在“已知的已知”和“已知的未知”,也存在“未知的未知”,未知大于已知。
2.大数据正在成为行为方式和基础设施,直接市场规模或许可以预测,但商业价值无法估量。
3.数据洞察成为互联网应用的发展趋势,个人信息运用和保护面临挑战。
一、未知大于已知:从理论走向实践的大数据
大数据时代造成了严峻的个人信息保护形势,使每个人的饮食起居、勤懒好恶、甚至痴缠情债等个人隐私都可能随时会曝光在镁光灯下。但这个时代的来临不可逆转,谁也无法拒绝。这不仅是因为大数据里面蕴含着无限的商机,更因为大数据改变了、改变着并将更加深刻地改变人们的生活。这种改变不只是使生活更加便捷,关键是在商业、政务、学习、生产等各个方面重构着组织结构、运行模式和资源配置方式。
最早开展大数据实践的当然是企业。正是商业利益的驱动,使得越来越多的企业对大数据趋之若鹜。IBM公司2013年的调查数据显示,目前已经有 28%的企业开始涉足大数据实践,还有40%的企业计划开始这种实践;在涉足大数据业务的企业中,有49%的企业希望通过大数据技术发现用户需求。目前,企业应用的场景主要包括运营决策支持、策略制定和客户服务,都还是基于用户需求发现而形成的应用场景。大数据的商业应用场景还在不断拓展,比如已经有投资人开始通过大数据寻找、筛选有潜力的投资项目。
很多机构和学者都试图概括大数据的特点,但应用场景的包罗万象,使得这些概括要么挂一漏万,要么隔靴搔痒。这不仅是因为大数据方兴未艾,更因为它是正在发生的这场信息技术产业革命中的一部分,与移动互联网、物联网、云计算、工业4.0等新事物相辅相成、密不可分,依托并转而推动通信、传感、芯片、精益制造等技术的发展。
从这个意义上看,对大数据特点的概括应当是和对整个信息技术产业革命的描述一并完成的,是一个基于整体视野的论断。大数据既是一个部分,也是一个角度。而且,这场革命正在发生着,因此既要概括过往、当下,也要涵盖未来。
中国移动的董事长奚国华先生经常引用一句话来形容这场技术产业革命——“未知大于已知”。这是一个很有点哲学意味的概括。它是模糊的,但恰恰因为模糊才是准确的。这个概括适应了大数据和这场技术产业革命在内涵上的丰富性和外延上的可拓展性,最准确、最客观地反映了它在未来无限广阔的应用场景。
从认识论的角度出发,人们所认知的世界与客观世界并不是等同的。人们的认知伴随着社会实践的发展总处在一个不断修正、深化和拓展的过程中。客观世界包括过去、现在和未来,包括“已知”和“未知”。这里面既存在已知的“已知”、已知的“未知”,也存在未知的“未知”。在很多现象和趋势露出苗头之前,人们甚至没办法意识到自己并不了解它,这就是未知的“未知”。
未知的“未知”的范围远大于已知的“已知”和已知的“未知”。明白了这一点,我们才能在客观世界——特别是未来——面前保持敬畏,才能不断地创新和探索。今天没有人能够预测包括大数据在内的这场技术产业革命的广度和深度,就像三十年前没有人能够预测互联网会如此深刻地改变人们的生活一样。
正因为已知的“未知”和未知的“未知”的存在,包括大数据在内的信息技术产业革命给人们带来了无限的遐想。
就我们已知的范围而言,包括大数据在内的信息技术应用场景已经非常广泛,包括舆情收集、金融服务、医疗诊断、通讯信息等等。比如当前困扰社会的食品安全问题,就可以通过动植物产品信息溯源系统加以缓解。实践中的做法是,在一头羊的身上植入一枚芯片,可以记载这只羊从出生到屠宰、配送、销售的全部信息,包括出生、血统、原产地、饲料、免疫、产崽、屠宰、加工、配送、销售等等。用户购买羊肉的时候只要扫描一下二维码就可以读取全部信息,完成对羊肉的溯源,实现羊肉加工的过程监控。
大数据有无限的应用前景,信息的不对称使掌握较多信息的行业有条件在大数据应用上先行一步。目前,大数据的商业实践还停留在精准营销和发现用户需求上。
二、大数据:可以预测的市场规模,无法估量的商业价值
产业界普遍对未来大数据市场的发展表现出非常乐观的态度。有咨询机构预测:未来五年,全球大数据市场的规模会以年度60%的复合增长率增长。这里指的还是直接的市场规模,也就是全球个人和机构每年应用大数据设备、软件系统所产生的产值,即服务器、软件系统和数据分析服务的销售产值。
需要强调的是,这种直接市场规模远远不能概括大数据的商业价值。前面已经提到,大数据是信息技术产业革命的一部分,是各行各业的一种工具,是整个社会的基础设施,它会改变很多行业的面貌、效率和运行方式。本身的工具性和应用的无限性,使得没有人能准确估计它对整个经济和社会带来的影响。它的应用价值也就难以量化,就像高速公路、高铁和互联网。
现在可以比较清晰地看到,未来几年,政府公共服务、医疗、教育、零售、物流、制造甚至农业的面貌都会因大数据的应用而改变,但变化可能远远不止于此。
在大数据的应用实践中,TMT行业居于领先地位,对其他行业可能有一定示范或预言意义。从总体情况来看,互联网行业领先于电信行业,国外企业领先于国内企业。第一阵营是国外的互联网企业,如Google、亚马逊或Facebook;第二阵营是国内互联网运营商,如阿里巴巴和腾讯;第三阵营是国外运营商,最后是国内运营商。
在TMT行业中,目前主要的应用场景还是通过大数据实现内部管理和产品服务的持续跟踪、外部收益和客户需求的发现,进而为开展客户服务、实施精准营销提供便利。这种分析除了自身应用外,还可以开发成产品对外提供。比如通过大数据挖掘客户的作息规律,在客户休息时进行营销,精准营销成功的概率就会增大。
三、数据洞察:互联网应用的发展趋势
从互联网应用的发展现状看,目前主要可以分成两类:一类是基于交互的应用,比如facebook、微信这样的社交软件;另一类是基于记录的应用,比较有代表意义的是汇集信息的电商平台。比如用户曾经在淘宝上购买或者搜索过某种商品,下次登录时网站就会基于记录给用户推送类似的产品。
从趋势上来看,这两类应用正在走向融合,进而产生数据洞察的应用。所谓“洞察”就是将我们可以认知的用户需求从“相似性”推及到“相关性”,增加智能化的联想和洞察,甚至可以在用户意识到自己的需求前发现、引导用户的需求,将用户的潜在需求现实化、模糊需求明确化。
比如一个用户曾经在电商网站上买过口罩,说明他的呼吸系统可能是比较敏感的。如果他在社交网络上签到来了北京,而北京的天气预报又显示有持续性的雾霾天气。那么当他在电商网站上开始购买跑步鞋的时候,商家就可以合理预想到客户可能需要空气净化器和跑步机,从而实现启发需求、精确营销。这就可以理解为一个基于洞察的应用。
根据我们的观察,无论是擅长社交的腾讯还是擅长电商的阿里,其实都从各自的原点出发,向融合的方向前进。这很大程度上体现了对数据洞察的重视。因为电商都意识到单纯的交互和记录对信息资源简直都是暴殄天物,不能提供更好的用户体验,由“记录”和“交互”融合为“洞察”是大势所趋。腾讯和京东的合作、阿里先后开发的“来往”和“钉钉”,其实都体现了这种努力。
我们习惯用冰山来形容用户的真实需求。对一座冰山而言,浮在水面上的部分只有1/10,还有9/10是肉眼看不到的。用户需求也是如此。如何通过有限的用户行为,分析出隐藏在水面下的用户需求呢?答案是海量的数据采集和分析。通过大数据,人们能够透过现象看到本质,观察到水面以下的冰山,帮助企业实现客户关系管理和需求发现。
CDA学员免费下载查看报告全文:2026全球数智化人才指数报告【CDA数据科学研究院】.pdf
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
在大数据技术飞速迭代、数字营销竞争日趋激烈的今天,“精准触达、高效转化、成本可控”已成为企业营销的核心诉求。传统广告投放 ...
2026-04-24在游戏行业竞争白热化的当下,用户流失已成为制约游戏生命周期、影响营收增长的核心痛点。据行业报告显示,2024年移动游戏平均次 ...
2026-04-24 很多业务负责人开会常说“我们要数据驱动”,最后却变成“看哪张报表数据多就用哪个”,往往因为缺乏一套结构性的方法去搭建 ...
2026-04-24在Power BI数据可视化分析中,切片器是连接用户与数据的核心交互工具,其核心价值在于帮助使用者快速筛选目标数据、聚焦分析重点 ...
2026-04-23以数为据,以析促优——数据分析结果指导临床技术改进的实践路径 临床技术是医疗服务的核心载体,其水平直接决定患者诊疗效果、 ...
2026-04-23很多数据分析师每天盯着GMV、DAU、转化率,但当被问到“哪些指标是所有企业都需要的”“哪些指标是因行业而异的”“北极星指标和 ...
2026-04-23近日,由 CDA 数据科学研究院重磅发布的《2026 全球数智化人才指数报告》,被中国教育科学研究院官方账号正式收录, ...
2026-04-22在数字化时代,客户每一次点击、浏览、下单、咨询等行为,都在传递其潜在需求与决策倾向——这些按时间顺序串联的行为轨迹,构成 ...
2026-04-22数据是数据分析、建模与业务决策的核心基石,而“数据清洗”作为数据预处理的核心环节,是打通数据从“原始杂乱”到“干净可用” ...
2026-04-22 很多数据分析师每天盯着GMV、转化率、DAU等数字看,但当被问到“什么是指标”“指标和维度有什么区别”“如何搭建一套完整的 ...
2026-04-22在数据分析与业务决策中,数据并非静止不变的数值,而是始终处于动态波动之中——股市收盘价的每日涨跌、企业月度销售额的起伏、 ...
2026-04-21在数据分析领域,当研究涉及多个自变量与多个因变量之间的复杂关联时,多变量一般线性分析(Multivariate General Linear Analys ...
2026-04-21很多数据分析师精通描述性统计,能熟练计算均值、中位数、标准差,但当被问到“用500个样本如何推断10万用户的真实满意度”“这 ...
2026-04-21在数据处理与分析的全流程中,日期数据是贯穿业务场景的核心维度之一——无论是业务报表统计、用户行为追踪,还是风控规则落地、 ...
2026-04-20在机器学习建模全流程中,特征工程是连接原始数据与模型效果的关键环节,而特征重要性分析则是特征工程的“灵魂”——它不仅能帮 ...
2026-04-20很多数据分析师沉迷于复杂的机器学习算法,却忽略了数据分析最基础也最核心的能力——描述性统计。事实上,80%的商业分析问题, ...
2026-04-20在数字化时代,数据已成为企业决策的核心驱动力,数据分析与数据挖掘作为解锁数据价值的关键手段,广泛应用于互联网、金融、医疗 ...
2026-04-17在数据处理、后端开发、报表生成与自动化脚本中,将 SQL 查询结果转换为字符串是一项高频且实用的操作。无论是拼接多行数据为逗 ...
2026-04-17面对一份上万行的销售明细表,要快速回答“哪个地区卖得最好”“哪款产品增长最快”“不同客户类型的购买力如何”——这些看似复 ...
2026-04-17数据分析师一天的工作,80% 的时间围绕表格结构数据展开。从一张销售明细表到一份完整的分析报告,表格结构数据贯穿始终。但你真 ...
2026-04-16