京公网安备 11010802034615号
经营许可证编号:京B2-20210330
未知大于已知,发掘大数据时代的应用场景和趋势
(一)未知大于已知:从理论走向实践的大数据
大数据时代造成了严峻的个人信息保护形势,使每个人的饮食起居、勤懒好恶、甚至痴缠情债等个人隐私都可能随时会曝光在镁光灯下。但这个时代的来临不可逆转,谁也无法拒绝。这不仅是因为大数据里面蕴含着无限的商机,更因为大数据改变了、改变着并将更加深刻地改变人们的生活。这种改变不只是使生活更加便捷,关键是在商业、政务、学习、生产等各个方面重构着组织结构、运行模式和资源配置方式。
最早开展大数据实践的当然是企业。正是商业利益的驱动,使得越来越多的企业对大数据趋之若鹜。IBM公司2013年的调查数据显示,目前已经有28%的企业开始涉足大数据实践,还有40%的企业计划开始这种实践;在涉足大数据业务的企业中,有49%的企业希望通过大数据技术发现用户需求。目前,企业应用的场景主要包括运营决策支持、策略制定和客户服务,都还是基于用户需求发现而形成的应用场景。大数据的商业应用场景还在不断拓展,比如已经有投资人开始通过大数据寻找、筛选有潜力的投资项目。
很多机构和学者都试图概括大数据的特点,但应用场景的包罗万象,使得这些概括要么挂一漏万,要么隔靴搔痒。这不仅是因为大数据方兴未艾,更因为它是正在发生的这场信息技术产业革命中的一部分,与移动互联网、物联网、云计算、工业4.0等新事物相辅相成、密不可分,依托并转而推动通信、传感、芯片、精益制造等技术的发展。
从这个意义上看,对大数据特点的概括应当是和对整个信息技术产业革命的描述一并完成的,是一个基于整体视野的论断。大数据既是一个部分,也是一个角度。而且,这场革命正在发生着,因此既要概括过往、当下,也要涵盖未来。
中国移动的董事长奚国华先生经常引用一句话来形容这场技术产业革命——“未知大于已知”。这是一个很有点哲学意味的概括。它是模糊的,但恰恰因为模糊才是准确的。这个概括适应了大数据和这场技术产业革命在内涵上的丰富性和外延上的可拓展性,最准确、最客观地反映了它在未来无限广阔的应用场景。
从认识论的角度出发,人们所认知的世界与客观世界并不是等同的。人们的认知伴随着社会实践的发展总处在一个不断修正、深化和拓展的过程中。客观世界包括过去、现在和未来,包括“已知”和“未知”。这里面既存在已知的“已知”、已知的“未知”,也存在未知的“未知”。在很多现象和趋势露出苗头之前,人们甚至没办法意识到自己并不了解它,这就是未知的“未知”。
未知的“未知”的范围远大于已知的“已知”和已知的“未知”。明白了这一点,我们才能在客观世界——特别是未来——面前保持敬畏,才能不断地创新和探索。今天没有人能够预测包括大数据在内的这场技术产业革命的广度和深度,就像三十年前没有人能够预测互联网会如此深刻地改变人们的生活一样。
正因为已知的“未知”和未知的“未知”的存在,包括大数据在内的信息技术产业革命给人们带来了无限的遐想。
就我们已知的范围而言,包括大数据在内的信息技术应用场景已经非常广泛,包括舆情收集、金融服务、医疗诊断、通讯信息等等。比如当前困扰社会的食品安全问题,就可以通过动植物产品信息溯源系统加以缓解。实践中的做法是,在一头羊的身上植入一枚芯片,可以记载这只羊从出生到屠宰、配送、销售的全部信息,包括出生、血统、原产地、饲料、免疫、产崽、屠宰、加工、配送、销售等等。用户购买羊肉的时候只要扫描一下二维码就可以读取全部信息,完成对羊肉的溯源,实现羊肉加工的过程监控。
大数据有无限的应用前景,信息的不对称使掌握较多信息的行业有条件在大数据应用上先行一步。目前,大数据的商业实践还停留在精准营销和发现用户需求上。
(二)大数据:可以预测的市场规模,无法估量的商业价值
产业界普遍对未来大数据市场的发展表现出非常乐观的态度。有咨询机构预测:未来五年,全球大数据市场的规模会以年度60%的复合增长率增长。这里指的还是直接的市场规模,也就是全球个人和机构每年应用大数据设备、软件系统所产生的产值,即服务器、软件系统和数据分析服务的销售产值。
需要强调的是,这种直接市场规模远远不能概括大数据的商业价值。前面已经提到,大数据是信息技术产业革命的一部分,是各行各业的一种工具,是整个社会的基础设施,它会改变很多行业的面貌、效率和运行方式。本身的工具性和应用的无限性,使得没有人能准确估计它对整个经济和社会带来的影响。它的应用价值也就难以量化,就像高速公路、高铁和互联网。
现在可以比较清晰地看到,未来几年,政府公共服务、医疗、教育、零售、物流、制造甚至农业的面貌都会因大数据的应用而改变,但变化可能远远不止于此。
在大数据的应用实践中,TMT行业居于领先地位,对其他行业可能有一定示范或预言意义。从总体情况来看,互联网行业领先于电信行业,国外企业领先于国内企业。第一阵营是国外的互联网企业,如Google、亚马逊或Facebook;第二阵营是国内互联网运营商,如阿里巴巴和腾讯;第三阵营是国外运营商,最后是国内运营商。
在TMT行业中,目前主要的应用场景还是通过大数据实现内部管理和产品服务的持续跟踪、外部收益和客户需求的发现,进而为开展客户服务、实施精准营销提供便利。这种分析除了自身应用外,还可以开发成产品对外提供。比如通过大数据挖掘客户的作息规律,在客户休息时进行营销,精准营销成功的概率就会增大。
(三)数据洞察:互联网应用的发展趋势
从互联网应用的发展现状看,目前主要可以分成两类:一类是基于交互的应用,比如facebook、微信这样的社交软件;另一类是基于记录的应用,比较有代表意义的是汇集信息的电商平台。比如用户曾经在淘宝上购买或者搜索过某种商品,下次登录时网站就会基于记录给用户推送类似的产品。
从趋势上来看,这两类应用正在走向融合,进而产生数据洞察的应用。所谓“洞察”就是将我们可以认知的用户需求从“相似性”推及到“相关性”,增加智能化的联想和洞察,甚至可以在用户意识到自己的需求前发现、引导用户的需求,将用户的潜在需求现实化、模糊需求明确化。
比如一个用户曾经在电商网站上买过口罩,说明他的呼吸系统可能是比较敏感的。如果他在社交网络上签到来了北京,而北京的天气预报又显示有持续性的雾霾天气。那么当他在电商网站上开始购买跑步鞋的时候,商家就可以合理预想到客户可能需要空气净化器和跑步机,从而实现启发需求、精确营销。这就可以理解为一个基于洞察的应用。
根据我们的观察,无论是擅长社交的腾讯还是擅长电商的阿里,其实都从各自的原点出发,向融合的方向前进。这很大程度上体现了对数据洞察的重视。因为电商都意识到单纯的交互和记录对信息资源简直都是暴殄天物,不能提供更好的用户体验,由“记录”和“交互”融合为“洞察”是大势所趋。腾讯和京东的合作、阿里先后开发的“来往”和“钉钉”,其实都体现了这种努力。
我们习惯用冰山来形容用户的真实需求。对一座冰山而言,浮在水面上的部分只有1/10,还有9/10是肉眼看不到的。用户需求也是如此。如何通过有限的用户行为,分析出隐藏在水面下的用户需求呢?答案是海量的数据采集和分析。通过大数据,人们能够透过现象看到本质,观察到水面以下的冰山,帮助企业实现客户关系管理和需求发现。
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
长短期记忆网络(LSTM)作为循环神经网络(RNN)的重要改进模型,凭借其独特的门控机制(遗忘门、输入门、输出门),有效解决了 ...
2026-04-08在数据分析全流程中,数据质量是决定分析结论可靠性的核心前提,而异常值作为数据集中的“异类”,往往会干扰统计检验、模型训练 ...
2026-04-08在数字经济飞速发展的今天,数据已渗透到各行各业的核心场景,成为解读趋势、优化决策、创造价值的核心载体。而数据分析,作为挖 ...
2026-04-08在数据分析全流程中,数据处理是基础,图形可视化是核心呈现手段——前者负责将杂乱无章的原始数据转化为干净、规范、可分析的格 ...
2026-04-07在数据分析与统计推断中,p值是衡量假设检验结果显著性的核心指标,其本质是在原假设(通常为“无效应”“无差异”)成立的前提 ...
2026-04-07在数字经济深度渗透的今天,数据已成为企业生存发展的核心资产,企业的竞争本质已转变为数据利用能力的竞争。然而,大量来自生产 ...
2026-04-07Python凭借简洁的语法、丰富的生态库,成为算法开发、数据处理、机器学习等领域的首选语言。但受限于动态类型、解释性执行的特性 ...
2026-04-03在深度学习神经网络中,卷积操作是实现数据特征提取的核心引擎,更是让模型“看懂”数据、“解读”数据的关键所在。不同于传统机 ...
2026-04-03当数字化转型从企业的“战略口号”落地为“生存之战”,越来越多的企业意识到,转型的核心并非技术的堆砌,而是数据价值的深度挖 ...
2026-04-03在日常办公数据分析中,数据透视表凭借高效的汇总、分组功能,成为Excel、WPS等办公软件中最常用的数据分析工具之一。其中,“计 ...
2026-04-02在数字化交互的全场景中,用户的每一次操作都在生成动态的行为轨迹——电商用户的“浏览商品→点击详情→加入购物车”,内容APP ...
2026-04-02在数字化转型深度推进的今天,企业数据已成为驱动业务增长、构建核心竞争力的战略资产,而数据安全则是守护这份资产的“生命线” ...
2026-04-02在数据驱动决策的浪潮中,数据挖掘与数据分析是两个高频出现且极易被混淆的概念。有人将二者等同看待,认为“做数据分析就是做数 ...
2026-04-01在数据驱动决策的时代,企业与从业者每天都会面对海量数据——电商平台的用户行为数据、金融机构的信贷风险数据、快消品牌的营销 ...
2026-04-01在数字化转型的浪潮中,企业数据已从“辅助运营的附属资源”升级为“驱动增长的核心资产”,而一套科学、可落地的企业数据管理方 ...
2026-04-01在数字化时代,每一位用户与产品的交互都会留下可追溯的行为轨迹——电商用户的浏览、加购、下单,APP用户的注册、登录、功能使 ...
2026-03-31在日常数据统计、市场调研、学术分析等场景中,我们常常需要判断两个分类变量之间是否存在关联(如性别与消费偏好、产品类型与满 ...
2026-03-31在CDA(Certified Data Analyst)数据分析师的职场实战与认证考核中,“可解释性建模”是核心需求之一——企业决策中,不仅需要 ...
2026-03-31多层感知机(MLP,Multilayer Perceptron)作为深度学习中最基础、最经典的神经网络模型,其结构设计直接决定了模型的拟合能力、 ...
2026-03-30在TensorFlow深度学习实战中,数据集的加载与预处理是基础且关键的第一步。手动下载、解压、解析数据集不仅耗时费力,还容易出现 ...
2026-03-30