京公网安备 11010802034615号
经营许可证编号:京B2-20210330
大数据应用如何开启新局面
随着大数据应用的经济社会效应不断显现,大数据已经在市场营销、金融、交通、制造、医疗等各个领域开展试水应用,取得了一定的成果。不过,业界认为我国大数据应用仍处于初级阶段,还未形成普遍应用的局面,对大多数企业,特别是传统领域的企业而言,还未找到有效的应用模式。如何进一步普及大数据应用,通过应用带动整个产业链发展,成为当前迫切需要解决的问题之一。
大数据应用未形成燎原之势
大数据应用呈散发状,目前主要集中于互联网市场营销场景。
“目前,我国大数据应用仍处于初级阶段,《促进大数据发展行动纲要》的出台为我国大数据应用拓展起到了有力的推动作用。”工信部信息化和软件服务业司司长陈伟近日向《中国电子报》记者这样表示。他认为,大数据在电子商务领域的应用逐渐增多,成为大数据最成熟的应用模式。
京东通过建立PB级大数据平台,将每个用户在其网站上的行为数据进行记录和分析,提高与用户间的沟通效率、提升用户体验。实现了向不同用户展示不同的内容的效果,带来了10%的订单提升。比如提供给推荐搜索调用,针对不同用户属性特征、性格特点或行为习惯在他搜索或点击时展示符合该用户特点和偏好的商品,给用户以友好舒适的购买体验,能大幅提高用户的购买转化率甚至重复购买,提高用户忠诚度和用户黏性。基于用户点击数据、浏览页面信息等信息的数据模型和数据资源在经过淘宝商城的挖掘和分析之后,向用户和商家开放了查询APP。通过数据挖掘和分析为淘宝提供了定向广告投递的能力。开放查询APP则为用户和商家提供了便捷的选择服务。淘宝网还建立了“淘宝CPI”,通过采集、编制淘宝上390个类目的热门商品价格来统计CPI。
不过,研究机构中国信息通信研究院研究成果表明,大数据应用呈散发状,并没有形成燎原之势。目前主要集中于互联网的市场营销场景。尽管金融、电信、零售、制造、医疗、交通、物流、IT等行业对大数据应用表现出极大热情,但目前在媒体和各种论坛上所公开的大数据应用案例仍然非常零散,这表明大家虽然都很关注大数据,但推进实际的应用仍然存在一定的困难。唯一众多企业都推出或者采纳大数据应用的领域是基于互联网的市场营销。
另外,从技术角度看,大数据仍以初级应用为主,多数应用仍然使用传统分析流程和工具,只是扩大了数据的来源、增加了数量。中国信息通信研究院调研发现,与传统数据分析相比,新的大数据应用虽然开始使用非结构化数据,但在实际应用过程中,这些非结构化数据只是被压缩、清洗和结构化后,放入传统的ETL 和分析流程中去。另一些大数据应用通过采用云存储和云处理技术,提高了数据处理效率,从而增加了数据处理的规模,但这些应用也仍然采用原有的ETL和分析流程。缺乏应用模式上的创新,使得目前大数据应用仍停留在初级技术阶段。
陈伟也认为,目前我国数据资源建设和应用水平较低。“目前,用户普遍不重视数据资源的建设,即使有数据意识的机构也大多只重视数据的简单存储,很少针对后续应用需求进行加工整理。数据资源普遍存在质量差,标准规范缺乏,管理能力弱,数据价值难以被有效挖掘利用。”陈伟说。
与新一代信息技术集成应用势在必行
物联网、3D打印等新一代信息技术与大数据相互作用,促进应用落地。
业界认为,新一代信息技术与经济社会各领域的深度融合,引发了数据量的爆发式增长,使得数据资源成为国家重要的战略资源和核心创新要素。利用大数据分析,能够总结经验、发现规律、预测趋势、辅助决策,充分释放和利用海量数据资源中蕴含的巨大价值,推动新一代信息技术与各行业的深度耦合、交叉创新。
事实上,国家战略层面也已经意识到这个趋势。国务院正式印发的《促进大数据发展行动纲要》指出,推动大数据与新一代信息技术融合发展。抓住互联网跨界融合机遇,促进大数据、物联网、云计算和3D打印技术、个性化定制等在制造业全产业链集成运用,推动制造模式变革和工业转型升级。
记者从工信部获悉,工信部将组织实施“工业和新兴产业大数据工程”,促进大数据、云计算、工业互联网、3D打印、个性化定制等的融合集成,推动制造模式变革和工业转型升级。
对于大数据与新一代信息技术集成应用,三迪时空网络科技股份有限公司董事长李培学在接受《中国电子报》记者采访时表示,以大数据为中心的3D打印分布式智能制造将是趋势。在未来的云智造平台上,任何人即使不具备建模的知识,但只要有创意,就可以和设计师沟通,设计出自己想要的三维模型,然后通过3D打印机来实现,同时,云智造平台必须能够确保设计师赢利,设计师的创造力、创意思维才能源源不断地发挥出来。有了完善的设计师平台,在人群聚集的互联网上,创新就可以得到实现,有了以3D打印机为工具的分布式制造单元,可以为周边的普通用户提供个性化定制的产品,而这一切都基于大数据。
例如,以大数据平台为基础的3D打印定制鞋是3D打印技术在垂直行业领域中的具体应用。通过对人足部特征扫描、采样,将三维数据和人员信息汇聚到数据中心,构建大数据平台,再结合3D打印定制化生产的特点和传统制造批量生产的优势,将虚拟的三维数据对象转化为实体成品。“用户可以利用大数据平台的查询检索功能,找到真正适合自己的鞋类,实现个性化定制;鞋类厂商则可以根据大数据分析,精确地定位消费群体的需求,包括特殊人群的脚型数据,将精确估算出产品的订单需求,更加精确地批量生产。定制化数据可以跟踪人们足部生长的阶段来进行调整,用户可以根据数据分析来选择不同的品牌不同的类型。”李培学表示。
PTC全球副总裁兼中国区总裁寿宇澄在接受《中国电子报》记者采访时也表示,大数据在物联网中起到至关重要的作用,相互依赖。
“在制造业一些核心技术领域,例如飞机发动机的研发,我国的研发水平要追上国际先进水平还需要一定的时间积累,但是我们若把信息化扩大到产品全生命周期尤其是重视产品出厂后的流程优化,把产品出厂前的虚拟世界和出厂后的实体世界并行发展,那么我国的制造业整体实力也能得到有效提升,而物联网恰恰能实现这一点。物联网的初衷之一就是把信息化延伸到产品全生命周期,不仅包括研发环节,还包括产品出厂后的流程。当然,物联网应用的形态也发生了变化。
以前是过程驱动模式,是以企业家的经验为主,但当企业发展到一定阶段,面临的市场环境更为复杂,企业产生的数据量更大,面对这些庞大的数据,公司管理者很难再像以前那样以事先定好的流程和经验进行处理和决策,必须要依靠机器的智能帮助人们进行大数据分析,这就需要数据驱动模式。从流程的驱动变为数据的驱动,产品出厂前以研发为主的数据只是一类数据,但当这类产品出厂后每个产品流向市场后的数据则成几何规模扩大,这就形成了大数据。这时,企业就需要对这些大量的数据进行分析,从而对公司决策进行支持。
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
在分类变量关联分析中(如 “吸烟与肺癌的关系”“性别与疾病发病率的关联”),卡方检验 P 值与 OR 值(比值比,Odds Ratio)是 ...
2025-11-05CDA 数据分析师的核心价值,不在于复杂的模型公式,而在于将数据转化为可落地的商业行动。脱离业务场景的分析只是 “纸上谈兵” ...
2025-11-05教材入口:https://edu.cda.cn/goods/show/3151 “纲举目张,执本末从。” 若想在数据分析领域有所收获,一套合适的学习教材至 ...
2025-11-05教材入口:https://edu.cda.cn/goods/show/3151 “纲举目张,执本末从。” 若想在数据分析领域有所收获,一套合适的学习教材至 ...
2025-11-04【2025最新版】CDA考试教材:CDA教材一级:商业数据分析(2025)__商业数据分析_cda教材_考试教材 (cdaglobal.com) ...
2025-11-04在数字化时代,数据挖掘不再是实验室里的技术探索,而是驱动商业决策的核心能力 —— 它能从海量数据中挖掘出 “降低成本、提升 ...
2025-11-04在 DDPM(Denoising Diffusion Probabilistic Models)训练过程中,开发者最常困惑的问题莫过于:“我的模型 loss 降到多少才算 ...
2025-11-04在 CDA(Certified Data Analyst)数据分析师的工作中,“无监督样本分组” 是高频需求 —— 例如 “将用户按行为特征分为高价值 ...
2025-11-04当沃尔玛数据分析师首次发现 “啤酒与尿布” 的高频共现规律时,他们揭开了数据挖掘最迷人的面纱 —— 那些隐藏在消费行为背后 ...
2025-11-03这个问题精准切中了配对样本统计检验的核心差异点,理解二者区别是避免统计方法误用的关键。核心结论是:stats.ttest_rel(配对 ...
2025-11-03在 CDA(Certified Data Analyst)数据分析师的工作中,“高维数据的潜在规律挖掘” 是进阶需求 —— 例如用户行为包含 “浏览次 ...
2025-11-03在 MySQL 数据查询中,“按顺序计数” 是高频需求 —— 例如 “统计近 7 天每日订单量”“按用户 ID 顺序展示消费记录”“按产品 ...
2025-10-31在数据分析中,“累计百分比” 是衡量 “部分与整体关系” 的核心指标 —— 它通过 “逐步累加的占比”,直观呈现数据的分布特征 ...
2025-10-31在 CDA(Certified Data Analyst)数据分析师的工作中,“二分类预测” 是高频需求 —— 例如 “预测用户是否会流失”“判断客户 ...
2025-10-31在 MySQL 实际应用中,“频繁写入同一表” 是常见场景 —— 如实时日志存储(用户操作日志、系统运行日志)、高频交易记录(支付 ...
2025-10-30为帮助教育工作者、研究者科学分析 “班级规模” 与 “平均成绩” 的关联关系,我将从相关系数的核心定义与类型切入,详解 “数 ...
2025-10-30对 CDA(Certified Data Analyst)数据分析师而言,“相关系数” 不是简单的数字计算,而是 “从业务问题出发,量化变量间关联强 ...
2025-10-30在构建前向神经网络(Feedforward Neural Network,简称 FNN)时,“隐藏层数目设多少?每个隐藏层该放多少个神经元?” 是每个 ...
2025-10-29这个问题切中了 Excel 用户的常见困惑 —— 将 “数据可视化工具” 与 “数据挖掘算法” 的功能边界混淆。核心结论是:Excel 透 ...
2025-10-29在 CDA(Certified Data Analyst)数据分析师的工作中,“多组数据差异验证” 是高频需求 —— 例如 “3 家门店的销售额是否有显 ...
2025-10-29