京公网安备 11010802034615号
经营许可证编号:京B2-20210330
大数据:全新机遇还是一纸空谈
目前,人们对大数据及其价值的认知各有不同。一部分人认为大数据的价值在于帮助企业各部门获得新的洞察力并付诸行动;另一部分人认为大数据不过是天花乱坠的宣传而已。这两种观点都有可取之处,而有趣的是,这两种观点都成立。尽管外界对大数据大肆宣传,人们还是很快了解到大数据真正价值与空谈之间的区别。
弄清这种区别将非常有助于了解大数据价值(最好考虑投资大数据)并认清仍对大多数企业发展构成主要阻碍的挑战。姑且假设未来相关技术将逐渐成熟,并能通过释放其潜力创造价值。这种预测已在以往多种技术上都得到证实,大数据技术应该也不例外。制约大数据技术发展的主要瓶颈在于它自身的问题:人们会忽略大数据的严重依赖性,或认为这种依赖性仅仅是我们为创造价值而必须接受的前提。
这种依赖性是指用户认为在创造价值前,必须保持数据一致性,或在数据库等持久保存数据的系统内实现数据标准化,这需要企业大张旗鼓,投入数十亿美元,却导致效率低下和重复劳动。因此,在没有创造任何价值前,企业的项目投入已达到70%,用于数据识别、采集、迁移、存储及优化。虽然过去十年间分析技术已取得多次重大突破,而分析技术终端及平台数量激增,但与过去30年相比,企业分析解决方案开发及部署模式仍未发生变化。
令人关注的是,在利用大数据技术真正创造价值的行业内,大数据市场正呈现出不断细分的趋势,且这一趋势已逐渐明朗。我们最好从这些细分市场入手,深入了解大数据价值与空谈之间的区别。
能够体现大数据价值的领域
大数据技术在数据探索、趋势分析、调整机会分析等领域已获得成功应用。这看上去毋庸置疑,而以下两个共同点却不明显,但大数据技术在符合这些共同点的领域内已具有切实的可行性,并已站稳脚跟。
·全新的海量交互信息:基于Web的购物与数字化零售、移动端活动、社交媒体互动信息及互联网搜索条件。换言之就是全新的海量同类数据。
·重视营销机会:为产品销售提升潜在客户识别成功率,这种技术应用通常由大众化营销与媒体费用承担。
无法体现大数据价值的领域
随着数据同类性降低,导致获得洞察力的成本相应增长,大数据的价值开始降低,而对于大数据综合价值因素的炒作也导入歧途。在谈到典型的企业问题时,大数据鲜有成功案例。原因何在?
·业务问题已是老生常谈。这已经无需再议,可能在过去5-10年内使用“新型”数据是大数据技术顺利部署的成功因素之一。
·解决方案使用不同类型的组件。企业数据面临的挑战是它广泛分布在各种不同的技术和数据平台上。例如,数字化零售、电信业及社交媒体使用结构化数据,其表现形式相似;而企业数据则分布在主机、ETL(提取、转换和加载)工具、虚拟层、关系数据库、商业智能(BI)数据库、交易数据库以及数百种其它组件中,这些技术在过去30年中已不断发展。更糟糕的是,每种应用程序使用不同的数据模型,导致数据与其相关技术平台整合越来越复杂,因此,利用当前大数据工具访问企业数据,难以创造直接的价值。
这就是企业大部分业务问题与大数据无关的原因。这些业务问题实际上是分布式数据问题:在这种模型下,信息、数据、价值和分析广泛分布在不同的位置、技术平台和数据源内。但我们仍继续使用与以往相同的集中式模型来解决这一日趋严重的分布式问题。当用户能够通过常见的界面外观稳定地访问数据时,这些集中式模型能够发挥很大的作用,这在社交媒体、数字化零售等行业新的成功案例中屡见不鲜。但集中式模型却无法解决银行、保险、医疗行业及其它广泛的业务问题。
目前,企业实现大数据价值需对多种不同数据及功能体系进行数据整合及标准化规划。如不改变现有数据管理机制,那么企业解决方案采用越多的分布式组件,项目回报率越低。
大数据技术促进深度分析及分析性能取得技术突破,其价值毋庸置疑。但这种价值却被数据提取和/或整合成本破坏,导致价值/炒作的底线被轻易冲破。目前,市场在数据价值上多少存在一些分歧,其中一部分行业尚处于初创时期,可保持技术一致性,因此,这些行业可以暂时解决分布式数据的问题。
由于技术孤岛仍将持续存在,且数据仍保存在不同的位置,Gartner公司分析师Doug Laney预计到2017年,90%的大数据项目仍无法发挥它们的作用。Doug最近总结到,虽然数据复杂性、企业内外部数据的分布和离散度不断提升,但也不会因为大数据技术作出的各种承诺而承认系统及数据大规模整合项目的合理性,它们只是大数据价值的体现。
我们只有意识到大数据技术虽已占有一席之地,但仍受到分布式数据源的直接影响,才能尽早通过真正具有成本效益的途径,根据数据复杂度和分布情况,充分利用数据价值。
大多数企业可灵活使用双重数据策略:运用大数据技术对大量同类数据进行深入分析及机会辨别;或运用分布式数据应对运营、风险、管理等复杂但已为人所了解的挑战。人们将能够接受这种双重数据管理策略,充分发现、挖掘并管理大数据技术的价值,并在行业内实现不断灵活创新。
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
近日,由 CDA 数据科学研究院重磅发布的《2026 全球数智化人才指数报告》,被中国教育科学研究院官方账号正式收录, ...
2026-04-22在数字化时代,客户每一次点击、浏览、下单、咨询等行为,都在传递其潜在需求与决策倾向——这些按时间顺序串联的行为轨迹,构成 ...
2026-04-22数据是数据分析、建模与业务决策的核心基石,而“数据清洗”作为数据预处理的核心环节,是打通数据从“原始杂乱”到“干净可用” ...
2026-04-22 很多数据分析师每天盯着GMV、转化率、DAU等数字看,但当被问到“什么是指标”“指标和维度有什么区别”“如何搭建一套完整的 ...
2026-04-22在数据分析与业务决策中,数据并非静止不变的数值,而是始终处于动态波动之中——股市收盘价的每日涨跌、企业月度销售额的起伏、 ...
2026-04-21在数据分析领域,当研究涉及多个自变量与多个因变量之间的复杂关联时,多变量一般线性分析(Multivariate General Linear Analys ...
2026-04-21很多数据分析师精通描述性统计,能熟练计算均值、中位数、标准差,但当被问到“用500个样本如何推断10万用户的真实满意度”“这 ...
2026-04-21在数据处理与分析的全流程中,日期数据是贯穿业务场景的核心维度之一——无论是业务报表统计、用户行为追踪,还是风控规则落地、 ...
2026-04-20在机器学习建模全流程中,特征工程是连接原始数据与模型效果的关键环节,而特征重要性分析则是特征工程的“灵魂”——它不仅能帮 ...
2026-04-20很多数据分析师沉迷于复杂的机器学习算法,却忽略了数据分析最基础也最核心的能力——描述性统计。事实上,80%的商业分析问题, ...
2026-04-20在数字化时代,数据已成为企业决策的核心驱动力,数据分析与数据挖掘作为解锁数据价值的关键手段,广泛应用于互联网、金融、医疗 ...
2026-04-17在数据处理、后端开发、报表生成与自动化脚本中,将 SQL 查询结果转换为字符串是一项高频且实用的操作。无论是拼接多行数据为逗 ...
2026-04-17面对一份上万行的销售明细表,要快速回答“哪个地区卖得最好”“哪款产品增长最快”“不同客户类型的购买力如何”——这些看似复 ...
2026-04-17数据分析师一天的工作,80% 的时间围绕表格结构数据展开。从一张销售明细表到一份完整的分析报告,表格结构数据贯穿始终。但你真 ...
2026-04-16在机器学习无监督学习领域,Kmeans聚类因其原理简洁、计算高效、可扩展性强的优势,成为数据聚类任务中的主流算法,广泛应用于用 ...
2026-04-16在机器学习建模实践中,特征工程是决定模型性能的核心环节之一。面对高维数据集,冗余特征、无关特征不仅会增加模型训练成本、延 ...
2026-04-16在数字化时代,用户是产品的核心资产,用户运营的本质的是通过科学的指标监测、分析与优化,实现“拉新、促活、留存、转化、复购 ...
2026-04-15在企业数字化转型、系统架构设计、数据治理与AI落地过程中,数据模型、本体模型、业务模型是三大核心基础模型,三者相互支撑、各 ...
2026-04-15数据分析师的一天,80%的时间花在表格数据上,但80%的坑也踩在表格数据上。 如果你分不清数值型和文本型的区别,不知道数据从哪 ...
2026-04-15在人工智能与机器学习落地过程中,模型质量直接决定了应用效果的优劣——无论是分类、回归、生成式模型,还是推荐、预测类模型, ...
2026-04-14