
“天下大同”才是大数据的理想归宿_数据分析师
“大同”原本是中国古代的思想,指人类最终可以达到的理想世界,代表着人类对未来社会的美好憧憬。现代又加入了全球范围内的政治、经济、科技、文化融合的思想。而今正流行的“大数据”,其理想模式也是“天下大同”,最终才能更好的发挥大数据的效能,并最终实现大数据的共治共享。
然而现实世界中,要实现大数据的共治共享似乎有点“天方夜谭”,最典型的例子就是巨头们都在叫嚣着大数据,但往往又出于商业利益的考量,谁都希望守住自家的一亩三分地,不愿意将自家的数据积累共享,甚至连平台接口协议共享实现都不易。
我们都知道Fitbit之前就曾表态过,其产品不会支持苹果的Apple Store平台,数据也不能实现共享,自然和Apple Health就无法同步。结果可想而知,强势的一方苹果公司要求Fitbit公司的应用全部从Apple Store下架,而这仅仅只是APP应用平台和APP应用之间的故事。
在另一个流行的领域“车联网”中,数据的共享同样是难中之难,而且目前也因此而导致目前车联网发展举步维艰。作为汽车的主导者,汽车公司基于安全以及自身商业利益的考量,自然也不愿意将车联网的核心数据共享出去,顶多友情开放一些无关紧要的数据。而车联网产业链条的各方仅能得到有限的数据,弃之可惜,但是即便都收集起来也没多大的实际意义。最终可悲的是,汽车企业尽管也在美其名曰的主导和推行自家品牌的车联网,但车联网始终放在自家品牌之后,都是站在为汽车品牌服务的角度,重点在于售车,其主导的车联网也是自家品牌的联网,和其他品牌的汽车无关,甚至和车联网链条的其他企业亦无关。但车联网的最终实现又必须是人、车、路多方的数据共享和协同,车企自身的车联网充其量也就是一个“过家家”的游戏罢了。
除了APP应用平台和APP之间的故事,车联网产业链关于数据的故事,时下iOS和Android两大系统的大战和数据兼容也是一大难题。对于APP开发者来说,同样的应用必须开发适配iOS和Android两个系统的不同版本。不过更为头疼的是两大系统之间的数据同步和共享问题,因为两方企业基于商业利益的竞争,谁都不愿意妥协和让步,也都不愿意放开自己的用户和数据。
然而尽管企业有企业的商业利益考量,企业有企业的自建屏障进行保护,但数据的共享和协同终究是大趋势。
关于Fitbit数据和Apple Health同步问题有了更好的解决方式。Fitbit数据可以通过第三方数据和Apple Health实现同步,此举自然是可喜的一大步,总有一种力量在推动着大数据的共享。
而关于车联网间的数据共享问题,目前也有着介于“法律边界红线边缘”的处理方式,即有第三方公司通过破解can协议和网关的方式取得汽车数据,并最终“分享”给车联网的产业链。尽管手段有待商榷,但确确实实在助推汽车公司走向更加开放。
iOS和Android数据共享和数据整合则应该交给新的创业型公司,总会有惊喜。iOS和Android的数据共享也是一大刚需和大市场,有理由值得期待。
然而,事情的发展总会损伤到既得利益者的固有利益和脆弱心里,既得利益者必然会防抗。但不管怎么样,笔者不太希望现实世界里,平台太多,“数据”不够用的“杯具”继续。过多相互有意隔绝的平台,势必会造成未来大量的产生的数据,却又人为地产生大量不兼容、不互通、不可二次利用的问题。每个投身期间的大小企业,都惦记着用自己的产品和数据格式和协议,形成竞争壁垒,然后党同伐异都算奢望,每家企业都想着凭借数据制霸天下。
如此,最终大数据终将成为空中楼阁,很难造福人类。前文说到的车联网也就只能成为各家车企内部的局域网,离人、车、路的协同越来越遥远。
有需求的地方,自然就会有商机,自然也会产生新的创业公司和创业智慧。第三方的同步和兼容工具,就极有可能成为一个衍生应用市场。尽管各路衍生应用市场和原有平台诸侯也一定会在捍卫自己的“江山”的过程中打个你死我活。但最终,肯定会有非常少量的平台最终成为数据协同和整合共享标准,推动大数据的“大同”。
当车联网、跨系统平台不再是梦,而是现实的时候,大数据的“天下大同”就开始迈出了实质性的步伐。革命尚未成功,第三方应用,第三方数据协同平台们仍需努力。
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
Pandas 选取特定值所在行:6 类核心方法与实战指南 在使用 pandas 处理结构化数据时,“选取特定值所在的行” 是最高频的操作之 ...
2025-09-30球面卷积神经网络(SCNN) 为解决这一痛点,球面卷积神经网络(Spherical Convolutional Neural Network, SCNN) 应运而生。它通 ...
2025-09-30在企业日常运营中,“未来会怎样” 是决策者最关心的问题 —— 电商平台想知道 “下月销量能否达标”,金融机构想预判 “下周股 ...
2025-09-30Excel 能做聚类分析吗?基础方法、进阶技巧与场景边界 在数据分析领域,聚类分析是 “无监督学习” 的核心技术 —— 无需预设分 ...
2025-09-29XGBoost 决策树:原理、优化与工业级实战指南 在机器学习领域,决策树因 “可解释性强、处理非线性关系能力突出” 成为基础模型 ...
2025-09-29在标签体系的落地链路中,“设计标签逻辑” 只是第一步,真正让标签从 “纸上定义” 变为 “业务可用资产” 的关键,在于标签加 ...
2025-09-29在使用 Excel 数据透视表进行多维度数据汇总时,折叠功能是梳理数据层级的核心工具 —— 通过点击 “+/-” 符号可展开明细数据或 ...
2025-09-28在使用 Pandas 处理 CSV、TSV 等文本文件时,“引号” 是最容易引发格式混乱的 “隐形杀手”—— 比如字段中包含逗号(如 “北京 ...
2025-09-28在 CDA(Certified Data Analyst)数据分析师的技能工具箱中,数据查询语言(尤其是 SQL)是最基础、也最核心的 “武器”。无论 ...
2025-09-28Cox 模型时间依赖性检验:原理、方法与实战应用 在生存分析领域,Cox 比例风险模型(Cox Proportional Hazards Model)是分析 “ ...
2025-09-26检测因子类型的影响程度大小:评估标准、实战案例与管控策略 在检测分析领域(如环境监测、食品质量检测、工业产品合规性测试) ...
2025-09-26CDA 数据分析师:以数据库为基石,筑牢数据驱动的 “源头防线” 在数据驱动业务的链条中,“数据从哪里来” 是 CDA(Certified D ...
2025-09-26线性相关点分布的四种基本类型:特征、识别与实战应用 在数据分析与统计学中,“线性相关” 是描述两个数值变量间关联趋势的核心 ...
2025-09-25深度神经网络神经元个数确定指南:从原理到实战的科学路径 在深度神经网络(DNN)的设计中,“神经元个数” 是决定模型性能的关 ...
2025-09-25在企业数字化进程中,不少团队陷入 “指标困境”:仪表盘上堆砌着上百个指标,DAU、转化率、营收等数据实时跳动,却无法回答 “ ...
2025-09-25MySQL 服务器内存碎片:成因、检测与内存持续增长的解决策略 在 MySQL 运维中,“内存持续增长” 是常见且隐蔽的性能隐患 —— ...
2025-09-24人工智能重塑工程质量检测:核心应用、技术路径与实践案例 工程质量检测是保障建筑、市政、交通、水利等基础设施安全的 “最后一 ...
2025-09-24CDA 数据分析师:驾驭通用与场景指标,解锁数据驱动的精准路径 在数据驱动业务的实践中,指标是连接数据与决策的核心载体。但并 ...
2025-09-24在数据驱动的业务迭代中,AB 实验系统(负责验证业务优化效果)与业务系统(负责承载用户交互与核心流程)并非独立存在 —— 前 ...
2025-09-23CDA 业务数据分析:6 步闭环,让数据驱动业务落地 在企业数字化转型中,CDA(Certified Data Analyst)数据分析师的核心价值,并 ...
2025-09-23