京公网安备 11010802034615号
经营许可证编号:京B2-20210330
数据之和的价值远大于数据的价值之和
在宽带化、移动互联网、物联网、社交网络、云计算的催生下,一个大数据的时代,不经意间顺理成章地翩然而至。不久前,沣西大数据产业园悄然落户陕西省西咸新区,发展大数据产业正在“试水”。
全球数据总量在以每两年翻一番的速度增长
从事广告文化创意行业的何先生,清晰地记得,从12年前购买的仅有20GB硬盘容量的家用计算机,到为满足使用需求而不断扩容的80GB、120GB、250GB、500GB的主机存储空间,变化很快。“如今2TB的硬盘都不够用,还得靠移动存储设备来备份。”
根据IDC(国际数据公司)的监测统计,2011年全球数据总量已经达到1.8ZB(1ZB等于1万亿GB,1.8ZB也就相当于18亿个1TB的移动硬盘),而这个数值还在以每两年翻一番的速度增长,预计到2020年全球将总共拥有35ZB的数据量,增长近20倍。
由于数据规模的急剧膨胀,各行业累积的数据量越来越巨大,数据类型也越来越多、越来越复杂,已经超越了传统数据管理系统、处理模式的能力范围,于是“大数据”这样一个在含义上趋近于“无穷大”的概念才会应运而生。
“首先在于体量大,是一个数据全集的概念”,国家工信部软件服务业司司长陈伟为大数据概括出四方面特征,“第二是类型多,包括结构化数据、半结构化数据、非结构化数据等多种类型,其中视频数据在目前占到了90%以上的总额;第三要求速度快,需要以秒级为目标进行实时动态处理。”
“最后在于价值密度”,陈伟认为,由于大量有用和可能没用的数据并存,“遍地是金子,又遍地是沙子”,所以大数据的目的就在于从庞大的数据集合中找寻有价值的数据和知识,通过分析挖掘为各行业提供真正的智慧,“可以说21世纪是‘数据钻出石油’的时代。”
“以交互数据为例,目前一些自媒体平台,比如新浪微博,每天都有超过2500万条的微博信息在发布,里面有很多有价值的信息尚未得到发掘”,中国电子信息产业发展研究院副总工程师李峻认为,在这样庞大的非结构化数据背后,如何利用大数据技术,从海量堆积的交互数据当中发现带有趋势性、前瞻性的讯息,就能够发现并产生巨大的社会价值和商业价值。
一个小苹果背后的大数据:数据之和的价值远大于数据的价值之和
“由于数据的存储、分析、应用等方面的商业运营方式还没有定型,这个行业发展的潜力、创新空间都十分巨大”,陕西省西咸新区管委会副主任、沣西新城管委会主任刘宇斌打了一个“小苹果背后的大数据”的简单比方:
以陕西省苹果产业发展为例,诸如某品种苹果种在哪里最适宜生长所需要的空间地理信息数据,与具体产区的苹果产量、含糖量等数据叠加,并通过物联网等手段赋予苹果可追溯的唯一“身份”,在种植过程中实时监控,由每一个苹果“反馈”收集而成的数据,假如足够海量,就整合而成了大数据。
拥有了这些数据,首先可以通过数据租售服务的方式与潜在客户产生价值,“此类商业模式体现了数据之和的价值远远大于数据的价值之和。”
其次,如能运用组群分析、数据挖掘等科学方法,辅以云计算、分布式存储等手段,则可以对数据展开深层次分析和预测服务,“哪些苹果品质最好,市场反应更好,明年产量销量会怎样,各地市场对苹果购买的喜好会有何变化”,这种数据深挖及其背后的消费者行为预测分析,曾是统计学家的特权,未来则可能花费几分钟时间就可以完成。
数据经过积累,并与全国其他地方进行比对,则可为陕西苹果产业发展提供决策支持服务,并成为政府、行业指导果农生产的决策依据,避免产品滞销和果农利益受损。
最后,随着数据和分析方法共识性的建立,数据服务商有可能搭建一个第三方大数据分析平台,为更多的数据持有者提供数据整理、过滤、分析和处理服务,甚至有朝一日发展出类似于ebay、淘宝等电子商务交易平台一样的第三方数据共享交易平台。
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
在大数据技术飞速迭代、数字营销竞争日趋激烈的今天,“精准触达、高效转化、成本可控”已成为企业营销的核心诉求。传统广告投放 ...
2026-04-24在游戏行业竞争白热化的当下,用户流失已成为制约游戏生命周期、影响营收增长的核心痛点。据行业报告显示,2024年移动游戏平均次 ...
2026-04-24 很多业务负责人开会常说“我们要数据驱动”,最后却变成“看哪张报表数据多就用哪个”,往往因为缺乏一套结构性的方法去搭建 ...
2026-04-24在Power BI数据可视化分析中,切片器是连接用户与数据的核心交互工具,其核心价值在于帮助使用者快速筛选目标数据、聚焦分析重点 ...
2026-04-23以数为据,以析促优——数据分析结果指导临床技术改进的实践路径 临床技术是医疗服务的核心载体,其水平直接决定患者诊疗效果、 ...
2026-04-23很多数据分析师每天盯着GMV、DAU、转化率,但当被问到“哪些指标是所有企业都需要的”“哪些指标是因行业而异的”“北极星指标和 ...
2026-04-23近日,由 CDA 数据科学研究院重磅发布的《2026 全球数智化人才指数报告》,被中国教育科学研究院官方账号正式收录, ...
2026-04-22在数字化时代,客户每一次点击、浏览、下单、咨询等行为,都在传递其潜在需求与决策倾向——这些按时间顺序串联的行为轨迹,构成 ...
2026-04-22数据是数据分析、建模与业务决策的核心基石,而“数据清洗”作为数据预处理的核心环节,是打通数据从“原始杂乱”到“干净可用” ...
2026-04-22 很多数据分析师每天盯着GMV、转化率、DAU等数字看,但当被问到“什么是指标”“指标和维度有什么区别”“如何搭建一套完整的 ...
2026-04-22在数据分析与业务决策中,数据并非静止不变的数值,而是始终处于动态波动之中——股市收盘价的每日涨跌、企业月度销售额的起伏、 ...
2026-04-21在数据分析领域,当研究涉及多个自变量与多个因变量之间的复杂关联时,多变量一般线性分析(Multivariate General Linear Analys ...
2026-04-21很多数据分析师精通描述性统计,能熟练计算均值、中位数、标准差,但当被问到“用500个样本如何推断10万用户的真实满意度”“这 ...
2026-04-21在数据处理与分析的全流程中,日期数据是贯穿业务场景的核心维度之一——无论是业务报表统计、用户行为追踪,还是风控规则落地、 ...
2026-04-20在机器学习建模全流程中,特征工程是连接原始数据与模型效果的关键环节,而特征重要性分析则是特征工程的“灵魂”——它不仅能帮 ...
2026-04-20很多数据分析师沉迷于复杂的机器学习算法,却忽略了数据分析最基础也最核心的能力——描述性统计。事实上,80%的商业分析问题, ...
2026-04-20在数字化时代,数据已成为企业决策的核心驱动力,数据分析与数据挖掘作为解锁数据价值的关键手段,广泛应用于互联网、金融、医疗 ...
2026-04-17在数据处理、后端开发、报表生成与自动化脚本中,将 SQL 查询结果转换为字符串是一项高频且实用的操作。无论是拼接多行数据为逗 ...
2026-04-17面对一份上万行的销售明细表,要快速回答“哪个地区卖得最好”“哪款产品增长最快”“不同客户类型的购买力如何”——这些看似复 ...
2026-04-17数据分析师一天的工作,80% 的时间围绕表格结构数据展开。从一张销售明细表到一份完整的分析报告,表格结构数据贯穿始终。但你真 ...
2026-04-16