京公网安备 11010802034615号
经营许可证编号:京B2-20210330
大数据:大变革,大竞争,大挑战_数据分析师
“大数据现在已经成为天大的事”。11月12日,美国政府公布新版大数据研究计划,白宫科技政策办公室主任霍尔德伦致辞说,他去年曾预测大数据将是件“大事”,现在来看保守了。
时间倒回到6月,斯诺登的41张幻灯片,让美国大数据监控项目“棱镜”浮出水面,令人不寒而栗。
2013年被一些专家称为“大数据元年”。对大数据时代的乐观和忧虑,在这一年充分展示。
“除了上帝,每个人都必须用数据说话。”不仅是人,整个世界都越来越数据化。信息革命深入发展,如潮的数据澎湃而至,数量之巨,种类之杂,来势之快,前所未有。
IDC(国际数据公司)估计,全球2012年产生数据总量约2.8泽字节。有人计算,这相当于3000多亿部时长2小时的高清电影,连着看7000多万年也看不完。
而这还只是序曲。更大的浪潮在后头。
IDC预测,未来几年,全球数据量每隔两年翻一番,2020年达到40泽字节。
大数据不单单是“数据的工业革命”,而是一场更深刻的科技和产业大变革的组成部分,是对未来大趋势、时代新特征的一种描述。大数据是推动这场大变革的重要动力,将成为促进经济社会转型新的关键资源。搜集、分析和运用指数级增长的庞大数据,将催生创新,为各行各业提供新的发展机遇,给人们日常生活带来改变。
星巴克有意推出的“大数据咖啡杯”就是个小小的例子。美国媒体报道,这家咖啡连锁巨头打算试验在一些咖啡杯中装上传感器,收集常客喝咖啡速度等数据,从而为喝咖啡较慢顾客提供保温效果好的杯子,提高其满意度和忠诚度。
业内人士认为,大数据的本质还不在于“大”,而是以崭新的思维和技术去分析海量数据,揭示其中隐藏的人类行为等模式,由此创造新产品和服务,或是预测未来趋势。
畅销书《大数据时代》的作者、英国牛津大学数据科学家舍恩伯格认为,大数据是一种新的价值观和方法论,人们面对的不再是随机样本而是全体数据,不是精确性而是混杂性,不是因果关系而是相关关系。
“现有的认知和体系是建立在稀缺数据上的成果,人们思维和工作方式必须发生变革以适应大数据时代的到来。”舍恩伯格在其书中写道。
大数据被视为创新和生产力提升的下一个前沿,正成为国家竞争力的要素之一,在世界范围内日益受到重视。多国政府加大了对大数据发展的扶持力度,甚至上升到国家战略的高度。2013年,围绕大数据的国际竞争继续加码。
咨询公司益百利集团的研究显示,全球对大数据项目投资总额去年已达45亿欧元(约60亿美元),预计今明两年均会保持约40%的增长速度。
在美国,大数据已由热点词汇变成重点项目。去年3月,美国政府已公布2亿美元的《大数据研究发展计划》,今年11月再度公布涉及各级政府、私企、科研机构的多个大数据研究项目。美国国家卫生研究院、国家科学基金会等都参与其中,有评论称之为美国大数据战略2.0版。
在英国,虽然经济不景气、财政紧缩,但政府依然为大数据一掷千金。2013年初,英国商业、创新和技能部宣布将注资8亿英镑发展8类高新技术,其中1.89亿英镑(约3亿美元)用于大数据项目。
大数据在中国也已启动驶入“快车道”,政府、企业和科研院所正多方位布局。工信部的物联网“十二五”发展规划,将信息处理技术作为四项关键创新技术工程之一,其中包括海量数据存储、数据挖掘等。随着4G牌照在2013年末的发放,更高速的网络将带来更大的数据流,为政府和企业带来战略性资源。
“棱镜”今年曝光,让人看到大数据时代维护国家信息安全、保护个人隐私所面临的严峻挑战。
“棱镜门”让各国政府意识到“数据主权”的重要性,以及在网络和电信核心技术上依赖个别国家的恶果。必须加快自主创新以保护“数据主权”,已成为一些国家的共识。
英国《自然》杂志3月刊登的研究发现,只要有4个时间点和位置的数据就能确定一个人身份,准确率高达95%。这表明,大数据足以将一个人“描画”清晰,现有法律手段和核心技术对个人隐私的保护正在逐渐失效。
如何在大数据来袭中保持清醒和理性、有所创新和创造,对国家和个人来说同样是考验。
专家指出,大数据可望为中国经济转型升级发挥重要贡献,巨大的人口基数、经济体量和需求,意味着中国发展大数据拥有得天独厚的优势。但也应该看到,大数据具有价值密度低的特性,挖掘、分析等技术要求高。中国不能仅满足于做“世界数据中心”,应防止概念炒作,加强自主创新,进行前瞻性的制度设计等布局,顺势而为,将“中国创造”由机遇化为现实。
还应该警惕“迷信”大数据等倾向,认识到大数据分析可能存在的缺陷和不足。心理学家认为,大数据创造的模型会将人束缚在算法提供的选项中,过度依赖大数据分析也可能束缚创新。美国互联网活动家帕里泽称之为“互联网滤泡”:互联网个性化虽然带来方便,却将人们局限在自己过往行为模式的“气泡”中,无法触及海量信息带来的无尽可能。
大数据专家喜欢用莎士比亚“凡是过去,皆为序曲”来形容大数据分析的必然,但大数据提供的也只是参考答案而非最终答案。无论在小数据时代还是大数据时代,探索和创新精神都不应放弃,正如林肯所言,“预测未来最好的方法就是去创造未来”。
CDA学员免费下载查看报告全文:2026全球数智化人才指数报告【CDA数据科学研究院】.pdf
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
在大数据技术飞速迭代、数字营销竞争日趋激烈的今天,“精准触达、高效转化、成本可控”已成为企业营销的核心诉求。传统广告投放 ...
2026-04-24在游戏行业竞争白热化的当下,用户流失已成为制约游戏生命周期、影响营收增长的核心痛点。据行业报告显示,2024年移动游戏平均次 ...
2026-04-24 很多业务负责人开会常说“我们要数据驱动”,最后却变成“看哪张报表数据多就用哪个”,往往因为缺乏一套结构性的方法去搭建 ...
2026-04-24在Power BI数据可视化分析中,切片器是连接用户与数据的核心交互工具,其核心价值在于帮助使用者快速筛选目标数据、聚焦分析重点 ...
2026-04-23以数为据,以析促优——数据分析结果指导临床技术改进的实践路径 临床技术是医疗服务的核心载体,其水平直接决定患者诊疗效果、 ...
2026-04-23很多数据分析师每天盯着GMV、DAU、转化率,但当被问到“哪些指标是所有企业都需要的”“哪些指标是因行业而异的”“北极星指标和 ...
2026-04-23近日,由 CDA 数据科学研究院重磅发布的《2026 全球数智化人才指数报告》,被中国教育科学研究院官方账号正式收录, ...
2026-04-22在数字化时代,客户每一次点击、浏览、下单、咨询等行为,都在传递其潜在需求与决策倾向——这些按时间顺序串联的行为轨迹,构成 ...
2026-04-22数据是数据分析、建模与业务决策的核心基石,而“数据清洗”作为数据预处理的核心环节,是打通数据从“原始杂乱”到“干净可用” ...
2026-04-22 很多数据分析师每天盯着GMV、转化率、DAU等数字看,但当被问到“什么是指标”“指标和维度有什么区别”“如何搭建一套完整的 ...
2026-04-22在数据分析与业务决策中,数据并非静止不变的数值,而是始终处于动态波动之中——股市收盘价的每日涨跌、企业月度销售额的起伏、 ...
2026-04-21在数据分析领域,当研究涉及多个自变量与多个因变量之间的复杂关联时,多变量一般线性分析(Multivariate General Linear Analys ...
2026-04-21很多数据分析师精通描述性统计,能熟练计算均值、中位数、标准差,但当被问到“用500个样本如何推断10万用户的真实满意度”“这 ...
2026-04-21在数据处理与分析的全流程中,日期数据是贯穿业务场景的核心维度之一——无论是业务报表统计、用户行为追踪,还是风控规则落地、 ...
2026-04-20在机器学习建模全流程中,特征工程是连接原始数据与模型效果的关键环节,而特征重要性分析则是特征工程的“灵魂”——它不仅能帮 ...
2026-04-20很多数据分析师沉迷于复杂的机器学习算法,却忽略了数据分析最基础也最核心的能力——描述性统计。事实上,80%的商业分析问题, ...
2026-04-20在数字化时代,数据已成为企业决策的核心驱动力,数据分析与数据挖掘作为解锁数据价值的关键手段,广泛应用于互联网、金融、医疗 ...
2026-04-17在数据处理、后端开发、报表生成与自动化脚本中,将 SQL 查询结果转换为字符串是一项高频且实用的操作。无论是拼接多行数据为逗 ...
2026-04-17面对一份上万行的销售明细表,要快速回答“哪个地区卖得最好”“哪款产品增长最快”“不同客户类型的购买力如何”——这些看似复 ...
2026-04-17数据分析师一天的工作,80% 的时间围绕表格结构数据展开。从一张销售明细表到一份完整的分析报告,表格结构数据贯穿始终。但你真 ...
2026-04-16