京公网安备 11010802034615号
经营许可证编号:京B2-20210330
大数据:大变革,大竞争,大挑战_数据分析师
“大数据现在已经成为天大的事”。11月12日,美国政府公布新版大数据研究计划,白宫科技政策办公室主任霍尔德伦致辞说,他去年曾预测大数据将是件“大事”,现在来看保守了。
时间倒回到6月,斯诺登的41张幻灯片,让美国大数据监控项目“棱镜”浮出水面,令人不寒而栗。
2013年被一些专家称为“大数据元年”。对大数据时代的乐观和忧虑,在这一年充分展示。
“除了上帝,每个人都必须用数据说话。”不仅是人,整个世界都越来越数据化。信息革命深入发展,如潮的数据澎湃而至,数量之巨,种类之杂,来势之快,前所未有。
IDC(国际数据公司)估计,全球2012年产生数据总量约2.8泽字节。有人计算,这相当于3000多亿部时长2小时的高清电影,连着看7000多万年也看不完。
而这还只是序曲。更大的浪潮在后头。
IDC预测,未来几年,全球数据量每隔两年翻一番,2020年达到40泽字节。
大数据不单单是“数据的工业革命”,而是一场更深刻的科技和产业大变革的组成部分,是对未来大趋势、时代新特征的一种描述。大数据是推动这场大变革的重要动力,将成为促进经济社会转型新的关键资源。搜集、分析和运用指数级增长的庞大数据,将催生创新,为各行各业提供新的发展机遇,给人们日常生活带来改变。
星巴克有意推出的“大数据咖啡杯”就是个小小的例子。美国媒体报道,这家咖啡连锁巨头打算试验在一些咖啡杯中装上传感器,收集常客喝咖啡速度等数据,从而为喝咖啡较慢顾客提供保温效果好的杯子,提高其满意度和忠诚度。
业内人士认为,大数据的本质还不在于“大”,而是以崭新的思维和技术去分析海量数据,揭示其中隐藏的人类行为等模式,由此创造新产品和服务,或是预测未来趋势。
畅销书《大数据时代》的作者、英国牛津大学数据科学家舍恩伯格认为,大数据是一种新的价值观和方法论,人们面对的不再是随机样本而是全体数据,不是精确性而是混杂性,不是因果关系而是相关关系。
“现有的认知和体系是建立在稀缺数据上的成果,人们思维和工作方式必须发生变革以适应大数据时代的到来。”舍恩伯格在其书中写道。
大数据被视为创新和生产力提升的下一个前沿,正成为国家竞争力的要素之一,在世界范围内日益受到重视。多国政府加大了对大数据发展的扶持力度,甚至上升到国家战略的高度。2013年,围绕大数据的国际竞争继续加码。
咨询公司益百利集团的研究显示,全球对大数据项目投资总额去年已达45亿欧元(约60亿美元),预计今明两年均会保持约40%的增长速度。
在美国,大数据已由热点词汇变成重点项目。去年3月,美国政府已公布2亿美元的《大数据研究发展计划》,今年11月再度公布涉及各级政府、私企、科研机构的多个大数据研究项目。美国国家卫生研究院、国家科学基金会等都参与其中,有评论称之为美国大数据战略2.0版。
在英国,虽然经济不景气、财政紧缩,但政府依然为大数据一掷千金。2013年初,英国商业、创新和技能部宣布将注资8亿英镑发展8类高新技术,其中1.89亿英镑(约3亿美元)用于大数据项目。
大数据在中国也已启动驶入“快车道”,政府、企业和科研院所正多方位布局。工信部的物联网“十二五”发展规划,将信息处理技术作为四项关键创新技术工程之一,其中包括海量数据存储、数据挖掘等。随着4G牌照在2013年末的发放,更高速的网络将带来更大的数据流,为政府和企业带来战略性资源。
“棱镜”今年曝光,让人看到大数据时代维护国家信息安全、保护个人隐私所面临的严峻挑战。
“棱镜门”让各国政府意识到“数据主权”的重要性,以及在网络和电信核心技术上依赖个别国家的恶果。必须加快自主创新以保护“数据主权”,已成为一些国家的共识。
英国《自然》杂志3月刊登的研究发现,只要有4个时间点和位置的数据就能确定一个人身份,准确率高达95%。这表明,大数据足以将一个人“描画”清晰,现有法律手段和核心技术对个人隐私的保护正在逐渐失效。
如何在大数据来袭中保持清醒和理性、有所创新和创造,对国家和个人来说同样是考验。
专家指出,大数据可望为中国经济转型升级发挥重要贡献,巨大的人口基数、经济体量和需求,意味着中国发展大数据拥有得天独厚的优势。但也应该看到,大数据具有价值密度低的特性,挖掘、分析等技术要求高。中国不能仅满足于做“世界数据中心”,应防止概念炒作,加强自主创新,进行前瞻性的制度设计等布局,顺势而为,将“中国创造”由机遇化为现实。
还应该警惕“迷信”大数据等倾向,认识到大数据分析可能存在的缺陷和不足。心理学家认为,大数据创造的模型会将人束缚在算法提供的选项中,过度依赖大数据分析也可能束缚创新。美国互联网活动家帕里泽称之为“互联网滤泡”:互联网个性化虽然带来方便,却将人们局限在自己过往行为模式的“气泡”中,无法触及海量信息带来的无尽可能。
大数据专家喜欢用莎士比亚“凡是过去,皆为序曲”来形容大数据分析的必然,但大数据提供的也只是参考答案而非最终答案。无论在小数据时代还是大数据时代,探索和创新精神都不应放弃,正如林肯所言,“预测未来最好的方法就是去创造未来”。
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
在MySQL数据库日常查询、数据统计、后台接口开发、数据导出等场景中,开发者经常需要查询数据表除某几列之外的所有字段。例如查 ...
2026-06-09在Python网络请求、爬虫开发、接口测试、数据抓取等实操场景中,requests库是最常用的第三方请求工具,而content属性是requests ...
2026-06-09 数据分析正在重塑每一个行业。CDA认证的三本官方教材,分别对应Level I、Level II、Level III,为你铺就从业务数据分析到数 ...
2026-06-09在数字财务、智慧财税、业财融合深度推进的当下,传统财务模式下数据标准混乱、业务流程碎片化、知识无法沉淀、系统互通性差等问 ...
2026-06-08随着数字经济深度渗透各行各业,数据正式成为继土地、劳动力、资本、技术之后的第五大生产要素,是企业数字化转型、精细化运营、 ...
2026-06-08 很多数据分析师能熟练写SQL、做透视表,但当被问到“数据是从哪里来的?经过哪些加工才进入数据仓库?ETL具体做了什么?”时 ...
2026-06-08【核心关键词】贷款、报表、课程、专业、建模、缺失值、营销、互联网、银行、办公自动化、数据分析、数据预处理、特征工程、贷 ...
2026-06-05在数据库数据查询、业务报表统计、多表关联分析中,LEFT JOIN左连接是使用率最高的SQL关联查询语句。其核心特性是保留左表全部数 ...
2026-06-05 很多数据分析师能熟练地写SQL、做透视表、算描述性统计,但当被问到“如何预测用户流失概率”“如何归因销量下滑的关键因素 ...
2026-06-05任何一款产品从诞生、普及到最终退出市场,都会遵循一套固定的发展规律,这就是产品生命周期理论。在市场竞争日益激烈、产品迭代 ...
2026-06-04在Excel数据分析、办公统计、业务报表制作场景中,数据透视表是数据汇总、分类统计、快速复盘的核心工具,能够高效完成海量原始 ...
2026-06-04 很多数据分析师拿到数据就开始清洗、建模,但当被问到“这批数据属于什么类型——结构化还是非结构化?分类变量还是数值变量 ...
2026-06-04在问卷调查与社会科学数据分析中,卡方检验是最常用、最基础的非参数检验方法,广泛应用于市场调研、用户分析、行为统计、满意度 ...
2026-06-03【核心关键词】贷款、报表、课程、专业、建模、缺失值、营销、互联网、银行、办公自动化、数据分析、数据预处理、特征工程、贷 ...
2026-06-03 很多数据分析师画过趋势图、做过业绩预测,但当被问到“这个月销售额增长20%,到底是长期趋势自然增长,还是促销活动的短期 ...
2026-06-03逻辑回归是数据分析、机器学习、统计建模中应用最广泛的二分类预测模型,常用于风险判断、行为预测、归因分析等场景。在SPSS、Py ...
2026-06-02数字经济时代,市场竞争日趋同质化,用户消费需求愈发个性化、多元化,传统依托经验、粗放式、广撒网的营销模式弊端日益凸显。长 ...
2026-06-02 很多数据分析师做过按月份的销售额趋势图,画过按天的流量折线图,但当被问到“时间序列和普通数据有什么本质区别”“季节性 ...
2026-06-02在市场竞争日趋饱和、用户需求不断细分的当下,企业创业创新、产品迭代与市场拓展不再依赖经验决策,而是需要系统化、工具化的商 ...
2026-06-01【核心关键词】调度、岗位、数据库、企业、报表、培训、程序、数据分析、数据加工、业务部门、企业数据、调度工具、业务指标、 ...
2026-06-01