
专访英特尔中国研究院院长吴甘沙:期待数据开放带来真正的大数据时代
吴甘沙,2000年加入英特尔,2011年晋升为首席工程师,同年他共同领导公司的大数据中长期技术规划。在英特尔工作期间,他发表10余篇学术论文,有22项美国专利,14项专利进入审核期。
在英特尔中国研究院院长吴甘沙的微博上,有一句英文的自我简介,可大致译为“勇敢而与众不同地思考大数据”。自2011年担任英特尔首席工程师以来,他一直主持研究院大数据方面的研究。站在大数据思维和技术研发“潮头”的他认为,研究大数据的乐趣在于“当大多数人在考虑第N个阶段的时候,开始考虑N 1个阶段”。
当前,贵州也站在了大数据产业的“潮头”。而环顾全球,大数据正以燎原之势,从一个热词迅速转化为科研院所、政府、企业、个人共同关注、研究、应用的对象,一种新的生产力正蓬勃兴起。贵州、贵阳要引领发展趋势,对话大数据专家,从他们那儿汲取智慧是一种事半功倍的途径。为此,记者近日专访了吴甘沙。
大数据是指数社会的蛋白质
“如果以世纪之交作为分隔线,上世纪的数据文化、思维和方法论还停留在前大数据时代,真正意义上的大数据思想本世纪初才破茧而出。”吴甘沙说。
“2012年,大数据成为显学。”吴甘沙介绍,这一年,达沃斯的《大数据,大影响:全球发展的新可能》和奥巴马政府的《大数据研发计划》共同确立了大数据在世界范围的战略位置,而涂子沛《大数据》和舍恩伯格《大数据时代》在国内的出版,也使2012年被称作中国的大数据元年。
对于大数据,吴甘沙常常理解为:“摩尔定律是指数社会的基因,而大数据是指数社会的蛋白质。”上世纪60、70年代,英特尔创始人之一的戈登·摩尔提出:当价格不变时,集成电路上可容纳的元器件的数目,约每隔18-24个月便会增加一倍,性能也将提升一倍。这一定律常常被用来形容信息技术进步的速度。而吴甘沙认为,随着移动互联时代的到来,数据爆发式增长在量上也越来越符合摩尔定律的指数递增规律。
“基因决定生命特征,是初始点,而蛋白质是生命的物质基础,是生命活动的主要承担者,也就是说,大数据会越来越像原材料,像货币,变成社会生命活动的主要承担者,关系到每一个人的数据化生存。”吴甘沙断言。
他进而举例说,在大数据、云计算、移动互联网和物联网等现代前沿信息技术之中,大数据是根本和核心,云计算是方式和手段,移动互联网、物联网则是物化大数据和云计算价值的应用。
大数据发挥作用的关键在于数据开放
当下,“互联网+”这一名词及其对应的发展趋势正方兴未艾,而吴甘沙则提出了“大数据×”这一说法。他说,大数据与很多传统产业融合在一起能够产生乘法效应,不同产业之间融合还能产生数据外部效应,即一个产业的数据如果用于另外一个产业,能迸发出巨大价值。
在研究中,吴甘沙越来越发现,乘法效应要充分发挥,必须走数据开放之路,让不同领域的数据真正流动起来、融合起来。“最开始,大数据的主要矛盾是互联网公司或在线数据太多的问题,接着,主要矛盾变成人没有能力从数据中提取价值的问题,最后主要矛盾变成中小公司、传统行业无法获得数据,数据孤岛的问题。”吴甘沙说,正因为如此,最近四五年,他个人的研究方向也从关注数据与机器的关系到关注数据与人,再到眼下关注数据与数据的关系。
那么,哪些数据适合开放呢?吴甘沙认为:“不涉及个体的公共数据和科研数据都可以开放,涉及个体的数据要明确数据权属、隐私界定,获得拥有者授权,采用技术匿名化之后再考虑开放。”他同时建议,可以借鉴英美,开放原始数据,而非提炼数据,保证数据满足蒂姆·伯纳斯-李提出的数据开放五星标准。
目前,贵阳正通过宽带贵阳和全域公共免费WiFi城市建设,推动社会企业和个人动态数据的“块”上集聚。吴甘沙认为,WiFi采集数据的优点就是有数据发生所在地点的信息,方便把数据放到不同的语境中分析。但他也坚持,在数据集聚之后,同样需要明确获得用户对数据的授权。
数据交易定价机制仍待实践中摸索
广义的数据开放还包括数据的共享及交易。吴甘沙认为,在大数据时代,如何让数据变成政府决策、企业经营的第一要素,数据的交易显得尤为关键。
4月14日,贵阳大数据交易所完成了首批交易。在吴甘沙看来,这样一个基于市场进行价值发现和定价,连通大数据供需双方,让数据像股票交易那样高频率碰撞的交易市场,在大数据时代是大势所趋。
但他同时指出,无论是数据的交易,还是交易过程中数据的定价,现在都没有标准的答案,“一来要从实践中摸索,二来要有意识地跟经济界做思想碰撞。”他举例说,数据在公开市场交易的时候,是根据市场价值发现机制来定价,根据数据的种类来定价,还是根据数据访问API的调用次数来定价?企业的数据资产价值几何?个人数据是否也需要定价,它的价值是不是应该由个人自己来享受,而不是完全让互联网服务提供商从中获益……
尽管这些困惑尚无定论,但吴甘沙认为这也正是大数据的魅力所在。对于大数据,深耕多年的他认为,乐趣在于“当大多数人在考虑第N个阶段的时候,开始考虑N 1个阶段”。
对于正在争先发展大数据的贵阳,吴甘沙认为过去一年多的工作“非常棒”,他同时给出建议:要想在与北京等发达地区发展大数据的竞争中不落伍,人才聚集和可持续的供给非常关键。
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
2025 年,数据如同数字时代的 DNA,编码着人类社会的未来图景,驱动着商业时代的运转。从全球互联网用户每天产生的2.5亿TB数据, ...
2025-06-052025 年,数据如同数字时代的 DNA,编码着人类社会的未来图景,驱动着商业时代的运转。从全球互联网用户每天产生的2.5亿TB数据, ...
2025-05-27CDA数据分析师证书考试体系(更新于2025年05月22日)
2025-05-26解码数据基因:从数字敏感度到逻辑思维 每当看到超市货架上商品的排列变化,你是否会联想到背后的销售数据波动?三年前在零售行 ...
2025-05-23在本文中,我们将探讨 AI 为何能够加速数据分析、如何在每个步骤中实现数据分析自动化以及使用哪些工具。 数据分析中的AI是什么 ...
2025-05-20当数据遇见人生:我的第一个分析项目 记得三年前接手第一个数据分析项目时,我面对Excel里密密麻麻的销售数据手足无措。那些跳动 ...
2025-05-20在数字化运营的时代,企业每天都在产生海量数据:用户点击行为、商品销售记录、广告投放反馈…… 这些数据就像散落的拼图,而相 ...
2025-05-19在当今数字化营销时代,小红书作为国内领先的社交电商平台,其销售数据蕴含着巨大的商业价值。通过对小红书销售数据的深入分析, ...
2025-05-16Excel作为最常用的数据分析工具,有没有什么工具可以帮助我们快速地使用excel表格,只要轻松几步甚至输入几项指令就能搞定呢? ...
2025-05-15数据,如同无形的燃料,驱动着现代社会的运转。从全球互联网用户每天产生的2.5亿TB数据,到制造业的传感器、金融交易 ...
2025-05-15大数据是什么_数据分析师培训 其实,现在的大数据指的并不仅仅是海量数据,更准确而言是对大数据分析的方法。传统的数 ...
2025-05-14CDA持证人简介: 万木,CDA L1持证人,某电商中厂BI工程师 ,5年数据经验1年BI内训师,高级数据分析师,拥有丰富的行业经验。 ...
2025-05-13CDA持证人简介: 王明月 ,CDA 数据分析师二级持证人,2年数据产品工作经验,管理学博士在读。 学习入口:https://edu.cda.cn/g ...
2025-05-12CDA持证人简介: 杨贞玺 ,CDA一级持证人,郑州大学情报学硕士研究生,某上市公司数据分析师。 学习入口:https://edu.cda.cn/g ...
2025-05-09CDA持证人简介 程靖 CDA会员大咖,畅销书《小白学产品》作者,13年顶级互联网公司产品经理相关经验,曾在百度、美团、阿里等 ...
2025-05-07相信很多做数据分析的小伙伴,都接到过一些高阶的数据分析需求,实现的过程需要用到一些数据获取,数据清洗转换,建模方法等,这 ...
2025-05-06以下的文章内容来源于刘静老师的专栏,如果您想阅读专栏《10大业务分析模型突破业务瓶颈》,点击下方链接 https://edu.cda.cn/g ...
2025-04-30CDA持证人简介: 邱立峰 CDA 数据分析师二级持证人,数字化转型专家,数据治理专家,高级数据分析师,拥有丰富的行业经验。 ...
2025-04-29CDA持证人简介: 程靖 CDA会员大咖,畅销书《小白学产品》作者,13年顶级互联网公司产品经理相关经验,曾在百度,美团,阿里等 ...
2025-04-28CDA持证人简介: 居瑜 ,CDA一级持证人国企财务经理,13年财务管理运营经验,在数据分析就业和实践经验方面有着丰富的积累和经 ...
2025-04-27