京公网安备 11010802034615号
经营许可证编号:京B2-20210330
融合?重构?区块链和大数据关系竟如此简单
最近一段时间,区块链和大数据这两大热词正在被越来越多地放在一起,随着各种言论的增多,两者的关系开始变得扑朔迷离。区块链将与大数据融合发展?区块链最终将重构大数据?围观群众纷纷表示想弄个明白。
“要弄清区块链和大数据的关系,首先要从两者的不同开始。”从事互联网技术研究20余年,人称互联网技术相面师的中国信息通信研究院云计算与大数据研究所所长何宝宏抛出了这一观点。他认为,区块链和大数据技术存在一定的共性,但是两者在技术处理方式上,更多的是不同。
何宝宏 中国信息通信研究院云计算与大数据研究所所长
何宝宏表示,区块链技术是分布式数据存储、点对点传输、共识机制、加密算法等计算机技术的新型应用模式,区块链处理的数据更小,是细致的处理方式。而大数据管理的是海量数据,要求广度和数量,处理方式上也会粗糙,重点是统计分析(如下图)。
“这个时代最大的特点就是变化。”对于区块链的兴起引发的业界的讨论、思考和担忧,何宝宏认为,我们擅长关注变化的东西,但是实际上很多变化背后的一些东西是不变的,比如——技术的规律。因而,在探讨区块链和大数据的关系时,我们需要跳出技术看技术。
客观而言,作为一个颠覆式的新兴技术,区块链要应用在大数据场景下,其本身还还不够成熟,需要进一步的研究而探讨。而区块链是否可能重构大数据?何宝宏认为基本不存在这一可能,因为大数据针对的是非结构化的数据,而区块链处理的是结构化数据。“两者的目标数据不同,要解决的问题也不同。”
在4月18日-19日即将于北京国家会议中心召开的“2018大数据产业峰会”上,何宝宏将发表题为“预见大数据的2018”的演讲,就大数据、区块链等技术发展背后的规律,以及2018年的市场动态和趋势进行展望。下面,小编收集了何宝宏博士近期的精彩观点,供大家提前养养眼、洗洗脑。
区块链:互联网的“大补丁”
草根、全球、自治、分布、开放、透明、对等、匿名、分享……二十年前,人们如此形容互联网;今天,这些却成为了区块链身上的标签。
这是为何?“区块链是互联网的发展和延续,是互联网的一块大补丁。”何宝宏认为,区块链颠覆不了互联网,更颠覆不了世界。如果非要认为区块链可以颠覆世界,只能说那可能是你的世界太小了。
要为区块链相面,我们能发现很多问题,如:性能低、能耗高、生态链、安全防护、隐私保护、监管缺失、标准缺失、不务正业等。“以我20多年的互联网相面经验来说,但凡是有这些问题的技术都是‘好技术’,这些缺点随着时间的推移都是可以克服和解决的。所以,每当有人批评区块链这些缺点时,我都会说这是优秀技术的典型特征。”
相比较区块链这样的颠覆式技术,何宝宏认为那些注定要失败的技术往往具备以下特征:
1、声称包治百病,一句话说不清楚它希望解决的具体问题;
2、概念模糊,一句话说不清楚它的基本思想和原理,与现有技术的明显区别或边界;
3、准备从主流市场,最赚钱的市场或存量市场开始;
4、需要建立以我为中心的生态链(技术富二代除外);
5、看起来过于完美,没有明显的取舍,回避需要付出的技术代价;
6、不考虑摩尔定律是否支持;
7、经济学规律模糊,历史案例牵强。
区块链的本质是分布式账本。何宝宏认为,分布式账本是“刚需”。过去的几百年,我们一直在使用集中式的记账方式,没有一种手段能够支持高效的分布式记账,直到区块链的出现。
“成年后的技术大多活成自己讨厌的样子。”区块链的特点是去中心化、防篡改、匿名性,但是随着其不断成熟和落地,这些特征需要从更深层次去理解。
分布式≠去中心
分布式不等于去中心。“高喊去中心的大多数是自己想成为新的中心。”何宝宏以比特币为例,其代码控制在Core小组手中,算力是高度集中的。同时,有报告显示,40%的比特币实际上是集中在1000个人手里,而另外一个报告则说,96.53%的比特币归属于4.11%的地址。因而,随着区块链的发展,去中心正在变成多中心。
防篡改≠不可修改
防篡改不等于不可修改。在何宝宏看来,人会犯错,数据因而也会出错。在会计体系里,不允许做假账但是允许改错账。在传统的数据库技术中,修改是很容易实现的,因而需要一些管理手段来防止篡改。但是今天,区块链技术是不可修改,那么如果数据出错了怎么办?因而需要在不可篡改的技术上加上“可修改”。
保护隐私≠匿名
保护隐私不意味着一定要匿名。何宝宏认为,匿名是保护隐私的一种方法和手段,但不是绝对。二十多年前的互联网是匿名的、全球化的,谁也关不掉,共享且自治。然而,到了今天,登陆一个网站,你就需要输入验证码,以证明自己是人,而不是机器或其他。
对共识机制难有共识
“对共识机制,难有共识。”何宝宏说,我们需要共识,但我们的共识机制本身却是分裂的、碎片化的。我们用POW比谁劲大,用POS比谁钱多,这是典型的从原始社会过渡到资本主义社会的“玩法”。后来钱多了人也太多了,于是又用DPOS搞出了代理人机制。
共识机制如何形成共识,属于控制层面范畴,这个共识特别难。要有这样的共识就必须要有共识之母,一个共识前面还得有一个共识才能形成后面的共识,共识也是链式结构的,信任也是链式结构的。因而,说区块链是去信任的,那是不可能的。
小产业、大变革
从技术的角度上看,区块链就是将原来的单个账本变成了现在的多个账本。原来,所有的数据库之间是主从关系,账本只有一个;今天多个数据库之间是对等关系,账本从一个变成多。
从一个会计到多个会计,以前记账可以读、写、改、删,今天记账只有读和写;以前记账要给会计发工资,进行外部激励,我们今天自己激励就可以了;以前所有公司的商务和财务都是分离的,付账过程特别繁琐;今天的智能合约是商务财务一体化,这就颠覆了我们很多的想法。
以前,代码就是技术;今天,代码变成了金融产品,所以就出现了新的机会。以前,数据主要是指信息,技术则就是如何帮它更广泛的传播;现在数据越来越成为资产,技术的走向就要发生很大的变化。
以前,二进制代码表达的是信息;今天,二进制代码表达的是一种财产。数据即资产,资产即数据。当二进制代码代表资产,技术的核心要义就要走向保护,要去管理和控制。技术的目的从最大限度的传播,转为考虑如何把代码圈起来。
区块链是小产业、大变革。它颠覆的是我们的经济、经济运营最底层的复式记账法。我们用了几百年的复式记账法将演进为三式记账法。
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
在数据驱动决策的时代,数据分析已成为企业运营、产品优化、业务增长的核心工具。但实际工作中,很多数据分析项目看似流程完整, ...
2026-01-15在CDA(Certified Data Analyst)数据分析师的日常工作中,“高维数据处理”是高频痛点——比如用户画像包含“浏览次数、停留时 ...
2026-01-15在教育测量与评价领域,百分制考试成绩的分布规律是评估教学效果、优化命题设计的核心依据,而正态分布则是其中最具代表性的分布 ...
2026-01-15在用户从“接触产品”到“完成核心目标”的全链路中,流失是必然存在的——电商用户可能“浏览商品却未下单”,APP新用户可能“ ...
2026-01-14在产品增长的核心指标体系中,次日留存率是当之无愧的“入门级关键指标”——它直接反映用户对产品的首次体验反馈,是判断产品是 ...
2026-01-14在CDA(Certified Data Analyst)数据分析师的业务实操中,“分类预测”是高频核心需求——比如“预测用户是否会购买商品”“判 ...
2026-01-14在数字化时代,用户的每一次操作——无论是电商平台的“浏览-加购-下单”、APP的“登录-点击-留存”,还是金融产品的“注册-实名 ...
2026-01-13在数据驱动决策的时代,“数据质量决定分析价值”已成为行业共识。数据库、日志系统、第三方平台等渠道采集的原始数据,往往存在 ...
2026-01-13在CDA(Certified Data Analyst)数据分析师的核心能力体系中,“通过数据建立模型、实现预测与归因”是进阶关键——比如“预测 ...
2026-01-13在企业数字化转型过程中,业务模型与数据模型是两大核心支撑体系:业务模型承载“业务应该如何运转”的逻辑,数据模型解决“数据 ...
2026-01-12当前手游市场进入存量竞争时代,“拉新难、留存更难”成为行业普遍痛点。对于手游产品而言,用户留存率不仅直接决定产品的生命周 ...
2026-01-12在CDA(Certified Data Analyst)数据分析师的日常工作中,“挖掘变量间的关联关系”是高频核心需求——比如判断“用户停留时长 ...
2026-01-12在存量竞争时代,用户流失率直接影响企业的营收与市场竞争力。无论是电商、互联网服务还是金融行业,提前精准预测潜在流失用户, ...
2026-01-09在量化投资领域,多因子选股是主流的选股策略之一——其核心逻辑是通过挖掘影响股票未来收益的各类因子(如估值、成长、盈利、流 ...
2026-01-09在CDA(Certified Data Analyst)数据分析师的工作场景中,分类型变量的关联分析是高频需求——例如“用户性别与商品偏好是否相 ...
2026-01-09数据库中的历史数据,是企业运营过程中沉淀的核心资产——包含用户行为轨迹、业务交易记录、产品迭代日志、市场活动效果等多维度 ...
2026-01-08在电商行业竞争日趋激烈的当下,数据已成为驱动业务增长的核心引擎。电商公司的数据分析师,不仅是数据的“解读官”,更是业务的 ...
2026-01-08在数据驱动决策的链路中,统计制图是CDA(Certified Data Analyst)数据分析师将抽象数据转化为直观洞察的关键载体。不同于普通 ...
2026-01-08在主成分分析(PCA)的学习与实践中,“主成分载荷矩阵”和“成分矩阵”是两个高频出现但极易混淆的核心概念。两者均是主成分分 ...
2026-01-07在教学管理、学生成绩分析场景中,成绩分布图是直观呈现成绩分布规律的核心工具——通过图表能快速看出成绩集中区间、高分/低分 ...
2026-01-07