京公网安备 11010802034615号
经营许可证编号:京B2-20210330
块数据:大数据发展的趋势、挑战和机遇
在25日的中国侨联青年委员会“块数据与城市发展”专题讲坛上,各方对大数据进行了阐述和解读,表明了这样的观点:大数据将在经济领域彻底颠覆人类自工业革命以来积累形成的经济模式和商业模式,而块数据将是大数据发展的趋势。
为配合理解什么是大数据发展的趋势、什么是块数据,本报今日起开设“块数据漫谈”专栏,陆续推出科普文章,以飨读者。
大势所趋 从“条数据”到“块数据”
对于大数据时代,目前人们所讨论的数据几乎都是条数据,条数据是指某个行业或领域呈链条状串起来的数据,他们彼此割裂、互不融通,限制了大数据在经济社会发挥作用。
与之相比,块数据是在一个物理空间或者行政区域形成的涉及到人、事、物等各类数据的综合,相当于将各类“条数据”解构、交叉、融合。在块数据集合过程中,包含了数据空间的填充、空间数据的重构、集合过程的组构,及组构过程中的集合,同时还有新数据的汇集和原有数据组合后的衍生数据。通过块数据的应用,可以挖掘出数据更高、更多的价值。
举例来说,一个百货商场每天都会卖出很多商品,每个商品的原材料、品牌设计、广告营销数据、百货商场卖出商品的数量、种类数据,消费者在商场购物、娱乐的数据,将所有在商场这个物理空间产生的数据求和,得到的就是块数据。而一个数据的变化会带动其他数据发生改变,比如,当商场的影院播放一部聚集人气的影片时,商场的其他产品销量也会上升,这一过程又会衍生出新的数据。这个例子也充分说明了块数据的强活性,即随时随地都在进行数据更新。
因此,块数据的商业价值就在于通过对块数据的挖掘、分析,我们能够实现对事物规律的精准定位,甚至能够发现以往未能发现的新规律。可以毫不夸张地说,在这个时代,得“块”者得天下。
“大材大用” 块数据应用面临挑战
在创新商业模式方面,通过块数据将以往的“数据孤岛”连成一片后,可以综合分析出所需的商业要素,如消费喜好、生活需求等,我们就可以从中精确找准那些高度个性化、长尾化的市场需求,孕育产生全新的商业模式。例如,华为公司基于IT基础设施领域在存储和计算的优势,提供整体大数据解决方案就属于此类。
同时,块数据在社会领域应用上也有广阔前景,包括提升社会保障水平、推动社会组织更好履行社会责任等。社会公共文化在块数据的催化下也将被重新定义,在全社会形成诚信、分享、开放、创新的文化氛围将更容易实现。在块数据的推动下,政府职能也发生着深刻改变,具体表现在模式、服务、规则的不断升级和优化。
但是块数据的非结构化比例相比条数据而言更高,使得块数据开发、应用和管理的难度更大,因此在块数据应用方面我们面临着非常多的考验。
首先,块数据的形成是一个构建生态系统的工程,这个生态系统需要建立包含标准确立、技术支撑、安全监管、开放体系构建等多要素的整套规则体系,规则体系的缺失将无法给块数据的应用提供一个安全稳定的大环境,会给块数据应用中可能会遇到的清洗、共享、利益分成、隐私保护等问题解决带来困扰。
此外,由于只有结构化的数据才能进行对比分析,而传统的数据库技术已经不再适用非结构化数据,与国外技术相比,国内的非结构化处理技术的先进性和可靠性仍有很大差距。
同时,缺少法律约束、道德自律、技术手段等方面的数据安全保护支撑,数据安全问题日益凸显,保护公民隐私刻不容缓。而数据确权、数据定价、数据保险和数据货币、登记、交割等一系列新的金融业态将会随着大数据产业链的完善而产生,金融市场的不稳定性将成常态化。
大有可为 块数据催生广阔前景
挑战艰巨,但是无法遮盖块数据应用的巨大潜力和价值。不久的将来,块数据将对商业领域、民生领域、政府治理领域留下深刻烙印。
在商业领域,基于人的主体性构建的块数据首先影响的是各类服务行业,通过数据挖掘,在发现需求的同时又能创造需求,紧接着再根据需求为客户定制服务和产品,在这一过程中,影响又随之向工业、农业延伸,数据本身也逐步完善自己的产业结构,最终可以形成全产业链条。
在民生领域,通过块数据应用,民生服务将进入长尾化和个性化阶段,基于数据模拟技术,能够对重大民生事项实现提前预测,变模糊被动的后端治理为见微知著的前端治理。此外,基于深度学习技术,块数据可对重大民生问题的解决提供智能化的支持,有助于降低服务成本,提升工作效率,形成一个更加温馨、更具效率的民生服务体系。
在政府治理领域,在块数据思维的引领下,政府既有行为将会发生巨大转变。对政府内部机构来说,块数据可以打破壁垒,连接孤岛,通过信息共享、工作联动的方式推动工作的有效开展,对群众来说,随着数据公开的常态化,社会公众对政府的日常运作的监督也将更有效。同时,块数据的应用可以让政府决策更具科学性和前瞻性,打造智慧政府和法制政府将成为可能。
比如,运用块数据,政府可以根据个人的不同情况,以定制化的方式让老百姓得到更好的服务,使公共管理领域真正实现高效。而一些长期以来难以解决的问题比如环境污染、食品安全等都可以通过块数据的公开倒逼责任主体执行改革,政府工作模式从以往的单纯结果导向向结果和过程导向同时并重转变。
CDA学员免费下载查看报告全文:2026全球数智化人才指数报告【CDA数据科学研究院】.pdf
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
近日,由 CDA 数据科学研究院重磅发布的《2026 全球数智化人才指数报告》,被中国教育科学研究院官方账号正式收录, ...
2026-04-22在数字化时代,客户每一次点击、浏览、下单、咨询等行为,都在传递其潜在需求与决策倾向——这些按时间顺序串联的行为轨迹,构成 ...
2026-04-22数据是数据分析、建模与业务决策的核心基石,而“数据清洗”作为数据预处理的核心环节,是打通数据从“原始杂乱”到“干净可用” ...
2026-04-22 很多数据分析师每天盯着GMV、转化率、DAU等数字看,但当被问到“什么是指标”“指标和维度有什么区别”“如何搭建一套完整的 ...
2026-04-22在数据分析与业务决策中,数据并非静止不变的数值,而是始终处于动态波动之中——股市收盘价的每日涨跌、企业月度销售额的起伏、 ...
2026-04-21在数据分析领域,当研究涉及多个自变量与多个因变量之间的复杂关联时,多变量一般线性分析(Multivariate General Linear Analys ...
2026-04-21很多数据分析师精通描述性统计,能熟练计算均值、中位数、标准差,但当被问到“用500个样本如何推断10万用户的真实满意度”“这 ...
2026-04-21在数据处理与分析的全流程中,日期数据是贯穿业务场景的核心维度之一——无论是业务报表统计、用户行为追踪,还是风控规则落地、 ...
2026-04-20在机器学习建模全流程中,特征工程是连接原始数据与模型效果的关键环节,而特征重要性分析则是特征工程的“灵魂”——它不仅能帮 ...
2026-04-20很多数据分析师沉迷于复杂的机器学习算法,却忽略了数据分析最基础也最核心的能力——描述性统计。事实上,80%的商业分析问题, ...
2026-04-20在数字化时代,数据已成为企业决策的核心驱动力,数据分析与数据挖掘作为解锁数据价值的关键手段,广泛应用于互联网、金融、医疗 ...
2026-04-17在数据处理、后端开发、报表生成与自动化脚本中,将 SQL 查询结果转换为字符串是一项高频且实用的操作。无论是拼接多行数据为逗 ...
2026-04-17面对一份上万行的销售明细表,要快速回答“哪个地区卖得最好”“哪款产品增长最快”“不同客户类型的购买力如何”——这些看似复 ...
2026-04-17数据分析师一天的工作,80% 的时间围绕表格结构数据展开。从一张销售明细表到一份完整的分析报告,表格结构数据贯穿始终。但你真 ...
2026-04-16在机器学习无监督学习领域,Kmeans聚类因其原理简洁、计算高效、可扩展性强的优势,成为数据聚类任务中的主流算法,广泛应用于用 ...
2026-04-16在机器学习建模实践中,特征工程是决定模型性能的核心环节之一。面对高维数据集,冗余特征、无关特征不仅会增加模型训练成本、延 ...
2026-04-16在数字化时代,用户是产品的核心资产,用户运营的本质的是通过科学的指标监测、分析与优化,实现“拉新、促活、留存、转化、复购 ...
2026-04-15在企业数字化转型、系统架构设计、数据治理与AI落地过程中,数据模型、本体模型、业务模型是三大核心基础模型,三者相互支撑、各 ...
2026-04-15数据分析师的一天,80%的时间花在表格数据上,但80%的坑也踩在表格数据上。 如果你分不清数值型和文本型的区别,不知道数据从哪 ...
2026-04-15在人工智能与机器学习落地过程中,模型质量直接决定了应用效果的优劣——无论是分类、回归、生成式模型,还是推荐、预测类模型, ...
2026-04-14