京公网安备 11010802034615号
经营许可证编号:京B2-20210330
大数据的成长期烦恼:四大“冰点”三大“缺陷”
大数据在深刻地改变着经济社会生活的方方面面。然而,这一互联网新技术,眼下却遭遇数据难以共享等诸多困难,数据的公信度和共识性因此打折。同时,大数据在应用、交易、法律环境等方面也面临着不少制度性难题。
“高热”之下有“冰点” 盘点当下的高热词,“大数据”是其中之一。但业内专家担忧,“高热”下掩盖着“冰点”,这些“冰点”将阻碍刚刚起步的我国大数据产业的健康成长。
“冰点”一:“只见树木,不见森林” 阿里巴巴集团副总裁、数据委员会会长车品觉认为,目前,大数据行业最突出的问题是“只见树木,不见森林”。移动互联网、电商等是“重用”大数据的重点领域,而大部分传统企业对此却缺乏意识,甚至还不清楚如何利用数据。
同时,大数据应用的深度也远远不够。“国内的不少企业仅是利用大数据模型做营销方案,而像谷歌、亚马逊等国际知名企业,已将大数据思维全面融入公司管理。”车品觉说。
“冰点”二:“拿走数据的多,贡献数据的少” 找不到数据是数据应用企业面临的普遍困扰。海尔家电产业集团营销总经理宋照伟直言,海尔希望获知用户的多维度行为习惯,但能够掌握的信息渠道仍然狭窄,信息量不够理想。
“拿走数据的多,贡献数据的少。”贵阳大数据交易所执行总裁王叁寿表示,不少企业以保护商业机密或节省数据整理成本等为理由,不愿意交易自身数据,直接导致交易所的数据量不够丰富。
“冰点”三:商业数据“割据”,政府数据“孤立” 以阿里巴巴旗下的“芝麻信用”为例,其评分依据的数据只来自支付宝平台,本身公信力有限,而其他企业希望能利用支付宝相关数据时,又很难获得。
同样,政府数据公开程度也非常有限。比如,银行在为客户办理信贷业务时,只能查到其在当地的工商信息,无法获知其在外地的情况。
“冰点”四:侵权还是“个性化推荐”存争议 对于个人数据隐私保护、数据权属、政府数据公开等问题,目前尚无明确的规定,因此,纠纷时有发生。
以朱烨诉百度侵权案为例,2015年,网民朱烨发现自己用百度搜索关键词后会收到相关广告推送,因此将百度以侵犯隐私权为由告上法庭。法院一审认定百度侵 犯朱烨隐私权,但二审却撤销一审判决。中国政法大学传播法中心研究员朱巍表示,两级法院给出截然相反的判决,说明法律界对此类新情况认识不一致。
三大基础性“缺陷”待弥补 专家从三个方面分析了产生上述问题的原因,并认为这是我国大数据产业发展必须加快弥补的三大基础性“缺陷”。
“缺陷”一:产业信息化尚未完成 IBM大中华区大数据与分析部数据分析产品线主管洪建勋研究发现,目前国内大量客户还停留在将80%的时间用在数据获取上,还缺乏系统化整理,更谈不上“商务智能”应用了。这和企业信息化水平较低有直接关系。
洪建勋介绍,兴于上世纪末发达国家的“商务智能”管理,即“用数据说话”,这种管理方式的普及大大提升了信息化意识和水平。
中国社会科学院信息化研究中心秘书长姜奇平表示,信息化是大数据的基础,而信息化的推进都是先从消费者开始,然后才传导到企业和政府。农业、工业、能源等行业的数据化还需假以时日。
“缺陷”二:“大数据思维”未成行业共识 车品觉表示,现在企业大多将大数据作为工具,导致“要数据的不知道大数据从哪里来,做数据的不知道大数据如何用,用数据的人担心真实性不敢用”。
也正是因为“大数据思维”未能达成共识,数据互惠共利的环境难以形成,推动数据共享就比较艰难。
“缺陷”三:监管和立法滞后 大数据产业发展之快难以想象,但对于数据权属、个人数据隐私、政府数据公开等,目前都缺乏具有针对性的法律法规。而且,大数据作为新型资源,目前还没有明确专门的监管部门。
“企业和政府收集的数据拿来交易,这个数据究竟是谁的?比如政府收集了企业的数据,那么这些数据是企业的还是政府的?国家鼓励数据交易,但在法律方面要进一步明确,让行业发展有法律依据。”王叁寿说。
朱巍介绍,现在对个人数据的保护,大多依照2012年通过的“关于加强网络信息保护的决定”,这已远远不能适应目前行业的发展现状。
在加快发展中走出“成长烦恼期” 业内人士认为,我国大数据产业在目前乃至较长一段时间或都处于“成长烦恼期”,这也是大数据产业从稚嫩走向成熟的必经阶段。因此,要在加快发展中探索成长之路。
从规模上看,2015年我国大数据市场仅有102亿元,不及一家股份制银行一年的净利润。而在国内以及境外的资本市场上,还没有出现中国的大数据行业巨头。
关于大数据应用问题,清华大学数据科学研究院执行副院长韩亦舜表示,大数据产业仍在起步阶段,随着社会信息化程度加深,数据源也将更加丰富,大数据应用范围将不断扩大。
“随着经济转型升级,势必有越来越多的企业将借助大数据实现增长。”IBM大中华区大数据与分析部大数据与分析业务技术总监刘胜利表示。
对于大数据共享的困境,业内专家指出,这在全球都是一个难题。目前,我国正探索建立大数据交易所,以交易驱动数据共享;有的行业内部已经形成企业间互换数 据的惯例,如我国参与的国际间卫星数据交换交易、移动互联网公司间的数据互换等。春节期间,微信支付、支付宝、百度钱包等联手诸多商家推出促销活动,本质 上也是一种数据互换、互惠共利。
另外,可以借鉴国外经验,对政府数据进行更好的挖掘、利用,如将非涉密的政府数据放在网上,供社会查阅。
在大数据立法与监管层面,业内人士建议,应确定监管部门,并完善相关立法。在立法短时间内难以完成的情况下,应加紧制定有关大数据的标准、规则、指引,引导行业规范发展,加强隐私保护,促进政府数据开放。
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
在数字化时代,用户是产品的核心资产,用户运营的本质的是通过科学的指标监测、分析与优化,实现“拉新、促活、留存、转化、复购 ...
2026-04-15在企业数字化转型、系统架构设计、数据治理与AI落地过程中,数据模型、本体模型、业务模型是三大核心基础模型,三者相互支撑、各 ...
2026-04-15数据分析师的一天,80%的时间花在表格数据上,但80%的坑也踩在表格数据上。 如果你分不清数值型和文本型的区别,不知道数据从哪 ...
2026-04-15在人工智能与机器学习落地过程中,模型质量直接决定了应用效果的优劣——无论是分类、回归、生成式模型,还是推荐、预测类模型, ...
2026-04-14在Python网络编程、接口测试、爬虫开发等场景中,HTTP请求的发送与响应处理是核心需求。Requests库作为Python生态中最流行的HTTP ...
2026-04-14 很多新人学完Python、SQL,拿到一张Excel表还是不知从何下手。 其实,90%的商业分析问题,都藏在表格的结构里。 ” 引言:为 ...
2026-04-14在回归分析中,因子(即自变量)的筛选是构建高效、可靠回归模型的核心步骤——实际分析场景中,往往存在多个候选因子,其中部分 ...
2026-04-13在机器学习模型开发过程中,过拟合是制约模型泛化能力的核心痛点——模型过度学习训练数据中的噪声与偶然细节,导致在训练集上表 ...
2026-04-13在数据驱动商业升级的今天,商业数据分析已成为企业精细化运营、科学决策的核心手段,而一套规范、高效的商业数据分析总体流程, ...
2026-04-13主讲人简介 张冲,海归统计学硕士,CDA 认证数据分析师,前云南白药集团资深数据分析师,自媒体 Python 讲师,全网课程播放量破 ...
2026-04-13在数据可视化与业务分析中,同比分析是衡量业务发展趋势、识别周期波动的核心手段,其核心逻辑是将当前周期数据与上年同期数据进 ...
2026-04-13在机器学习模型的落地应用中,预测精度并非衡量模型可靠性的唯一标准,不确定性分析同样不可或缺。尤其是在医疗诊断、自动驾驶、 ...
2026-04-10数据本身是沉默的,唯有通过有效的呈现方式,才能让其背后的规律、趋势与价值被看见、被理解、被运用。统计制图(数据可视化)作 ...
2026-04-10在全球化深度发展的今天,跨文化传播已成为连接不同文明、促进多元共生的核心纽带,其研究核心围绕“信息传递、文化解读、意义建 ...
2026-04-09在数据可视化领域,折线图是展示时序数据、趋势变化的核心图表类型之一,其简洁的线条的能够清晰呈现数据的起伏规律。Python ECh ...
2026-04-09在数据驱动的时代,数据分析早已不是“凭经验、靠感觉”的零散操作,而是一套具备固定逻辑、标准化流程的系统方法——这就是数据 ...
2026-04-09长短期记忆网络(LSTM)作为循环神经网络(RNN)的重要改进模型,凭借其独特的门控机制(遗忘门、输入门、输出门),有效解决了 ...
2026-04-08在数据分析全流程中,数据质量是决定分析结论可靠性的核心前提,而异常值作为数据集中的“异类”,往往会干扰统计检验、模型训练 ...
2026-04-08在数字经济飞速发展的今天,数据已渗透到各行各业的核心场景,成为解读趋势、优化决策、创造价值的核心载体。而数据分析,作为挖 ...
2026-04-08在数据分析全流程中,数据处理是基础,图形可视化是核心呈现手段——前者负责将杂乱无章的原始数据转化为干净、规范、可分析的格 ...
2026-04-07