京公网安备 11010802034615号
经营许可证编号:京B2-20210330
大数据也有“成长的烦恼”
大数据在深刻地改变着经济社会生活的方方面面。然而,这一互联网新技术,眼下却遭遇数据难以共享等诸多困难。请关注——
盘点当下的高热词,“大数据”是其中之一。然而,大数据却遭遇数据难以共享等诸多困难,数据的公信度和共识性因此打折。同时,大数据在应用、交易、法律环境等方面也面临着不少制度性难题。
“高热”之下有“冰点”
业内专家担忧,大数据“高热”下掩盖着“冰点”,这些“冰点”将阻碍刚刚起步的我国大数据产业的健康成长。
阿里巴巴集团副总裁、数据委员会会长车品觉认为,目前,大数据行业最突出的问题是“只见树木,不见森林”。移动互联网、电商等是“重用”大数据的重点领域,而大部分传统企业对此却缺乏意识,甚至还不清楚如何利用数据。
同时,大数据应用的深度也远远不够。“国内的不少企业仅是利用大数据模型做营销方案,而像谷歌、亚马逊等国际知名企业,已将大数据思维全面融入公司管理。”车品觉说。
找不到数据是数据应用企业面临的普遍困扰。海尔家电产业集团营销总经理宋照伟直言,海尔希望获知用户的多维度行为习惯,但能够掌握的信息渠道仍然狭窄,信息量不够理想。
“拿走数据的多,贡献数据的少。”贵阳大数据交易所执行总裁王叁寿表示,不少企业以保护商业机密或节省数据整理成本等为理由,不愿意交易自身数据,直接导致交易所的数据量不够丰富。
以阿里巴巴旗下的“芝麻信用”为例,其评分依据的数据只来自支付宝平台,本身公信力有限,而其他企业希望能利用支付宝相关数据时,又很难获得。
同样,政府数据公开程度也非常有限。比如,银行在为客户办理信贷业务时,只能查到其在当地的工商信息,无法获知其在外地的情况。
对于个人数据隐私保护、数据权属、政府数据公开等问题,目前尚无明确的规定,因此,纠纷时有发生。
以朱烨诉百度侵权案为例,2015年,网民朱烨发现自己用百度搜索关键词后会收到相关广告推送,因此将百度以侵犯隐私权为由告上法庭。法院一审认定百度侵犯朱烨隐私权,但二审却撤销一审判决。中国政法大学传播法中心研究员朱巍表示,两级法院给出截然相反的判决,说明法律界对此类新情况认识不一致。
三大基础性“缺陷”待弥补
专家从三个方面分析了产生上述问题的原因,并认为这是我国大数据产业发展必须加快弥补的三大基础性“缺陷”:产业信息化尚未完成;“大数据思维”未成行业共识;监管和立法滞后。
IBM大中华区大数据与分析部数据分析产品线主管洪建勋研究发现,目前国内大量客户还停留在将80%的时间用在数据获取上,还缺乏系统化整理,更谈不上“商务智能”应用了。这和企业信息化水平较低有直接关系。
洪建勋介绍,兴于上世纪末发达国家的“商务智能”管理,即“用数据说话”,这种管理方式的普及大大提升了信息化意识和水平。
中国社会科学院信息化研究中心秘书长姜奇平表示,信息化是大数据的基础,而信息化的推进都是先从消费者开始,然后才传导到企业和政府。农业、工业、能源等行业的数据化还需假以时日。
车品觉表示,现在企业大多将大数据作为工具,导致“要数据的不知道大数据从哪里来,做数据的不知道大数据如何用,用数据的人担心真实性不敢用”。
也正是因为“大数据思维”未能达成共识,数据互惠共利的环境难以形成,推动数据共享就比较艰难。
大数据产业发展之快难以想象,但对于数据权属、个人数据隐私、政府数据公开等,目前都缺乏具有针对性的法律法规。而且,大数据作为新型资源,目前还没有明确专门的监管部门。
“企业和政府收集的数据拿来交易,这个数据究竟是谁的?比如政府收集了企业的数据,那么这些数据是企业的还是政府的?国家鼓励数据交易,但在法律方面要进一步明确,让行业发展有法律依据。”王叁寿说。
朱巍介绍,现在对个人数据的保护,大多依照2012年通过的“关于加强网络信息保护的决定”,这已远远不能适应目前行业的发展现状。
加快发展探索成长之路
业内人士认为,我国大数据产业在目前乃至较长一段时间或都处于“成长烦恼期”,这也是大数据产业从稚嫩走向成熟的必经阶段。因此,要在加快发展中探索成长之路。
从规模上看,2015年我国大数据市场仅有102亿元,不及一家股份制银行一年的净利润。而在国内以及境外的资本市场上,还没有出现中国的大数据行业巨头。
关于大数据应用问题,清华大学数据科学研究院执行副院长韩亦舜表示,大数据产业仍在起步阶段,随着社会信息化程度加深,数据源也将更加丰富,大数据应用范围将不断扩大。
“随着经济转型升级,势必有越来越多的企业将借助大数据实现增长。”IBM大中华区大数据与分析部大数据与分析业务技术总监刘胜利表示。
对于大数据共享的困境,业内专家指出,这在全球都是一个难题。目前,我国正探索建立大数据交易所,以交易驱动数据共享;有的行业内部已经形成企业间互换数据的惯例,如我国参与的国际间卫星数据交换交易、移动互联网公司间的数据互换等。春节期间,微信支付、支付宝、百度钱包等联手诸多商家推出促销活动,本质上也是一种数据互换、互惠共利。
另外,可以借鉴国外经验,对政府数据进行更好的挖掘、利用,如将非涉密的政府数据放在网上,供社会查阅。
在大数据立法与监管层面,业内人士建议,应确定监管部门,完善相关立法。在立法短时间难以完成的情况下,应加紧制定有关大数据的标准、规则、指引,引导行业规范发展,加强隐私保护,促进政府数据开放。
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
在主成分分析(PCA)、因子分析等降维方法中,“成分得分系数矩阵” 与 “载荷矩阵” 是两个高频出现但极易混淆的核心矩阵 —— ...
2025-11-12大数据早已不是单纯的技术概念,而是渗透各行业的核心生产力。但同样是拥抱大数据,零售企业的推荐系统、制造企业的设备维护、金 ...
2025-11-12在数据驱动的时代,“数据分析” 已成为企业决策的核心支撑,但很多人对其认知仍停留在 “用 Excel 做报表”“写 SQL 查数据” ...
2025-11-12金融统计不是单纯的 “数据计算”,而是贯穿金融业务全流程的 “风险量化工具”—— 从信贷审批中的客户风险评估,到投资组合的 ...
2025-11-11这个问题很有实战价值,mtcars 数据集是多元线性回归的经典案例,通过它能清晰展现 “多变量影响分析” 的核心逻辑。核心结论是 ...
2025-11-11在数据驱动成为企业核心竞争力的今天,“不知道要什么数据”“分析结果用不上” 是企业的普遍困境 —— 业务部门说 “要提升销量 ...
2025-11-11在大模型(如 Transformer、CNN、多层感知机)的结构设计中,“每层神经元个数” 是决定模型性能与效率的关键参数 —— 个数过少 ...
2025-11-10形成购买决策的四个核心推动力的是:内在需求驱动、产品价值感知、社会环境影响、场景便捷性—— 它们从 “为什么买”“值得买吗 ...
2025-11-10在数字经济时代,“数字化转型” 已从企业的 “可选动作” 变为 “生存必需”。然而,多数企业的转型仍停留在 “上线系统、收集 ...
2025-11-10在数据分析与建模中,“显性特征”(如用户年龄、订单金额、商品类别)是直接可获取的基础数据,但真正驱动业务突破的往往是 “ ...
2025-11-07在大模型(LLM)商业化落地过程中,“结果稳定性” 是比 “单次输出质量” 更关键的指标 —— 对客服对话而言,相同问题需给出一 ...
2025-11-07在数据驱动与合规监管双重压力下,企业数据安全已从 “技术防护” 升级为 “战略刚需”—— 既要应对《个人信息保护法》《数据安 ...
2025-11-07在机器学习领域,“分类模型” 是解决 “类别预测” 问题的核心工具 —— 从 “垃圾邮件识别(是 / 否)” 到 “疾病诊断(良性 ...
2025-11-06在数据分析中,面对 “性别与购物偏好”“年龄段与消费频次”“职业与 APP 使用习惯” 这类成对的分类变量,我们常常需要回答: ...
2025-11-06在 CDA(Certified Data Analyst)数据分析师的工作中,“可解释性建模” 与 “业务规则提取” 是核心需求 —— 例如 “预测用户 ...
2025-11-06在分类变量关联分析中(如 “吸烟与肺癌的关系”“性别与疾病发病率的关联”),卡方检验 P 值与 OR 值(比值比,Odds Ratio)是 ...
2025-11-05CDA 数据分析师的核心价值,不在于复杂的模型公式,而在于将数据转化为可落地的商业行动。脱离业务场景的分析只是 “纸上谈兵” ...
2025-11-05教材入口:https://edu.cda.cn/goods/show/3151 “纲举目张,执本末从。” 若想在数据分析领域有所收获,一套合适的学习教材至 ...
2025-11-05教材入口:https://edu.cda.cn/goods/show/3151 “纲举目张,执本末从。” 若想在数据分析领域有所收获,一套合适的学习教材至 ...
2025-11-04【2025最新版】CDA考试教材:CDA教材一级:商业数据分析(2025)__商业数据分析_cda教材_考试教材 (cdaglobal.com) ...
2025-11-04