
沪大数据产业补上“核心拼图”
上海数据交易中心股东单位签署战略合作协议。东方网4月2日消息:如果说矿产油气等支撑了实体经济与工业文明,股票证券等催生了发达的虚拟经济,那么在大数据时代,看不见摸不着的数据,正逐渐拥有和之前那些或实或虚的资源同样重要的财富地位。要配置资源,就需要交易;借助市场,就会激发出活力。
正加紧为新经济布局的上海,在昨天迎来了大数据产业生态中最核心的一块“拼图”:经历一年多筹备,上海数据交易中心正式挂牌成立。
数据是如何交易的? 比特该遵循什么规则流动? 上海数据交易中心将催生哪些新的机会? 通过对一系列业内人士的采访,记者正逐步接近答案。
交易对象:“数据画像”的关键几笔
“性别”,100元;“年龄”,120元;“汽车车型”,35元……在上海数据交易中心的临时办公地,大屏幕上显示着一些数据的实时价格,最贵的数据每1000条卖135元,最便宜的则是5元。
虽然刚刚挂牌,这家新型平台已经开始试运转,撮合了不少交易,也形成了不少价格。中心首席执行官汤奇峰向记者解释说:“年龄”数据之所以比较贵,是因为这种数据非常稳定,一次购买,几乎终身可用。而那些低价数据,要么使用价值低,要么获取成本低。
只看到价格,或许仍无法理解数据商品为何物。简单地说,在上海数据交易中心交易的数据,就是某一个或者某一类互联网用户的特征和属性。比如,年龄、收入、所在城市、是否看球、关注什么新闻……这些数据组合起来,就为那个网络世界中的“你”完成了一张画像;其中每一项数据,就仿佛是这张画像中的一根线条。
数据的价值,源于不同维度数据的关联和组合。企业要买数据,是因为它所经营的业务需要获得用户的“数据画像”;而它自己无法绘制出那关键的几笔,就只得向他人购买。比如,有公司想推销剃须刀,于是想在成年男性用户的电脑上投放广告。因此,年龄、性别就是该企业感兴趣的数据。
对任何一桩数据交易的参与者而
言,用户隐私都是不可触碰的“红线”。我国法律虽然未对隐私形成完整规范,但姓名、住址、身份证、电话号码等肯定属于不被法律允许交易的数据。为保护用户隐私、同时也是保护买卖双方不踩“地雷”,上海数据交易中心不但严格拒绝任何隐私数据流动,更通过自主开发的“虚拟ID”技术,将用户的网络画像与其真实身份隔离开———换句话说,企业在买到用户特征数据后,无法倒推、对应到具体的人。
产业地位:“数据经济”的生态枢纽
上海数据交易中心已经明确,未来三年,不会向交易双方收取费用。因此,短期内,数据交易无法为上海增加多少税收和就业岗位。然而,这样一家行业公共平台的价值,本来就不该以直接的“GDP思维”来衡量。
一个繁荣的市场,很可能因为资源的集聚而形成产业高地,数据交易也应该不会例外。市经信委副主任邵志清告诉记者,随着大数据时代的到来,围绕数据资源的流动和利用,应该会有助于形成一套新的经济模式,激发新的发展动能。要领“数据经济”的风气之先,推动数据交易中心的运转将是一个重要的机遇。
作为国家经济、金融、航运、贸易中心和科创中心,上海是目前国内数
据生成与应用的领先地区,拥有全球最大的医联数据共享系统、亚洲第二的证券交易额、世界第一的货物和集装箱吞吐量,同时在数据科学研究、关键技术和产品,以及商业应用创新等方面表现活跃,涌现出一批研究机构和企业。
这些“数据经济”参与者构成的产业生态中,交易平台地位特殊。为了促成交易,它的周边不仅可以衍生出诸如数据挖掘、清洗、建模等生机勃勃的第三方服务商,而且一系列亟待填补的法律和制度空白,都有望通过高密度的交易,在实践中探索出解决方案,比如什么是隐私、数据的产权属于网民还是企业、数据增值收益该如何分配等。
正是看到了这些价值,上海才积极支持数据交易中心建立。因事关重大,这样一个总投资仅2亿元的混合所有制企业的组建方案,甚至搬上了市政府常务会议以审议通过。邵志清表示,目前,上海大数据产业的总体布局是“五位一体”的结构,除数据交易中心,其他还包括创新基地、产业基金、产业联盟、研究中心。昨天,首个产业基地和基金与交易中心一起,落户静安的市北高新园区,而设在浦东张江的产业联盟也同时成立。
上海特色:周密筹备,审慎起步
目前,国内包括贵州、江苏、湖北等许多省份已经组建了各自的大数据交易机构。据预测,到今年底,全国类似的交
易平台数量可能达到15到20个。虽然上海大数据交易中心的筹备工作开始得最早,但组建却较晚,原因何在?
不少第三方专家告诉记者,实际上,上海数据交易中心经过了非常审慎、周密的筹备,在交易规则、交易方式、交易对象等问题上深思熟虑。比如,借助长期的技术研发,上海数据交易中心的数据交易,完全是按照在线、实时、连续、自动的方式完成,保证了数据交易的效率,这种模式在其他同类交易机构中还很少见到。此外,上海数据交易中心在隐私保护、政府监管等方面也制定了极具特色的规则,甚至为保证公信力,中心还特意形成了国资控股、管理层持股、各主要数据提供方参股的混合所有制模式。
有业内人士表示,数据交易中心能为买卖双方提供的价值,主要是提供合规性保障、降低交易成本、提高交易效率。从这三方面出发,上海数据交易中心目前的架构,为它赋予了独特的竞争优势。
汤奇峰说,上海数据交易中心的目标,是成为有全球影响力的交易平台。但在起步阶段,他们的步子还会格外慎重。目前,平台只会向会员开放交易,而要成为会员,都必须经过严格审批。
根据规划,年内,上海数据交易中心的会员数量可能会从目前的200多增加到300。而从目前交易中心的大屏幕上记者看到,“性别”等数据的交易量已经超过100万。
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
在大模型从实验室走向生产环境的过程中,“稳定性” 是决定其能否实用的关键 —— 一个在单轮测试中表现优异的模型,若在高并发 ...
2025-10-15在机器学习入门领域,“鸢尾花数据集(Iris Dataset)” 是理解 “特征值” 与 “目标值” 的最佳案例 —— 它结构清晰、维度适 ...
2025-10-15在数据驱动的业务场景中,零散的指标(如 “GMV”“复购率”)就像 “散落的零件”,无法支撑系统性决策;而科学的指标体系,则 ...
2025-10-15在神经网络模型设计中,“隐藏层层数” 是决定模型能力与效率的核心参数之一 —— 层数过少,模型可能 “欠拟合”(无法捕捉数据 ...
2025-10-14在数字化浪潮中,数据分析师已成为企业 “从数据中挖掘价值” 的核心角色 —— 他们既要能从海量数据中提取有效信息,又要能将分 ...
2025-10-14在企业数据驱动的实践中,“指标混乱” 是最常见的痛点:运营部门说 “复购率 15%”,产品部门说 “复购率 8%”,实则是两者对 ...
2025-10-14在手游行业,“次日留存率” 是衡量一款游戏生死的 “第一道关卡”—— 它不仅反映了玩家对游戏的初始接受度,更直接决定了后续 ...
2025-10-13分库分表,为何而生? 在信息技术发展的早期阶段,数据量相对较小,业务逻辑也较为简单,单库单表的数据库架构就能够满足大多数 ...
2025-10-13在企业数字化转型过程中,“数据孤岛” 是普遍面临的痛点:用户数据散落在 APP 日志、注册系统、客服记录中,订单数据分散在交易 ...
2025-10-13在数字化时代,用户的每一次行为 —— 从电商平台的 “浏览→加购→购买”,到视频 APP 的 “打开→搜索→观看→收藏”,再到银 ...
2025-10-11在机器学习建模流程中,“特征重要性分析” 是连接 “数据” 与 “业务” 的关键桥梁 —— 它不仅能帮我们筛选冗余特征、提升模 ...
2025-10-11在企业的数据体系中,未经分类的数据如同 “杂乱无章的仓库”—— 用户行为日志、订单记录、商品信息混杂存储,CDA(Certified D ...
2025-10-11在 SQL Server 数据库操作中,“数据类型转换” 是高频需求 —— 无论是将字符串格式的日期转为datetime用于筛选,还是将数值转 ...
2025-10-10在科研攻关、工业优化、产品开发中,正交试验(Orthogonal Experiment)因 “用少量试验覆盖多因素多水平组合” 的高效性,成为 ...
2025-10-10在企业数据量从 “GB 级” 迈向 “PB 级” 的过程中,“数据混乱” 的痛点逐渐从 “隐性问题” 变为 “显性瓶颈”:各部门数据口 ...
2025-10-10在深度学习中,“模型如何从错误中学习” 是最关键的问题 —— 而损失函数与反向传播正是回答这一问题的核心技术:损失函数负责 ...
2025-10-09本文将从 “检验本质” 切入,拆解两种方法的核心适用条件、场景边界与实战选择逻辑,结合医学、工业、教育领域的案例,让你明确 ...
2025-10-09在 CDA 数据分析师的日常工作中,常会遇到这样的困惑:某电商平台 11 月 GMV 同比增长 20%,但究竟是 “长期趋势自然增长”,还 ...
2025-10-09Pandas 选取特定值所在行:6 类核心方法与实战指南 在使用 pandas 处理结构化数据时,“选取特定值所在的行” 是最高频的操作之 ...
2025-09-30球面卷积神经网络(SCNN) 为解决这一痛点,球面卷积神经网络(Spherical Convolutional Neural Network, SCNN) 应运而生。它通 ...
2025-09-30