
支付宝提出数据分享四原则 为大数据“立规矩”
日前上海公共事业缴费机构付费通一纸终止与支付宝合作的公告引发广泛关注,针对付费通指责支付宝“扒数据”的说法,7月1日晚,小微金融服务集团(筹)首席风险官胡晓明在微博回应称:“支付宝从不担心获取数据的途径,更绝不会用不光彩的手段去获取数据。”而借回应之机,胡晓明向外界分享了支付宝、小微金服对大数据的认知,及大数据合作与分享的四条基本原则。
尽管大数据的重要性已是共识,但大部分参与者尚未有成熟应用,因此业内对大数据产业应遵循的基本原则并未形成共识。作为国内大数据行业的领先者,支付宝提出的这几条基本原则,或将为行业的基本规范提供范本。
此前,小微金服已经就大数据的应用进行了诸多探索,并依托大数据打造出了阿里小贷、余额宝等广为人知的产品。今年3月份,马云在给全体员工的一封信中断言,人类社会已经从以控制为出发点的IT时代正在走向激活生产力为目的的DT数据时代。
胡晓明说,IT信息科技是以我为主、方便我管理,而DT时代则是怎么利用数据去支持别人、帮助别人。阿里巴巴从5年前就确定了“开放的数据平台”的战略目标,对小微金服来说,未来十年的定位是帮助建立数据时代的中国新商业发展的基础设施。
当然要作为DT数据科学的基础设施,不意味着要想尽办法去控制甚至用不光彩的手段去获取各种数据。胡晓明说,对小微金服在内的每一个大数据行业参与者来说,首先应该树立起一种理念,即数据只有分享和交换才能产生价值。基于分享和合作,胡晓明说:“我们并不担心获取数据的途径,更绝不会用不光彩的手段去获取数据。”
大数据重在分享和合作这一理念,也戳中了目前一些传统企业的错误认知——认为可以凭借控制数据获取价值。在业内人士看来,带着控制而非分享的理念对待数据,再多的数据也只能“数据大”,而不是大数据。
当然,对大数据的分享和合作并非可以随心所欲,运用大数据的目的是要惠及每一个普通用户,绝不能侵犯到用户隐私,让用户利益受损。因此,对大数据行业来说,在数据价值的开发、分享和运用过程中,应当遵循一些类似“宪法”的基本原则。
胡晓明认为,从小微金服的实践来看,这些基本原则包括:一、客户信息保护原则,所有涉及到客户信息的使用必须建立在客户主动、自愿和授权的基础上;二、客户隐私有效保护原则,绝对保证用户的信息隐私安全;三、数据对等和交换原则、数据分享后要完成回流、增值、再沉淀的过程,使得分享和交换的双方共同受益;四、价值可衡量原则,在数据合作前一定要制定客观的价值评估体系,确保合作公平和公正。
据悉,目前在支付宝的数据使用原则中,所有客户的隐私性数据全部进行过脱敏处理,同时通过信息安全风险监控系统对于未经客户授权的查询、调用情况进行全天候的跟踪、扫描和审计,以确保客户隐私性数据的安全。
大数据的价值在哪里?
在当今信息网络时代,人们的网上操作、平时的一举一动、机器的运转活动、大自然的随时变化都会产生许许多多的数据。这些数据量大且复杂,用现有的计算工具难以处理,人们形象地称之为“大数据”。
对大数据的利用可以提升政府等管理部门的社会管理水平,例如对车辆运行数据的分析利用,可以使城市规划更加科学;流感高发季节,对疾病到来提前预测;旅游旺季,对热门景区高峰期游客数量提前预测,可以提升社会服务水平等。
一项对国际大公司的数据应用研究表明:数据的使用率提升10%,零售业的效率将提升49%,咨询服务业提升39%,航空、食品加工、建筑、钢铁、汽车、出版、基础设施等行业都能提升20%左右。数据的巨大价值由此可见。
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
在数据库日常操作中,INSERT INTO SELECT是实现 “批量数据迁移” 的核心 SQL 语句 —— 它能直接将一个表(或查询结果集)的数 ...
2025-10-16在机器学习建模中,“参数” 是决定模型效果的关键变量 —— 无论是线性回归的系数、随机森林的树深度,还是神经网络的权重,这 ...
2025-10-16在数字化浪潮中,“数据” 已从 “辅助决策的工具” 升级为 “驱动业务的核心资产”—— 电商平台靠用户行为数据优化推荐算法, ...
2025-10-16在大模型从实验室走向生产环境的过程中,“稳定性” 是决定其能否实用的关键 —— 一个在单轮测试中表现优异的模型,若在高并发 ...
2025-10-15在机器学习入门领域,“鸢尾花数据集(Iris Dataset)” 是理解 “特征值” 与 “目标值” 的最佳案例 —— 它结构清晰、维度适 ...
2025-10-15在数据驱动的业务场景中,零散的指标(如 “GMV”“复购率”)就像 “散落的零件”,无法支撑系统性决策;而科学的指标体系,则 ...
2025-10-15在神经网络模型设计中,“隐藏层层数” 是决定模型能力与效率的核心参数之一 —— 层数过少,模型可能 “欠拟合”(无法捕捉数据 ...
2025-10-14在数字化浪潮中,数据分析师已成为企业 “从数据中挖掘价值” 的核心角色 —— 他们既要能从海量数据中提取有效信息,又要能将分 ...
2025-10-14在企业数据驱动的实践中,“指标混乱” 是最常见的痛点:运营部门说 “复购率 15%”,产品部门说 “复购率 8%”,实则是两者对 ...
2025-10-14在手游行业,“次日留存率” 是衡量一款游戏生死的 “第一道关卡”—— 它不仅反映了玩家对游戏的初始接受度,更直接决定了后续 ...
2025-10-13分库分表,为何而生? 在信息技术发展的早期阶段,数据量相对较小,业务逻辑也较为简单,单库单表的数据库架构就能够满足大多数 ...
2025-10-13在企业数字化转型过程中,“数据孤岛” 是普遍面临的痛点:用户数据散落在 APP 日志、注册系统、客服记录中,订单数据分散在交易 ...
2025-10-13在数字化时代,用户的每一次行为 —— 从电商平台的 “浏览→加购→购买”,到视频 APP 的 “打开→搜索→观看→收藏”,再到银 ...
2025-10-11在机器学习建模流程中,“特征重要性分析” 是连接 “数据” 与 “业务” 的关键桥梁 —— 它不仅能帮我们筛选冗余特征、提升模 ...
2025-10-11在企业的数据体系中,未经分类的数据如同 “杂乱无章的仓库”—— 用户行为日志、订单记录、商品信息混杂存储,CDA(Certified D ...
2025-10-11在 SQL Server 数据库操作中,“数据类型转换” 是高频需求 —— 无论是将字符串格式的日期转为datetime用于筛选,还是将数值转 ...
2025-10-10在科研攻关、工业优化、产品开发中,正交试验(Orthogonal Experiment)因 “用少量试验覆盖多因素多水平组合” 的高效性,成为 ...
2025-10-10在企业数据量从 “GB 级” 迈向 “PB 级” 的过程中,“数据混乱” 的痛点逐渐从 “隐性问题” 变为 “显性瓶颈”:各部门数据口 ...
2025-10-10在深度学习中,“模型如何从错误中学习” 是最关键的问题 —— 而损失函数与反向传播正是回答这一问题的核心技术:损失函数负责 ...
2025-10-09本文将从 “检验本质” 切入,拆解两种方法的核心适用条件、场景边界与实战选择逻辑,结合医学、工业、教育领域的案例,让你明确 ...
2025-10-09