京公网安备 11010802034615号
经营许可证编号:京B2-20210330
大数据时代的用户数据须区别保护_数据分析师
大数据时代,是物联网的时代,随着云存储和云计算的发展,以智能手机、智能家电、可穿戴设备为代表的智能终端的普及,通过各种智能终端上传和收集的用户数据将越来越多,对用户数据的分析和挖掘及利用,将是大数据的商业价值所在,蕴藏和巨大价值的用户数据的性质及使用规则是我们值得思考的问题。
用户数据的“区分所有权”构想
提到用户数据,我们首先想到的是用户的“隐私权”。民法大家王利明教授在其主编的《人格权法新论》一书中提到:隐私权是自然人享有的对其个人的与公共利益无关的个人信息、私人活动和私有领域进行支配的一种人格权。可见隐私权是一项“个体”权益,强调权利的身份和人格的属性。
用户数据的商业价值核心并不是“个人”的人格权益,其必要条件是具备足够多的用户个体样本,其更强调“集合”的权利,单个用户数据的商业价值是有限的。而用户数据的核心价值在于通过对云端存储的海量的用户个人状况、行为、需求的样本分析和挖掘,一方面为上游硬件商提供产品的开发依据,另一方面对用户的消费、生活提供“量身打造”的服务,从而形成物联网的全产业链循环,实现更高效的管理社会资源并创造更多的价值。
可见,虽然用户数据来源于“个体”数据,但最终使社会获益的是用户的“集合”数据。因此,在界定用户数据的性质方面,笔者建议根据单个数据是否具有身份属性,将用户数据分为身份数据和样本数据,并对这两类数据加以区别保护。
用户的身份数据是指可以通过单一的个体数据,即能锁定特定用户的数据。如姓名、身份证号、各种账号信息、联系方式等。比如我们通过一个电话,就能联系到一个特定的用户。因此,此类信息具有较强的身份属性,须定义为“隐私权”的范围,其权利主体应为用户个人所有,其使用和经营,须经过用户的许可,否则将被判定为侵权。现行法律法规如《全国人民代表大会常务委员会关于加强网络信息保护的决定》、工信部出台的《电信和互联网用户个人信息保护规定》以及消费者权益保护法、《网络交易管理办法》中规定的个人信息,当属于用户的身份数据范畴。
样本数据是指通过个体数据汇聚成的用户个人状况、行为、需求的数据库以及通过分析和挖掘以上数据获得的相关数据。此类数据的所有权应为用户和数据收集方共有,但经营使用权建议应掌握在能够发挥其价值的数据收集者手中。将所有权和经营权区分开来,既能从法律上保证用户的个体权益,又符合经济学的原理。
样本数据的经营规则
用户身份数据的使用规则可以依据现有的法律法规执行。我们仅需要通过立法明确以上法律所适用的数据的范围,并在执行层面的政策上制定可操作的保护用户身份数据和隐私权的规章制度。
对于样本数据的使用和经营规则,现有法律并没有明确依据。根据上文的阐述,笔者已将其所有权拟定为用户和数据收集者共有,经营使用权则建议应掌握在能够发挥其价值的数据收集者手中。这样设计的目的在于,一是保留用户的“被遗忘权”;二是发挥物尽其用的作用。
首先,保留用户的“被遗忘权”是用户数据使用的基础。
大数据时代到来,人们最担心的是自己将被暴露得一览无余,没有隐私可言。因此,个体信息是否公开,公开的程度,需要个体能够掌控,即用户自主决定其向外界公开的个人信息的广度和深度,也可随时自行或要求收集数据方,删除其掌握的任何关于用户个体的数据。用户要求收集者删除其样本信息时,须提供可以辨识其个体信息的依据(一般须为身份信息),以证明其要求删除的信息是属于自己的样本信息。
其次,数据收集者在收集样本数据时,须向用户群体公示其收集途径和方式,以及用户删除自己样本信息的途径和方法。只有这样,用户才能知晓其被收集者收集的数据是什么,以及自己的样本信息被经营者使用的状况是否安全,从而判断其是否愿意继续使用数据收集者的产品,并将自己的样本信息交给数据收集者经营。一旦用户选择使用某一数据收集者的产品,数据收集者将与用户共有其收集的用户样本数据。
第三,数据收集者在遵守法律对用户隐私保护前提下,无需用户授权,可自由地使用和经营其收集到的用户的样本数据,直至用户自行或要求其删除样本数据。
当前,各数据收集者之间进行不同程度的共享和授权数据的需求已是大数据的发展趋势。云与云的互联互通才能使数据样本变得足够庞大,使数据分析和挖掘的结果更有价值,使用户不同智能终端之间的连接变得可能,从而真正的实现大数据的物联网。
样本数据的共享和授权中涉及到大量个体信息,如果用户此类活动需要经过个体用户的授权,将会极大地阻碍商业效率,其数据和信息的收集是随时随地的,要求单个用户对单个的样本授权,也会影响用户的体验。因此最现实的方式是数据的收集者在经营和使用其收集的数据时,无需个体用户的单独授权。
最后,数据收集者通过样本数据所获取的收益,个体用户须有分配权。
个体用户对数据经营的收益分配权容易理解。数据的源头是个体,个体是样本数据的所有者,因此其理所应当得到经营数据的利益。分配的方式和数量可由数据收集者确定并公示,一旦用户使用特定数据收集者的产品,即表明其同意以此对价获取收益。当然,用户领取收益的前提是提供可以辨识其个体信息的依据(一般须为身份信息),以证明其是对应个体样本数据的提供者。CDA数据分析师培训官网
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
数据分析师认证考试全面升级后,除了考试场次和报名时间,小伙伴们最关心的就是报名费了,报 ...
2025-12-23CDA中国官网是全国统一的数据分析师认证报名网站,由认证考试委员会与持证人会员、企业会员以及行业知名第三方机构共同合作,致 ...
2025-12-23在Power BI数据可视化分析中,矩阵是多维度数据汇总的核心工具,而“动态计算平均值”则是矩阵分析的高频需求——无论是按类别计 ...
2025-12-23在SQL数据分析场景中,“日期转期间”是高频核心需求——无论是按日、周、月、季度还是年度统计数据,都需要将原始的日期/时间字 ...
2025-12-23在数据驱动决策的浪潮中,CDA(Certified Data Analyst)数据分析师的核心价值,早已超越“整理数据、输出报表”的基础层面,转 ...
2025-12-23在使用Excel数据透视表进行数据分析时,我们常需要在透视表旁添加备注列,用于标注数据背景、异常说明、业务解读等关键信息。但 ...
2025-12-22在MySQL数据库的性能优化体系中,索引是提升查询效率的“核心武器”——一个合理的索引能将百万级数据的查询耗时从秒级压缩至毫 ...
2025-12-22在数据量爆炸式增长的数字化时代,企业数据呈现“来源杂、格式多、价值不均”的特点,不少CDA(Certified Data Analyst)数据分 ...
2025-12-22在企业数据化运营体系中,同比、环比分析是洞察业务趋势、评估运营效果的核心手段。同比(与上年同期对比)可消除季节性波动影响 ...
2025-12-19在数字化时代,用户已成为企业竞争的核心资产,而“理解用户”则是激活这一资产的关键。用户行为分析系统(User Behavior Analys ...
2025-12-19在数字化转型的深水区,企业对数据价值的挖掘不再局限于零散的分析项目,而是转向“体系化运营”——数据治理体系作为保障数据全 ...
2025-12-19在数据科学的工具箱中,析因分析(Factor Analysis, FA)、聚类分析(Clustering Analysis)与主成分分析(Principal Component ...
2025-12-18自2017年《Attention Is All You Need》一文问世以来,Transformer模型凭借自注意力机制的强大建模能力,在NLP、CV、语音等领域 ...
2025-12-18在CDA(Certified Data Analyst)数据分析师的时间序列分析工作中,常面临这样的困惑:某电商平台月度销售额增长20%,但增长是来 ...
2025-12-18在机器学习实践中,“超小数据集”(通常指样本量从几十到几百,远小于模型参数规模)是绕不开的场景——医疗领域的罕见病数据、 ...
2025-12-17数据仓库作为企业决策分析的“数据中枢”,其价值完全依赖于数据质量——若输入的是缺失、重复、不一致的“脏数据”,后续的建模 ...
2025-12-17在CDA(Certified Data Analyst)数据分析师的日常工作中,“随时间变化的数据”无处不在——零售企业的每日销售额、互联网平台 ...
2025-12-17在休闲游戏的运营体系中,次日留存率是当之无愧的“生死线”——它不仅是衡量产品核心吸引力的首个关键指标,更直接决定了后续LT ...
2025-12-16在数字化转型浪潮中,“以用户为中心”已成为企业的核心经营理念,而用户画像则是企业洞察用户、精准决策的“核心工具”。然而, ...
2025-12-16在零售行业从“流量争夺”转向“价值深耕”的演进中,塔吉特百货(Target)以两场标志性实践树立了行业标杆——2000年后的孕妇精 ...
2025-12-15