京公网安备 11010802034615号
经营许可证编号:京B2-20210330
大数据时代,网民上网与“裸奔”无异
只要你的手机里安装了百度、高德等导航软件,无论你在哪里我们都能很快通过手机里App提供的数据找到你。在邬贺铨看来,名字可以造假、身份信息也可以造假,但位置信息是无论如何都掩盖不了的。
“App本身跟位置并没有太多的关系,可是App会强行搜索你的位置信息,而你的位置信息根本屏蔽不了。”邬贺铨解释道。
“那我不是一个人透明人了吗?”听了邬贺铨的演讲,张静自言自语地念叨着。
2015年全球数据泄密的事故1673起,涉及7亿多条数据记录;医疗行业丢失了8000多万份个人隐私数据。阿里研究院数据经济研究中心秘书长潘永花列举出的一组数据更让张静直冒冷汗。
“这不是现实版的《窃听风云》吗?”张静有些后怕,她不知道自己的信息是否已经泄露了。
和张静一样,很多“手机控”在下载安装App时不会注意看授权权限条款,便直接同意安装,就是这么一个简单的动作,App会完成访问通讯录、读取通话记录、读取短信记录、读取位置信息、监听手机通话等一系列行为,一不留神用户的隐私就泄露了。
就像空气和水一样,数据在我们周围自然而然地存在着。每一次点击鼠标,每一次刷卡消费,每一次拨打电话,每一次驾车出行……数据便已生成。我们每一个人既是数据的消费者,也是数据的生产者,每天都生成海量数据。
“只要一上网,我们基本上等同于裸奔。”微软中国首席技术官韦青坦言,只要你掏出手机打开App,你今天去了哪儿、你的电话号码是多少、你的实时位置信息……你在手机上进行的一切动作,都被悄无声息地记录在册。
这个搞技术出身的工程师认为:“我们越是享受数字化的便利,隐私越少。”
拥有用户越多的公司往往掌握的数据也越多。
“现在滴滴公司已经覆盖了全国400多个城市,是全球最大的一站式出行平台,我们掌握了3亿多客户端用户的数据。”滴滴公司副总裁凌亢表示,滴滴公司掌握了所有用户交通出行的信息,包括姓名、实时的位置、手机号码、真实出行的轨迹、单位的地址、家庭住址。
在中国互联网协会秘书长卢卫看来,企业利用App软件收集用户相关数据的行为存在很大争议。
“在数据价值和产权没有明确分类和清晰界定的时候,数据收集者的动机可能被隐藏,数据安全和各类隐私存在着一定的风险。”卢卫表示了担忧。
“当整个国家的各种数据都汇聚到一个人手上的时候,那我感觉他跟恐怖分子没有什么区别。”公安部网络安全保卫局副局长赵林在一场探讨大数据安全的高层分论坛上表达了和卢卫一样忧虑。
同样是在这场大数据安全的高层分论坛上,国家密码管理局商用密码管理办公室副主任安晓龙认为,密码是保障大数据安全的有效手段。据安晓龙介绍,密码技术与核技术、航天技术一直被视作国家安全的三大支撑技术,从国之重器的角度上讲,在身份认证、安全隔离、信息加密等方面有着不可替代的作用。
和安晓龙的观点一样,京东集团首席技术顾问翁志对个人数据保护同样采取加密的手段,存取要控制,形成日志。让系统能够进行日志的回溯,可以回溯到过去的某一个节点,进行实时监控。
数据安全与个人隐私,应该说数据安全这一方面的话题更多地需要技术供应商考虑,但个人隐私绝不只是靠厂家解决。邬贺铨认为不能把保护用户隐私的希望寄托在互联网企业身上,因为它们既是数据管理者又是使用者,这就好比让“裁判员”当“运动员”一样。
邬贺铨认为保护数据最好的方式就是分布式存储,别把所有的东西都放在一个篮子里。“我们现有的数据中心技术是不足的,过去大多数安全分析工具方法是针对小数据设计的,直接把它用到大数据上,处理能力不够,直接用来存储大数据,也并不安全。”
数据保护除了在技术上进行突破外,卢卫认为大数据相关的法律法规还有很大的完善和建设空间,应该完善相应的数据交易规则。
北京航空航天大学法学院院长龙卫球也主张通过立法来保护个人隐私数据,进行数据资产化立法。但龙卫球认为数据只有通过一系列的处理才能产生真正的价值,数据资产化是立法的前提。
在阿里集团安全部技术副总裁杜跃进看来,上网痕迹是大数据非常重要的组成部分,同时对于坏人也最能形成巨大的威慑力,真正的坏人最怕留下痕迹,所以痕迹的留存对保障安全是很重要的,用户本质上并不怕留下痕迹,只是怕痕迹被别有用心的人偷走、滥用。
“保护数据最终的目的是让我们的数据流动起来,产生价值。”
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
在企业数据化运营体系中,同比、环比分析是洞察业务趋势、评估运营效果的核心手段。同比(与上年同期对比)可消除季节性波动影响 ...
2025-12-19在数字化时代,用户已成为企业竞争的核心资产,而“理解用户”则是激活这一资产的关键。用户行为分析系统(User Behavior Analys ...
2025-12-19在数字化转型的深水区,企业对数据价值的挖掘不再局限于零散的分析项目,而是转向“体系化运营”——数据治理体系作为保障数据全 ...
2025-12-19在数据科学的工具箱中,析因分析(Factor Analysis, FA)、聚类分析(Clustering Analysis)与主成分分析(Principal Component ...
2025-12-18自2017年《Attention Is All You Need》一文问世以来,Transformer模型凭借自注意力机制的强大建模能力,在NLP、CV、语音等领域 ...
2025-12-18在CDA(Certified Data Analyst)数据分析师的时间序列分析工作中,常面临这样的困惑:某电商平台月度销售额增长20%,但增长是来 ...
2025-12-18在机器学习实践中,“超小数据集”(通常指样本量从几十到几百,远小于模型参数规模)是绕不开的场景——医疗领域的罕见病数据、 ...
2025-12-17数据仓库作为企业决策分析的“数据中枢”,其价值完全依赖于数据质量——若输入的是缺失、重复、不一致的“脏数据”,后续的建模 ...
2025-12-17在CDA(Certified Data Analyst)数据分析师的日常工作中,“随时间变化的数据”无处不在——零售企业的每日销售额、互联网平台 ...
2025-12-17在休闲游戏的运营体系中,次日留存率是当之无愧的“生死线”——它不仅是衡量产品核心吸引力的首个关键指标,更直接决定了后续LT ...
2025-12-16在数字化转型浪潮中,“以用户为中心”已成为企业的核心经营理念,而用户画像则是企业洞察用户、精准决策的“核心工具”。然而, ...
2025-12-16在零售行业从“流量争夺”转向“价值深耕”的演进中,塔吉特百货(Target)以两场标志性实践树立了行业标杆——2000年后的孕妇精 ...
2025-12-15在统计学领域,二项分布与卡方检验是两个高频出现的概念,二者都常用于处理离散数据,因此常被初学者混淆。但本质上,二项分布是 ...
2025-12-15在CDA(Certified Data Analyst)数据分析师的工作链路中,“标签加工”是连接原始数据与业务应用的关键环节。企业积累的用户行 ...
2025-12-15在Python开发中,HTTP请求是与外部服务交互的核心场景——调用第三方API、对接微服务、爬取数据等都离不开它。虽然requests库已 ...
2025-12-12在数据驱动决策中,“数据波动大不大”是高频问题——零售店长关心日销售额是否稳定,工厂管理者关注产品尺寸偏差是否可控,基金 ...
2025-12-12在CDA(Certified Data Analyst)数据分析师的能力矩阵中,数据查询语言(SQL)是贯穿工作全流程的“核心工具”。无论是从数据库 ...
2025-12-12很多小伙伴都在问CDA考试的问题,以下是结合 2025 年最新政策与行业动态更新的 CDA 数据分析师认证考试 Q&A,覆盖考试内容、报考 ...
2025-12-11在Excel数据可视化中,柱形图因直观展示数据差异的优势被广泛使用,而背景色设置绝非简单的“换颜色”——合理的背景色能突出核 ...
2025-12-11在科研实验、商业分析或医学研究中,我们常需要判断“两组数据的差异是真实存在,还是偶然波动”——比如“新降压药的效果是否优 ...
2025-12-11