京公网安备 11010802034615号
经营许可证编号:京B2-20210330
大数据时代如何防止“数据裸奔”
社交娱乐、资讯阅读、网络购物、旅游攻略、美食烹饪、健身跑步、讲座课程……在智能手机加载不同种类的APP应用后,人们的生活开始变得方便快捷、多姿多彩。然而,大数据、云计算、人工智能等新技术的运用,在充分发挥数据价值的同时,也给个人隐私保护带来严峻挑战,数据产业的发展和个人信息安全之间出现了失衡。
隐私or便利
互联网上的“透明人”
“中国人更加开放,对隐私问题没有那么敏感,很多情况下他们愿意用隐私交换便利性。”今年3月,一位知名互联网企业负责人在公开场合谈到个人信息保护的问题。然而,这一言论迅速击中了网民的痛点:在大数据时代,普通网民究竟还有没有隐私?我们如何保护个人信息?
日常生活中,人们也常常面临“选择”:是否同意获取个人信息。使用一个简单的应用程序,注册一个网络账号,都会让用户提供手机号码、身份证号、银行卡号等隐私信息。
安装一个新的APP,使用前先要收到一连串的提醒:“允许发送通知”“允许访问位置”“允许获得手机通讯录”“允许启用电话、短信、相机”……尽管用户可以选择“同意”或者“不同意”,但用户一旦选择了“不同意”,很多APP便自动退出不再提供服务。
甚至发在个人朋友圈中的照片,都有可能被他人恶意盗取。近日有媒体曝光称,大量来自朋友圈、QQ空间或者微博上的私人照片,正在被放在网上低价出售,甚至被非法用于商业广告或婚恋网站。对此,有网友感叹:“原来,我们一直在互联网上‘裸奔’!”
网上个人信息泄露还可能引发次生灾害,成为精准诈骗的帮凶。一些人把个人隐私信息当成赚钱的工具,通过售卖越权获取的用户信息获得巨额利润,并由此形成了黑色产业链。如何提高网络安全性,保护用户的个人信息,成为互联网时代人们的核心关切。
北京大学互联网发展研究中心主任田丽认为,随着互联网技术的快速普及,传统问题向互联网延伸,线上向线下延伸,人类空间向虚拟空间延伸。人们在互联网上变成了“透明人”,个人的一举一动都被互联网“记录在案”,导致人们在网络空间越来越缺乏安全感。
“每个人在网络中都无所遁形。”中国互联网协会个人信息保护工作委员会秘书长李美燕谈到,“数据爬虫”爬进了千家万户,人们发出的每一条信息,浏览的每一个痕迹,都不再是自己独有的存储记录,而是变成他人接近你的路标。国内外频频高发的个人信息保护事件,使个人信息保护态势更加严峻。
利用vs保护
大数据时代的安全困局
如何在大数据时代加强个人信息保护工作,也是互联网行业的热点难点议题。在7月10日至12日召开的2018中国互联网大会上,主管部门、专家学者和相关企业对个人信息保护这一话题进行了深入探讨。
有专家表示,以互联网为代表的信息通信技术深度渗透到经济社会的方方面面,海量数据时刻记录着人们生产生活,并通过数据的分析与挖掘为网民提供个性化、精准性的服务。但在大数据时代,开发的力度越大,数据面临的风险就越大,失衡现象就愈发严重和常见。
“个人信息正在被大规模地电子化、数字化和产业应用化。”工业和信息化部信息通信管理局副局长隋静谈到,当前,随着大数据、云计算等数字技术的迅猛发展,信息采集的广度和深度不断拓展,信息流动日益突破地域和行业,对个人信息保护和安全保障提出了严峻挑战。非法获取、泄露甚至倒卖公民个人信息等侵害公民个人信息安全的恶劣事件时有发生,网络安全问题日益凸显。
中国互联网协会个人信息保护工作委员会主任委员周汉华指出,在数据沉睡时代,个人数据实际处于未被开发的受保护状态。进入大数据时代之后,数据无处不在。它多点采集、多场景使用、多人经手、跨国界、跨边界、跨业务线,保护难度很大。“如何处理好大数据的发展和个人信息的保护,是一个基础性的问题,是一个关键的选择。”周汉华说。
“个人信息保护严格来讲是由于利益驱动导致如此复杂。”清华大学法学院院长申卫星指出,工业4.0社会将数据比作石油,财富发挥作用,不可避免会引起个人信息的侵害。个人信息保护难点是很多个人信息覆在一定的数据之上,例如数据的传输、数据的利用,个人信息保护面临着平衡问题。
申卫星谈到,以手机应用告知为例,过去是信息告知不充分,现在是信息告知过于充分,让用户不胜其烦,不得不点击同意“从民法学的角度来讲,一切权利取自于企业和私人,一切的限制必须有正当的理由和程序,否则仅仅为了行业的发展需要数据的使用,就可以肆意侵害个人信息,显然是违背了现代法学的基本理念。”
制度and立法
个人信息保护任重道远
个人信息安全问题也是全球共同关注的话题。今年5月,欧盟开始实施针对个人信息保护的《通用数据保护条例》,为各国政府加强对公民个人信息的监管与保护提供了重要的立法范式。与会专家表示,解决大数据时代的个人信息安全问题,还要从制度设计上着手,完善体制机制和法律法规,让个人信息保护有法可依。
“人人都是连接器,数据随时都在产生,数据创造了价值,也改变了我们的生活。”腾讯集团大数据法务合规中心总经理王小夏讲到,大数据时代,人们都是实名社交,网络变成了实名型的环境。互联网公司有责任保护好用户的隐私,这就可以通过产品功能设计去保护用户的隐私,一开始就要把隐私保护纳入业务设计和流程设计之中。
隋静提出,工业和信息化部作为行业主管部门,将着力完善个人信息保护的规章制度。同时希望互联网企业严格遵守法律法规,持续优化用户隐私政策,按照合法正当必要的原则,调用手机权限,切实有效维护好用户合法权益。
“激发数据保护的积极性,建立激励相容的制度。”周汉华建议,个人信息保护法最重要的就是设计机制,要通过内生机制,充分调动企业或者数据控制者保护数据的积极性。
“要强化制度设计,把个人数据以及隐私的立法放在数字经济背景下来考量,建立一套保障机制体系和具体落实政策。”中国人民大学法学院副院长杨东认为,大数据正在成为重要的生产资料,把生产资料利用好是一个非常浩大的工程,需要进行制度设计,提高数字经济立法。
北京航空航天大学法学院院长龙卫球指出,我们将来数据立法的完善,要确保数据保护的三大底线,一是必要的个人信息和隐私保护底线,二是信息社会保护底线,三是信息和数据安全以及其他公共利益的底线。
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
近日,由 CDA 数据科学研究院重磅发布的《2026 全球数智化人才指数报告》,被中国教育科学研究院官方账号正式收录, ...
2026-04-22在数字化时代,客户每一次点击、浏览、下单、咨询等行为,都在传递其潜在需求与决策倾向——这些按时间顺序串联的行为轨迹,构成 ...
2026-04-22数据是数据分析、建模与业务决策的核心基石,而“数据清洗”作为数据预处理的核心环节,是打通数据从“原始杂乱”到“干净可用” ...
2026-04-22 很多数据分析师每天盯着GMV、转化率、DAU等数字看,但当被问到“什么是指标”“指标和维度有什么区别”“如何搭建一套完整的 ...
2026-04-22在数据分析与业务决策中,数据并非静止不变的数值,而是始终处于动态波动之中——股市收盘价的每日涨跌、企业月度销售额的起伏、 ...
2026-04-21在数据分析领域,当研究涉及多个自变量与多个因变量之间的复杂关联时,多变量一般线性分析(Multivariate General Linear Analys ...
2026-04-21很多数据分析师精通描述性统计,能熟练计算均值、中位数、标准差,但当被问到“用500个样本如何推断10万用户的真实满意度”“这 ...
2026-04-21在数据处理与分析的全流程中,日期数据是贯穿业务场景的核心维度之一——无论是业务报表统计、用户行为追踪,还是风控规则落地、 ...
2026-04-20在机器学习建模全流程中,特征工程是连接原始数据与模型效果的关键环节,而特征重要性分析则是特征工程的“灵魂”——它不仅能帮 ...
2026-04-20很多数据分析师沉迷于复杂的机器学习算法,却忽略了数据分析最基础也最核心的能力——描述性统计。事实上,80%的商业分析问题, ...
2026-04-20在数字化时代,数据已成为企业决策的核心驱动力,数据分析与数据挖掘作为解锁数据价值的关键手段,广泛应用于互联网、金融、医疗 ...
2026-04-17在数据处理、后端开发、报表生成与自动化脚本中,将 SQL 查询结果转换为字符串是一项高频且实用的操作。无论是拼接多行数据为逗 ...
2026-04-17面对一份上万行的销售明细表,要快速回答“哪个地区卖得最好”“哪款产品增长最快”“不同客户类型的购买力如何”——这些看似复 ...
2026-04-17数据分析师一天的工作,80% 的时间围绕表格结构数据展开。从一张销售明细表到一份完整的分析报告,表格结构数据贯穿始终。但你真 ...
2026-04-16在机器学习无监督学习领域,Kmeans聚类因其原理简洁、计算高效、可扩展性强的优势,成为数据聚类任务中的主流算法,广泛应用于用 ...
2026-04-16在机器学习建模实践中,特征工程是决定模型性能的核心环节之一。面对高维数据集,冗余特征、无关特征不仅会增加模型训练成本、延 ...
2026-04-16在数字化时代,用户是产品的核心资产,用户运营的本质的是通过科学的指标监测、分析与优化,实现“拉新、促活、留存、转化、复购 ...
2026-04-15在企业数字化转型、系统架构设计、数据治理与AI落地过程中,数据模型、本体模型、业务模型是三大核心基础模型,三者相互支撑、各 ...
2026-04-15数据分析师的一天,80%的时间花在表格数据上,但80%的坑也踩在表格数据上。 如果你分不清数值型和文本型的区别,不知道数据从哪 ...
2026-04-15在人工智能与机器学习落地过程中,模型质量直接决定了应用效果的优劣——无论是分类、回归、生成式模型,还是推荐、预测类模型, ...
2026-04-14