京公网安备 11010802034615号
经营许可证编号:京B2-20210330
医疗大数据爆发点临近:如何保护用户隐私
多年来,我国医疗机构大都各自为政,即便是一个医院内部也很难做到信息共享,如今,国家力推健康医疗大数据的共享和应用,但这又将是一个信息共享和个人隐私的博弈。
“建立国家级人口与健康科学数据共享平台有重大意义。首先,我国优质医疗资源不平衡,如何去了解全国的医疗服务分布,如何在跨省医疗时得到更精准的信息,这类数据对此类宏观政策的制定有着很好的帮助和借鉴;其次,数据更加规范。根据国家的标准去制定、采集和储存数据,使得数据更具准确性和共识性。”1月4日,中国医学科学院北京协和医学院院校长曹雪涛接受《华夏时报》记者采访时表示,医疗大数据的共享是基础,规范发展是关键,安全是核心,如何在数据共享过程中保障个人隐私是需要着重去考虑的重要方面。
医疗数据平台热潮涌动
面对即将到来的“医疗健康大数据”时代,大数据技术与医疗健康产业融合创新的热潮涌动。
医疗大数据
2016年3月,国务院发布的国民经济与社会“十三五”规划纲要中正式提出,实施国家大数据战略。2016年6月,国务院办公厅发布《关于促进和规范健康医疗大数据应用发展的指导意见》(下称《指导意见》),首次把生物学资源和医疗大数据作为国家的基础战略资源,也把它纳入了国家大数据战略的布局。同年8月召开的全国卫生工作会议上,国家主席习近平特别提出了要完善人口健康信息服务体系建设,推进健康医疗大数据应用。10月份,“健康中国2030规划”得以发布,在这个规划里面也把医疗健康大数据应用创新与发展列入了国家一项重要任务。
“2016年,国家召开了一系列的会议,并且出台了一系列关于医疗健康大数据指导原则和相关文件。”曹雪涛表示,国家级的医疗健康大数据平台对我们国家政府的决策,对于病人就诊和医改体系完善、科学研究都会作出应有的贡献。
据记者了解,多年来,我国的防控项目主要应对的是传染病,很少涉及到慢性病,因为数据样本小,慢性病很难统计,更谈不上预防。
“对于卒中的发病情况,高危人群和低危人群相比,它的发病情况高了10倍,2010年到2013年40岁以上卒中发病人群还在增长,项目点还在以4%左右的速度增长,这个增长速度是很难令人想象的。同时,卒中病人里中年人已经占到将近50%。这些数据是我们通过国家人口与健康数据共享平台,经过几百万人的海量数据获得的,覆盖全国所有的省市。”1月4日,全国人大教科文卫副主任委员王陇德在国家人口与健康科学数据共享平台科技资源发布会上表示,多年来,卒中患病率一直没有明确,如今,经过这样一个数据平台提供的大样本数据得到了2%的患病率结果,同时得出结论,卒中病人的数据占比如果控制不好,对国家和家庭的威胁实在太大。
根据这样的数据结果,王陇德的团队给国家领导人写了一封建议信,“筛查和干预中年人的中风风险刻不容缓”,并且得到国家高层的重视,要求重视开展中年人中风筛查,为此,国家开展卒中综合方案,在国家建立区域的防控体系,同时加大中年人筛查干预和防控力度,到2020年,争取建立起全国的防治体系。
据记者了解,在政策和需求驱动下,医疗信息化建设将处于景气上升期,未来几年在医院端电子病历、移动医疗、远程医疗、医学影像等系统的部署将成为行业主要增长点,预计行业将保持在15%-20%左右的增速;同时我国各地市区域医疗信息化平台招投标正在快速展开,预计未来几年公共卫生信息化将保持在20%-30%的高速增长。
个人隐私如何保护?
医疗健康大数据的共享和应用是政府管理、商业发展和技术创新的需要,但也给个人隐私安全带来了威胁,使得医疗领域的大数据共享变成了双刃剑。
根据《指导意见》的设想,数据不能只是躺在某个医院的信息系统中,各家医疗卫生机构的数据应该汇聚到一块;数据也不能只是在健康医疗行业中实现聚合,应该打破卫生计生、工信、民政、公安、社保、环保、食药品监管等部门的壁垒,做到跨部门的数据互联共享;数据还不能只是在公共部门内流转,还应该探索推进“可穿戴设备、智能健康电子产品、健康医疗移动应用等产生的数据资源规范接入人口健康信息平台”。
而这,无疑给卫计委等相关部门提出了一个棘手的课题:如何做好健康医疗大数据的共享和开放工作。
其实,医疗数据共享与个人隐私的矛盾在发达国家同样是个棘手的问题。
2013年,英国曾推出一个Care.data计划,将有关病人的数据采集、汇总,进行共享和使用,但是实施不过3年,2016年7月份,该项目被关停,更多的原因则是隐私方面的问题没有做得很好。首先,对数据的保密性关注不够,比如,对个人隐私进行匿名化和脱敏处理之后,该系统和其他系统关联后,依然可以通过数据挖掘的方式辨别有关病人。其次,项目里没有界定数据开放共享的用处。最后,采集病人的数据信息时,并未征得患者的同意。
“人口健康大数据发展的难题是隐私保护和共享,比如,我们的健康档案建了好多,但我们应用健康档案时出现过好多问题,有时候半年也拿不到一个市区的数据,因为他们要保护隐私。”1月4日,国家人口与健康科学数据共享平台管理中心常务副主任尹岭表示,对于个人隐私,其平台从数据采集到应用均有一套管理制度,比如每个单位只授权一个人管理数据库,责权相对明确,同时,将业务数据导出来作为科研数据使用时,要把个人的姓名、住址等隐私信息去掉。
就此,中国政法大学传播法研究中心研究员朱巍曾表示,我国现行法律仅将“非法公开”作为承担侵权责任的构成要件,虽然有利于大数据隐晦性使用的发展,但也可能导致大数据使用被滥用。为此,建议在立法上尽早引入“被遗忘权”立法观念,将用户作为自己信息的控制者,在不继续使用服务或产品之后,相关信息保有者应立即彻底删除相关信息记录,同时,必须在立法上明确,法律应禁止医疗信息的非法流动。
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
近日,由 CDA 数据科学研究院重磅发布的《2026 全球数智化人才指数报告》,被中国教育科学研究院官方账号正式收录, ...
2026-04-22在数字化时代,客户每一次点击、浏览、下单、咨询等行为,都在传递其潜在需求与决策倾向——这些按时间顺序串联的行为轨迹,构成 ...
2026-04-22数据是数据分析、建模与业务决策的核心基石,而“数据清洗”作为数据预处理的核心环节,是打通数据从“原始杂乱”到“干净可用” ...
2026-04-22 很多数据分析师每天盯着GMV、转化率、DAU等数字看,但当被问到“什么是指标”“指标和维度有什么区别”“如何搭建一套完整的 ...
2026-04-22在数据分析与业务决策中,数据并非静止不变的数值,而是始终处于动态波动之中——股市收盘价的每日涨跌、企业月度销售额的起伏、 ...
2026-04-21在数据分析领域,当研究涉及多个自变量与多个因变量之间的复杂关联时,多变量一般线性分析(Multivariate General Linear Analys ...
2026-04-21很多数据分析师精通描述性统计,能熟练计算均值、中位数、标准差,但当被问到“用500个样本如何推断10万用户的真实满意度”“这 ...
2026-04-21在数据处理与分析的全流程中,日期数据是贯穿业务场景的核心维度之一——无论是业务报表统计、用户行为追踪,还是风控规则落地、 ...
2026-04-20在机器学习建模全流程中,特征工程是连接原始数据与模型效果的关键环节,而特征重要性分析则是特征工程的“灵魂”——它不仅能帮 ...
2026-04-20很多数据分析师沉迷于复杂的机器学习算法,却忽略了数据分析最基础也最核心的能力——描述性统计。事实上,80%的商业分析问题, ...
2026-04-20在数字化时代,数据已成为企业决策的核心驱动力,数据分析与数据挖掘作为解锁数据价值的关键手段,广泛应用于互联网、金融、医疗 ...
2026-04-17在数据处理、后端开发、报表生成与自动化脚本中,将 SQL 查询结果转换为字符串是一项高频且实用的操作。无论是拼接多行数据为逗 ...
2026-04-17面对一份上万行的销售明细表,要快速回答“哪个地区卖得最好”“哪款产品增长最快”“不同客户类型的购买力如何”——这些看似复 ...
2026-04-17数据分析师一天的工作,80% 的时间围绕表格结构数据展开。从一张销售明细表到一份完整的分析报告,表格结构数据贯穿始终。但你真 ...
2026-04-16在机器学习无监督学习领域,Kmeans聚类因其原理简洁、计算高效、可扩展性强的优势,成为数据聚类任务中的主流算法,广泛应用于用 ...
2026-04-16在机器学习建模实践中,特征工程是决定模型性能的核心环节之一。面对高维数据集,冗余特征、无关特征不仅会增加模型训练成本、延 ...
2026-04-16在数字化时代,用户是产品的核心资产,用户运营的本质的是通过科学的指标监测、分析与优化,实现“拉新、促活、留存、转化、复购 ...
2026-04-15在企业数字化转型、系统架构设计、数据治理与AI落地过程中,数据模型、本体模型、业务模型是三大核心基础模型,三者相互支撑、各 ...
2026-04-15数据分析师的一天,80%的时间花在表格数据上,但80%的坑也踩在表格数据上。 如果你分不清数值型和文本型的区别,不知道数据从哪 ...
2026-04-15在人工智能与机器学习落地过程中,模型质量直接决定了应用效果的优劣——无论是分类、回归、生成式模型,还是推荐、预测类模型, ...
2026-04-14