
医疗大数据爆发点临近:如何保护用户隐私
多年来,我国医疗机构大都各自为政,即便是一个医院内部也很难做到信息共享,如今,国家力推健康医疗大数据的共享和应用,但这又将是一个信息共享和个人隐私的博弈。
“建立国家级人口与健康科学数据共享平台有重大意义。首先,我国优质医疗资源不平衡,如何去了解全国的医疗服务分布,如何在跨省医疗时得到更精准的信息,这类数据对此类宏观政策的制定有着很好的帮助和借鉴;其次,数据更加规范。根据国家的标准去制定、采集和储存数据,使得数据更具准确性和共识性。”1月4日,中国医学科学院北京协和医学院院校长曹雪涛接受《华夏时报》记者采访时表示,医疗大数据的共享是基础,规范发展是关键,安全是核心,如何在数据共享过程中保障个人隐私是需要着重去考虑的重要方面。
医疗数据平台热潮涌动
面对即将到来的“医疗健康大数据”时代,大数据技术与医疗健康产业融合创新的热潮涌动。
医疗大数据
2016年3月,国务院发布的国民经济与社会“十三五”规划纲要中正式提出,实施国家大数据战略。2016年6月,国务院办公厅发布《关于促进和规范健康医疗大数据应用发展的指导意见》(下称《指导意见》),首次把生物学资源和医疗大数据作为国家的基础战略资源,也把它纳入了国家大数据战略的布局。同年8月召开的全国卫生工作会议上,国家主席习近平特别提出了要完善人口健康信息服务体系建设,推进健康医疗大数据应用。10月份,“健康中国2030规划”得以发布,在这个规划里面也把医疗健康大数据应用创新与发展列入了国家一项重要任务。
“2016年,国家召开了一系列的会议,并且出台了一系列关于医疗健康大数据指导原则和相关文件。”曹雪涛表示,国家级的医疗健康大数据平台对我们国家政府的决策,对于病人就诊和医改体系完善、科学研究都会作出应有的贡献。
据记者了解,多年来,我国的防控项目主要应对的是传染病,很少涉及到慢性病,因为数据样本小,慢性病很难统计,更谈不上预防。
“对于卒中的发病情况,高危人群和低危人群相比,它的发病情况高了10倍,2010年到2013年40岁以上卒中发病人群还在增长,项目点还在以4%左右的速度增长,这个增长速度是很难令人想象的。同时,卒中病人里中年人已经占到将近50%。这些数据是我们通过国家人口与健康数据共享平台,经过几百万人的海量数据获得的,覆盖全国所有的省市。”1月4日,全国人大教科文卫副主任委员王陇德在国家人口与健康科学数据共享平台科技资源发布会上表示,多年来,卒中患病率一直没有明确,如今,经过这样一个数据平台提供的大样本数据得到了2%的患病率结果,同时得出结论,卒中病人的数据占比如果控制不好,对国家和家庭的威胁实在太大。
根据这样的数据结果,王陇德的团队给国家领导人写了一封建议信,“筛查和干预中年人的中风风险刻不容缓”,并且得到国家高层的重视,要求重视开展中年人中风筛查,为此,国家开展卒中综合方案,在国家建立区域的防控体系,同时加大中年人筛查干预和防控力度,到2020年,争取建立起全国的防治体系。
据记者了解,在政策和需求驱动下,医疗信息化建设将处于景气上升期,未来几年在医院端电子病历、移动医疗、远程医疗、医学影像等系统的部署将成为行业主要增长点,预计行业将保持在15%-20%左右的增速;同时我国各地市区域医疗信息化平台招投标正在快速展开,预计未来几年公共卫生信息化将保持在20%-30%的高速增长。
个人隐私如何保护?
医疗健康大数据的共享和应用是政府管理、商业发展和技术创新的需要,但也给个人隐私安全带来了威胁,使得医疗领域的大数据共享变成了双刃剑。
根据《指导意见》的设想,数据不能只是躺在某个医院的信息系统中,各家医疗卫生机构的数据应该汇聚到一块;数据也不能只是在健康医疗行业中实现聚合,应该打破卫生计生、工信、民政、公安、社保、环保、食药品监管等部门的壁垒,做到跨部门的数据互联共享;数据还不能只是在公共部门内流转,还应该探索推进“可穿戴设备、智能健康电子产品、健康医疗移动应用等产生的数据资源规范接入人口健康信息平台”。
而这,无疑给卫计委等相关部门提出了一个棘手的课题:如何做好健康医疗大数据的共享和开放工作。
其实,医疗数据共享与个人隐私的矛盾在发达国家同样是个棘手的问题。
2013年,英国曾推出一个Care.data计划,将有关病人的数据采集、汇总,进行共享和使用,但是实施不过3年,2016年7月份,该项目被关停,更多的原因则是隐私方面的问题没有做得很好。首先,对数据的保密性关注不够,比如,对个人隐私进行匿名化和脱敏处理之后,该系统和其他系统关联后,依然可以通过数据挖掘的方式辨别有关病人。其次,项目里没有界定数据开放共享的用处。最后,采集病人的数据信息时,并未征得患者的同意。
“人口健康大数据发展的难题是隐私保护和共享,比如,我们的健康档案建了好多,但我们应用健康档案时出现过好多问题,有时候半年也拿不到一个市区的数据,因为他们要保护隐私。”1月4日,国家人口与健康科学数据共享平台管理中心常务副主任尹岭表示,对于个人隐私,其平台从数据采集到应用均有一套管理制度,比如每个单位只授权一个人管理数据库,责权相对明确,同时,将业务数据导出来作为科研数据使用时,要把个人的姓名、住址等隐私信息去掉。
就此,中国政法大学传播法研究中心研究员朱巍曾表示,我国现行法律仅将“非法公开”作为承担侵权责任的构成要件,虽然有利于大数据隐晦性使用的发展,但也可能导致大数据使用被滥用。为此,建议在立法上尽早引入“被遗忘权”立法观念,将用户作为自己信息的控制者,在不继续使用服务或产品之后,相关信息保有者应立即彻底删除相关信息记录,同时,必须在立法上明确,法律应禁止医疗信息的非法流动。
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
用 SQL 验证业务逻辑:从规则拆解到数据把关的实战指南 在业务系统落地过程中,“业务逻辑” 是连接 “需求设计” 与 “用户体验 ...
2025-09-11塔吉特百货孕妇营销案例:数据驱动下的精准零售革命与启示 在零售行业 “流量红利见顶” 的当下,精准营销成为企业突围的核心方 ...
2025-09-11CDA 数据分析师与战略 / 业务数据分析:概念辨析与协同价值 在数据驱动决策的体系中,“战略数据分析”“业务数据分析” 是企业 ...
2025-09-11Excel 数据聚类分析:从操作实践到业务价值挖掘 在数据分析场景中,聚类分析作为 “无监督分组” 的核心工具,能从杂乱数据中挖 ...
2025-09-10统计模型的核心目的:从数据解读到决策支撑的价值导向 统计模型作为数据分析的核心工具,并非简单的 “公式堆砌”,而是围绕特定 ...
2025-09-10CDA 数据分析师:商业数据分析实践的落地者与价值创造者 商业数据分析的价值,最终要在 “实践” 中体现 —— 脱离业务场景的分 ...
2025-09-10机器学习解决实际问题的核心关键:从业务到落地的全流程解析 在人工智能技术落地的浪潮中,机器学习作为核心工具,已广泛应用于 ...
2025-09-09SPSS 编码状态区域中 Unicode 的功能与价值解析 在 SPSS(Statistical Product and Service Solutions,统计产品与服务解决方案 ...
2025-09-09CDA 数据分析师:驾驭商业数据分析流程的核心力量 在商业决策从 “经验驱动” 向 “数据驱动” 转型的过程中,商业数据分析总体 ...
2025-09-09R 语言:数据科学与科研领域的核心工具及优势解析 一、引言 在数据驱动决策的时代,无论是科研人员验证实验假设(如前文中的 T ...
2025-09-08T 检验在假设检验中的应用与实践 一、引言 在科研数据分析、医学实验验证、经济指标对比等领域,常常需要判断 “样本间的差异是 ...
2025-09-08在商业竞争日益激烈的当下,“用数据说话” 已从企业的 “加分项” 变为 “生存必需”。然而,零散的数据分析无法持续为业务赋能 ...
2025-09-08随机森林算法的核心特点:原理、优势与应用解析 在机器学习领域,随机森林(Random Forest)作为集成学习(Ensemble Learning) ...
2025-09-05Excel 区域名定义:从基础到进阶的高效应用指南 在 Excel 数据处理中,频繁引用单元格区域(如A2:A100、B3:D20)不仅容易出错, ...
2025-09-05CDA 数据分析师:以六大分析方法构建数据驱动业务的核心能力 在数据驱动决策成为企业共识的当下,CDA(Certified Data Analyst) ...
2025-09-05SQL 日期截取:从基础方法到业务实战的全维度解析 在数据处理与业务分析中,日期数据是连接 “业务行为” 与 “时间维度” 的核 ...
2025-09-04在卷积神经网络(CNN)的发展历程中,解决 “梯度消失”“特征复用不足”“模型参数冗余” 一直是核心命题。2017 年提出的密集连 ...
2025-09-04CDA 数据分析师:驾驭数据范式,释放数据价值 在数字化转型浪潮席卷全球的当下,数据已成为企业核心生产要素。而 CDA(Certified ...
2025-09-04K-Means 聚类:无监督学习中数据分群的核心算法 在数据分析领域,当我们面对海量无标签数据(如用户行为记录、商品属性数据、图 ...
2025-09-03特征值、特征向量与主成分:数据降维背后的线性代数逻辑 在机器学习、数据分析与信号处理领域,“降维” 是破解高维数据复杂性的 ...
2025-09-03