
精准医学之贝瑞和康基因组“大数据之路”
自基因测序技术被发明以来,建设人类基因组数据库一直是各国基因组研究中心的核心内容之一,人类基因组数据库的宗旨是为从事人类基因组研究的科学家和医护人员提供人类基因组信息。目前国际上人类基因组数据大多来源于西方白种人,然而不同人种的进化差异会导致明显的易感基因差异、特异性位点突变频率不同、基因突变表观差异等,因此在我国分子诊断与精准医学飞速发展的背景下,建立高质量的中国人群基因组数据库已经成为当下制约分子医学发展的重要壁垒。今年两会上,委员也建议应尽快建立精准医学资源库,整合共享医疗大数据,促进精准医学更好的发展。
贝瑞和康作为致力于将高通量测序技术实现临床转化的行业领导者,早在2015年8月14日宣布与云计算服务平台提供商阿里云达成合作,共同打造以海量的中国人群基因组数据为核心的数据云,实现对个人基因组数据的精准解读。该项目由美国贝勒医学院、现任职贝瑞和康CIO的于福利教授牵头,参与“神州基因组数据云”项目的研究人员达到了100多人,由医学、分子生物学、遗传学、计算机编程等研究领域的博士组成。项目组分成三个团队,一个是贝瑞和康的研究团队,一个是于福利在贝勒实验室的团队,另外一个则是专门做高性能运算的阿里云团队。
神州基因组数据云,是一个知识密集型项目。
阿里云拥有批量计算服务的强大能力,贝瑞和康则深耕基因检测多年已积累超过百万人群基因组数据,此次选取其中四十万人份数据作为“神州基因组数据云”项目的第一阶段数据,旨在借助云计算对该数据资源进行深入挖掘,进一步揭示中国人群遗传突变分布,提升中国人遗传疾病诊断的效率和精准程度。
当基因测序成本迅速下降以后,拥有数据量的多少不再是行业里唯一的竞争优势,而是否能够将海量的大数据进行解读,转换成具体能够应用的有效信息,才是测序企业发展的核心竞争力。光有云计算能力和基因组数据还不够,分析和注释技术是能否达成项目目标的内在核心驱动力。该项目发布一年后,也即2016年8月24日贝瑞和康公布了为基因数据分析开发的两大核心专利技术:Verita Trekker®变异位点检测系统和Enliven®变异位点注释系统。
Verita Trekker®经过严格的基因型质量控制,SNP 检测的灵敏度达99.00%,特异性达99.99%,真阳性率达99.90%;Indel 检测的真阳性率达88.00%;家系样本基因型真阳性率大于99.90%;各项指标均属国际业界一流水平。而Enliven®则通过统计学计算和文本挖掘方法整合国际权威的超过50个数据库和预测算法,其中也包括“神州基因组数据云”项目所产生的中国人特有基因信息数据库。同时,支持千万篇文献的即时查找,全面覆盖基因、变异、表型、疾病信息,参考权威文献、美国医学遗传学学会(ACMG)标准与实际基因型-表型对应,在这样完善的体系和先进的算法的保障下,能够出具可靠的变异致病性结果,为科研工作者和临床医生更好的研究和制定精准医疗方案提供帮助。
在Verita Trekker®和Enliven®两大核心技术共同驱动下的“神州基因组数据云”项目取得了阶段性的重要成果。2016年9月8日,贝瑞和康已完成世界首个中国人群基因组数据库建设,填补了国际基因数据库中缺少中国人群特有基因组数据信息的空白。
同年9月23日,在第十九届全国临床肿瘤学大会暨CSCO学术年会上,贝瑞和康进一步展示了该项目的重要成果应用。这其中包括与北京大学肿瘤医院解云涛教授合作的“中国人遗传性乳腺癌基因突变图谱项目”,以及中国40万人基因组大数据项目在临床应用层面上所取得的阶段性成果,结果显示中国人乳腺癌基因突变和其他人种相比具有显著性差异。
项目由解云涛教授和于福利教授共同展示,可以看到采用Enliven®变异位点注释系统对美国国家卫生研究院的相关项目中的BRCA1、BRCA2基因的2152个位点进行注释,将注释结果与以往报告结果对比,PPV(阳性预测值)达到99.3%,充分验证了Enliven®注释和解读能力的准确性。在此基础上,贝瑞和康将自建的中国人基因组数据库与万例妇科肿瘤患者的基因数据进行整合,建设成为全球最大的妇科肿瘤基因组数据库。
现在,神州基因组数据云项目仍在进行中,中国人群的基因组大数据正在成倍累积增长。受益于测序成本下降,降低获得大量数据的难度,因此只要在数据解读能力上快速突破,中国非常有可能在生物基因信息解读这一领域实现弯道超车。
“神州基因组数据云”项目的另一层意义则与我国医疗政策中正在力推的分级诊疗政策息息相关。通过与专家合作,大数据体系为90%以上的医院提供解读能力,这将对基层临床产生重要的指导意义。可以想象,在三四线城市,医生利用该数据云平台分析基因测序数据,在当地可以获得同样质量的检测分析,获得和在大城市大医院同等质量的报告,就能够进一步促进实现分级诊疗。于福利教授展望道。
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
2025 年,数据如同数字时代的 DNA,编码着人类社会的未来图景,驱动着商业时代的运转。从全球互联网用户每天产生的2.5亿TB数据, ...
2025-06-052025 年,数据如同数字时代的 DNA,编码着人类社会的未来图景,驱动着商业时代的运转。从全球互联网用户每天产生的2.5亿TB数据, ...
2025-05-27CDA数据分析师证书考试体系(更新于2025年05月22日)
2025-05-26解码数据基因:从数字敏感度到逻辑思维 每当看到超市货架上商品的排列变化,你是否会联想到背后的销售数据波动?三年前在零售行 ...
2025-05-23在本文中,我们将探讨 AI 为何能够加速数据分析、如何在每个步骤中实现数据分析自动化以及使用哪些工具。 数据分析中的AI是什么 ...
2025-05-20当数据遇见人生:我的第一个分析项目 记得三年前接手第一个数据分析项目时,我面对Excel里密密麻麻的销售数据手足无措。那些跳动 ...
2025-05-20在数字化运营的时代,企业每天都在产生海量数据:用户点击行为、商品销售记录、广告投放反馈…… 这些数据就像散落的拼图,而相 ...
2025-05-19在当今数字化营销时代,小红书作为国内领先的社交电商平台,其销售数据蕴含着巨大的商业价值。通过对小红书销售数据的深入分析, ...
2025-05-16Excel作为最常用的数据分析工具,有没有什么工具可以帮助我们快速地使用excel表格,只要轻松几步甚至输入几项指令就能搞定呢? ...
2025-05-15数据,如同无形的燃料,驱动着现代社会的运转。从全球互联网用户每天产生的2.5亿TB数据,到制造业的传感器、金融交易 ...
2025-05-15大数据是什么_数据分析师培训 其实,现在的大数据指的并不仅仅是海量数据,更准确而言是对大数据分析的方法。传统的数 ...
2025-05-14CDA持证人简介: 万木,CDA L1持证人,某电商中厂BI工程师 ,5年数据经验1年BI内训师,高级数据分析师,拥有丰富的行业经验。 ...
2025-05-13CDA持证人简介: 王明月 ,CDA 数据分析师二级持证人,2年数据产品工作经验,管理学博士在读。 学习入口:https://edu.cda.cn/g ...
2025-05-12CDA持证人简介: 杨贞玺 ,CDA一级持证人,郑州大学情报学硕士研究生,某上市公司数据分析师。 学习入口:https://edu.cda.cn/g ...
2025-05-09CDA持证人简介 程靖 CDA会员大咖,畅销书《小白学产品》作者,13年顶级互联网公司产品经理相关经验,曾在百度、美团、阿里等 ...
2025-05-07相信很多做数据分析的小伙伴,都接到过一些高阶的数据分析需求,实现的过程需要用到一些数据获取,数据清洗转换,建模方法等,这 ...
2025-05-06以下的文章内容来源于刘静老师的专栏,如果您想阅读专栏《10大业务分析模型突破业务瓶颈》,点击下方链接 https://edu.cda.cn/g ...
2025-04-30CDA持证人简介: 邱立峰 CDA 数据分析师二级持证人,数字化转型专家,数据治理专家,高级数据分析师,拥有丰富的行业经验。 ...
2025-04-29CDA持证人简介: 程靖 CDA会员大咖,畅销书《小白学产品》作者,13年顶级互联网公司产品经理相关经验,曾在百度,美团,阿里等 ...
2025-04-28CDA持证人简介: 居瑜 ,CDA一级持证人国企财务经理,13年财务管理运营经验,在数据分析就业和实践经验方面有着丰富的积累和经 ...
2025-04-27