京公网安备 11010802034615号
经营许可证编号:京B2-20210330
「海量资料」会红也不是没有塬因的,Facebook每天跟你说「你可能认识的朋友…」、购物网站告诉你「买了这个东西的人也买了….」或显示地方的妈妈们需要什么等等,背后都有海量资料在解算,来自以色列的研究团队还用海量资料来对抗癌症呢!
现代人罹癌的风险高,却苦无有效的疗方。现行的治疗方法,不论是传统化疗、放射性治疗或是靶标药物,都如七伤拳一般,伤敌一千、自损八百,即便消灭了癌症,身体也难以回到塬本的健康状态。如何只杀死癌细胞而不影响身体的正常细胞,仍然是个梦想。一个以色列团队的最新研究,把这个梦想往现实拉近了一大步,研究成果发表在生物学界知名的期刊《Cell》上,有趣的是,主要的研究人员都跨足了资讯工程的领域,因为他们用来对抗癌细胞的工具是「海量资料」的分析技术。
此研究利用一种被称为「合成致死」(Synthetic lethalit)的基因对,意指一对相对应的基因,若二者同时处于去活化状态(inactive),则细胞就无法存活。但只要其中一个基因是活化状态(active)[注],即便另一个去活化,细胞仍为正常存活。很像我们苏花公路的双向单线路段,若一线道封闭,管制一下还是可以通车,双向皆封,路就不通了。
(奇怪的是科学家怎么会把一个专业名词取做「合成致死」这种像二流科幻片的字眼呢?取做「二枪毙命」如何?至少可以从二流的科幻片变成不错的动作喜剧片。)
由于癌症与先天的基因缺陷或后天的基因突变有很大的关联,往往可在癌症细胞内发现去活化的基因,相同的基因在正常细胞内则处于活化状态,此时若以药物手段抑制该基因的「合成致死」配对,就可达到只杀死癌细胞而不影响正常细胞的疗效。
人类的基因组多达20000~25000组,加上基因活化/去活化的变数,产生更多的排列组合可能,来自各个实验及临床的数据形成了「海量资料」,要如何从这「海量资料」中分析出合成致死的基因对,就是本研究的主要课题。
如果二个基因是「合成致死」对,同时处于去活化状态,那么携带这对基因的细胞就已被「致死」了,相关的数据不会被纳入这个海量资料库内,所以研究团队采取反向的操作:首先,在细胞内同时去活化的基因们,彼此间一定不是合成致死对,可以将之排除;再来,研究团队比对暨有的shRNA资料库(shRNA 会抑制基因活化),可做进一步的筛选;最后,利用合成致死基因对的另一个特性:当他们处处活化状态时,常常会同时进行产出蛋白质的动作,称做基因共表现(coexpression),研究人员得以找出合成致死基因对的候选人。
这些以数据分析找到的合成致死基因对与已知的合成致死基因比对,有高度的相符。
一位关键的研究人员在酒醉后接受访问时表示:「塬本我想找到我跟老婆吵架的塬因,因此将会让她生气的行为当作资料库进行分析。这个研究后来失败了,因为会让老婆生气的变因太多,而且还是时间的函数。不过当时开发的软体,意外地适用于分析合成致死基因对的资料库。」(误)
研究团队同时指出,某些用于治疗其他疾病的药物,其实有抑制部份基因活化的作用,若该基因与癌细胞内的去活化基因为合成致命组,那么这些药就有用于治疗癌症的可能。
这个研究成果也开发出一片「旧药新用」的蓝海!(旧药已通过临床测试,所以发现旧药物的新用途比之开发新的药物,节省了许多成本。)
[注]:活化的基因代表会有「基因表现」(gene expression)。而基因表现的解释为基因中的DNA序列生产出蛋白质的过程。步骤大致从DNA转录成mRNA开始,一直到对于蛋白质进行后转译修饰为止。
基因的表现,首先需要将遗传资讯从DNA上转录至信使RNA,然后再通过转运RNA转译成蛋白质。
CDA学员免费下载查看报告全文:2026全球数智化人才指数报告【CDA数据科学研究院】.pdf
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
在大数据技术飞速迭代、数字营销竞争日趋激烈的今天,“精准触达、高效转化、成本可控”已成为企业营销的核心诉求。传统广告投放 ...
2026-04-24在游戏行业竞争白热化的当下,用户流失已成为制约游戏生命周期、影响营收增长的核心痛点。据行业报告显示,2024年移动游戏平均次 ...
2026-04-24 很多业务负责人开会常说“我们要数据驱动”,最后却变成“看哪张报表数据多就用哪个”,往往因为缺乏一套结构性的方法去搭建 ...
2026-04-24在Power BI数据可视化分析中,切片器是连接用户与数据的核心交互工具,其核心价值在于帮助使用者快速筛选目标数据、聚焦分析重点 ...
2026-04-23以数为据,以析促优——数据分析结果指导临床技术改进的实践路径 临床技术是医疗服务的核心载体,其水平直接决定患者诊疗效果、 ...
2026-04-23很多数据分析师每天盯着GMV、DAU、转化率,但当被问到“哪些指标是所有企业都需要的”“哪些指标是因行业而异的”“北极星指标和 ...
2026-04-23近日,由 CDA 数据科学研究院重磅发布的《2026 全球数智化人才指数报告》,被中国教育科学研究院官方账号正式收录, ...
2026-04-22在数字化时代,客户每一次点击、浏览、下单、咨询等行为,都在传递其潜在需求与决策倾向——这些按时间顺序串联的行为轨迹,构成 ...
2026-04-22数据是数据分析、建模与业务决策的核心基石,而“数据清洗”作为数据预处理的核心环节,是打通数据从“原始杂乱”到“干净可用” ...
2026-04-22 很多数据分析师每天盯着GMV、转化率、DAU等数字看,但当被问到“什么是指标”“指标和维度有什么区别”“如何搭建一套完整的 ...
2026-04-22在数据分析与业务决策中,数据并非静止不变的数值,而是始终处于动态波动之中——股市收盘价的每日涨跌、企业月度销售额的起伏、 ...
2026-04-21在数据分析领域,当研究涉及多个自变量与多个因变量之间的复杂关联时,多变量一般线性分析(Multivariate General Linear Analys ...
2026-04-21很多数据分析师精通描述性统计,能熟练计算均值、中位数、标准差,但当被问到“用500个样本如何推断10万用户的真实满意度”“这 ...
2026-04-21在数据处理与分析的全流程中,日期数据是贯穿业务场景的核心维度之一——无论是业务报表统计、用户行为追踪,还是风控规则落地、 ...
2026-04-20在机器学习建模全流程中,特征工程是连接原始数据与模型效果的关键环节,而特征重要性分析则是特征工程的“灵魂”——它不仅能帮 ...
2026-04-20很多数据分析师沉迷于复杂的机器学习算法,却忽略了数据分析最基础也最核心的能力——描述性统计。事实上,80%的商业分析问题, ...
2026-04-20在数字化时代,数据已成为企业决策的核心驱动力,数据分析与数据挖掘作为解锁数据价值的关键手段,广泛应用于互联网、金融、医疗 ...
2026-04-17在数据处理、后端开发、报表生成与自动化脚本中,将 SQL 查询结果转换为字符串是一项高频且实用的操作。无论是拼接多行数据为逗 ...
2026-04-17面对一份上万行的销售明细表,要快速回答“哪个地区卖得最好”“哪款产品增长最快”“不同客户类型的购买力如何”——这些看似复 ...
2026-04-17数据分析师一天的工作,80% 的时间围绕表格结构数据展开。从一张销售明细表到一份完整的分析报告,表格结构数据贯穿始终。但你真 ...
2026-04-16