首页 > 技术知识 > 正文

科学家使用机器学习算法绘制人体中的100亿个细胞来对抗癌症

人工智能算法正帮助科学家绘制出人体100亿个细胞的图谱,试图解开生命是如何从胚胎中产生,或者癌症等疾病是如何显现的奥秘。

纽约纪念斯隆-凯特琳癌症中心(Memorial Sloan Kettering Cancer Center)是一家专注于癌症治疗的研究实验室,其现任主席兼计算与系统生物学教授达娜·佩尔(Dana Pe er)将机器学习描述为构建人类细胞图谱的工具箱。该项目旨在将来自数十亿组织样本细胞的数据转换成3D地图,这样科学家们就可以在最小的单位上看到我们的身体。

生命是从一个受精卵发育而来的。最初的细胞是如何产生近40万亿个细胞来形成一个能移动和思考的人体的?

这个过程在很大程度上可以用细胞分化来描述,在细胞分化过程中,一个干细胞转变成一个特殊的单元,为一个特定的器官执行重要的功能。遗传信息储存在DNA中,并编码到每个细胞中,携带着如何为身体构建不同类型细胞的指令。

尽管科学家们对这个过程有了大致的了解,但他们仍然对它在细胞水平上是如何工作的感到困惑。

“细胞就像微型计算机一样,从周围环境中获取输入,从其他细胞中获取信号和营养”,佩尔周二在温哥华神经信息处理系统会议上说。

“它们有各种各样的蛋白质作为它们的加工设备。它们会做决定,它们之间的相互作用是由它们的生物化学和分子生物学决定的,它们决定是否要增殖,复制更多的自己,分化,进入一个新的细胞类型,激活,或者释放一些分子与另一个细胞交流。它们就像小型电脑,我们想知道它们是如何工作的。”

然而,研究细胞的问题在于它们产生的大量数据。描述来自一个组织样本的细胞中的RNA的遗传密码被表示为一个巨大矩阵中的一系列数字。乍一看,这些矩阵没什么意义,但在人工智能算法的帮助下,它们可以变成3D地图。

常见的机器学习技术和模型,如t-SNE、k-近邻、马尔科夫链,甚至是深度学习,使生物学家能够可视化细胞的行为。描述一个单元格的混乱的数字流现在可以表示为一个清晰的图,它根据单元格类型和功能对数据进行分组。

科学家们已经设法找到了急性淋巴细胞白血病(儿童最常见的癌症)的来源,即一种罕见的细胞类型,这种细胞在1万个细胞中只出现7个。佩尔描述了数据可视化是如何让研究人员发现胰腺细胞的单个突变是如何导致癌症的。

这种突变欺骗了免疫系统,它不再能保护我们的身体免受癌症的侵害。从这些可视化中收集的所有知识可以帮助科学家开发针对癌症等疾病的新药和方法,并加快临床试验的进程。

佩尔希望通过建立人类细胞图谱,它将“成为绘制疾病图谱的健康参考”。她称它为生物学家的“糖果乐园”。但是,尽管机器学习算法已经产生了巨大的影响,但这些技术在模拟数据中的常见模式方面更成功,而不是突出任何异常行为。

“我们的目标不是预测而是理解,而在生物学中,离群值往往是最重要的。“

声明:本文由易百纳技术社区编写,文章内容来自The register,版权归原作者所有,转载请注明出处,如有侵权请联系删除。

科学家使用机器学习算法绘制人体中的100亿个细胞来对抗癌症1

猜你喜欢