• 如何利用机器学习了解人体免疫系统?

    2018-12-19 16:21:30

    把你的免疫反响看作是一个巨大的机器学习问题,你的身体就是核算机。免疫细胞在你的身体中移动,对它们接触到的各种物质进行取样,从你自己的细胞,到肯定不该该存在的有机体

      把你的免疫反响看作是一个巨大的机器学习问题,你的身体就是核算机。免疫细胞在你的身体中移动,对它们接触到的各种物质进行取样,从你自己的细胞,到肯定不该该存在的有机体细胞。假如免疫细胞遇到的东西不该该是你身体的一部分——例如细菌或病毒——那么身领会出动哪些知道怎么抵挡这些闯入者的细胞。假如有细胞之前从前见过这个入侵者,知道怎么处理它的话,那么你的身领会敏捷繁衍这个细胞数千次——多到足以让它可以在有时间驻守到你全身之前压制住细菌或病毒。一旦入侵者被驱赶,免疫体系就会再次削减这些细胞的数量,坚持满意的储藏——假如细菌东山再起——有满意的免疫步卒再次击退这些入侵者。这个进程可以协助你坚持健康,也或许是让医师更早地发现患者疾病的要害——凭借以云核算为动力的人工智能。本年早些时分,微软宣告与坐落西雅图的健康技能和基因测序公司Adaptive Biotechnologies到达协作,Adaptive Biotechnologies的基因测序仪现在用于检测剩余骨髓瘤——也就是说,细胞会显现现已承受血癌医治的人的细胞并非彻底没有这种疾病。现在,该公司正在考虑的不只仅是追寻一种疾病,方针是断定检测任何或许让你免疫体系遭受重创的东西,从感染到癌症,并且依托微软的机器学习功用来协助它到达这一方针的。人体免疫体系的功用十分强壮,人体体内有二十亿个淋巴细胞,其间称为‘辅佐’T细胞,其他是‘细胞毒素’或许‘杀伤性’T细胞。每个T细胞都可以辨认抗原——也就是免疫体系的触发要素——这些抗原显现进入人体的细菌、病毒、真菌或其他入侵者。每个T细胞可以结合数百种不同的抗原,每种抗原关于不同的细菌或病毒都是独有的。一旦T细胞遭到冲击,(取决于T细胞的类型)它或许会杀死入侵者,或许向数百万其他免疫细胞宣告信号,让这些细胞过来进犯入侵者。当T细胞被激活时,对免疫体系进行快照,通过注意到哪些T细胞受体被激活以及哪些抗原与其结合,可以断定哪种疾病现已侵入了人体。并且,一旦断定了疾病,医师就可以更清楚地知道怎么进行医治。Adaptive Biotechnologies成立于2009年,致力于读取和扫描免疫体系和免疫细胞上的受体。跟着时间的推移,该公司不只追寻免疫受体,并且也开端研讨受体与其结合的抗原之间的联络。通过研讨这种束缚联系,Adaptive Biotechnologies开端朝着可以确诊来自免疫受体的特定疾病的方向尽力着。但随后,依据Adaptive Biotechnologies首席执行官、联合创始人Chad Robins的说法,他们意识到“咱们需求十分复杂的机器学习和核算才干才干真实解决问题——这是Web体量的一个大问题。”微软人工智能与研讨副总裁PeterLee指出,每个人的基因组大约有200GB:“这只是是基因组数据——用于提取的元数据,以及来自成像、可穿戴设备、(与人口规划的基因组数据相关的)患者纵向健康记载的数据来历,是十分巨大的。信息内容远远超出了人类的了解,因而对人工智能和数据剖析的需求的确变得至关重要。”单个血液样本通常会提取约一百万个T细胞,这些T细胞中的每一个在基因上都是与特定抗原受体绑定的。将这些T细胞受体DNA序列的读数翻译成一组抗原,然后将这些抗原完美翻译成疾病状况。,是一个十分十分大的机器学习问题,”Lee弥补说。这时分就需求运用微软的机器学习技能。微软运用的算法是现在用于自然语言翻译的算法。“这与咱们在Bing搜索引擎中所谓的主题辨认技能有一些相似之处,”Lee说。微软运用AdaptiveBiotechnologies的MIRA体系生成练习数据——这些练习数据被用于创立从T细胞受体到抗原的“翻译图”,然后尽或许精确地将这些抗原映射回疾病。这听起来有点笼统,这种做法或许会带来一些详细的优点:假如映射如Adaptive和微软料想的那样起作用了,那么这或许意味着患者在他们知道他们生病了之前就或许被确诊出患有疾病。例如,卵巢癌的症状十分荫蔽,直到晚期才会被发现。通过对患有基因突变(如BRCA1,会让患者患卵巢癌的危险更高)的患者进行先发性检测,这项检测可以提取关于前期癌症的指示性免疫信号。你越早发现疾病,治好的或许性就越高。Adaptive现在正在研讨两种“未满意医疗需求的疾病,要么十分十分难以确诊以及/或许确诊需求医治干涉,而这或许明显影响对患者的护理,”Robins这样表明。Adaptive首要瞄准了一些疾病,一旦模型得到验证,它期望运用相同的体系来累积越来越多的条件。“假如咱们真的可以从中得出确诊成果,那么随后几年咱们就会在接下来的两年、五年以及未来二十年持续推进,”微软的Lee说。一旦一种疾病被破解,机器学习可以是否可以更简单或更快地破解下一种疾病?“让我给你一个既达观又失望的答案。达观的是,躲藏层中的深层神经网络天然生成地学习了一些关于免疫体系工作方式的躲藏结构,然后了解了6种、60种、100种乃至更多疾病之后的某个时分,你只是完结了这种才干的爆破。”从某种程度上说,神经网络或许只是可以了解和解码每种新疾病而不需求再练习。当然,存在一种失望的观念。

       “你也会受阻。在某些时分,新增练习数据的价值和新增核算才干的价值开端消失。有时分,咱们会在机器翻译等范畴看到这一点:几个月前,咱们宣告咱们在翻译英文和普通话方面到达了人类的水平。咱们取得了90%的精确率,但为了取得最终10%,咱们需求2倍的核算才干和2倍的数据……现在我真的不知道咱们在企图将T细胞受体序列映射到抗原到疾病状况方面处于什么样的状况,咱们期望是前者,但也或许是后者,或许某种形式上两者兼有。”尽管没有人知道这个失望或许达观的观念是否正确,但Adaptive估计第一个单一疾病确诊测验将在三年的时间进行,更全面的多病筛查测验将在八到十年的时间。“跟着咱们开端分层次地进行[每项单一疾病测验],一个接一个地进行,在某个时间,一次性完结一切操作的本钱效益、易用性和功率可以到达满意的水平。这将成为一个生物体系的视图,这就是咱们即将尽力的方针,”Robins说。就像你会定时去医师那里进行检查,或许在你到必定岁数的时分被要求进行乳房癌或肠癌筛查,未来你或许会被要求进行一次抽血,通过剖析通知你要注意哪些疾病,乃至通知你曾经从来没置疑有过的症状。Lee说,这个体系乃至有或许确诊出只要十亿分之一或许性的症状,或许是一种全新的疾病。“看起来咱们将会发现那些咱们还没有弄清楚、不常见乃至是从没见过的症状。这些调查关于医学研讨和科学前进的价值问题是咱们想知道的问题。这也是推进着咱们针对那些刚开端生成、或许有助于科学发现的开放式探究。”