自2018年推出以来,Facebook的机器学习框架Pythorch得到了很好的利用,应用范围从为Elon Musk的自动汽车提供动力到推动机器人农业项目
现在制药公司阿斯利康(AstraZeneca)透露了其内部工程师团队如何利用Pythorch,并同样为重要的努力:简化和加速药物发现。
将Pythorch与Microsoft Azure机器学习相结合,阿斯利康的技术可以梳理大量数据,获得关于药物、疾病、基因之间复杂联系的新见解,蛋白质或分子。
这些见解被用来喂养http://www.zdnet.com/article/what-is-ai-everything-you-need-to-know-about-artificial-intelligence/“target=”\u blank“>算法,反过来,向科学家推荐一系列针对特定疾病的药物靶点,供科学家在实验室中进行试验。
这种方法可以在药物发现等领域取得巨大进展,目前为止,这一领域一直是基于昂贵和耗时的反复试验方法。
通常,要想研制出一种新的药物来对抗特定的疾病,科学家必须在实验室里测试不同的蛋白质设计和组合,直到找到有效的解决方案——这就是为什么从一种药物的想法到一种可以上市的药物需要10到15年的时间。另一方面,阿斯利康的算法可以立即识别出科学家对某一特定疾病应该关注的十大药物靶点。
随着科学家能够获取的推动其研究的数据量呈指数级增长,实现药物发现的自动化尤其有用。分析日益增长的数据库,以了解它们如何为药物发现提供信息,正成为一项超人的任务。
Gavin Edwards,阿斯利康的机器学习工程师,告诉ZDNet:“每年,研究人员可获得的科学信息和数据的数量都在增长。通过利用人工智能和机器学习工具(如Pythorch和Azure),我们可以快速地从多个来源提取、组合和解释信息,以便得出比手动分析这些数据更好更快的科学结论。“
许多可用的数据都是非结构化文本,这正是Pythorch的用武之地。Facebook开发的基于Python编程语言的软件包,是一个开源的机器学习库,对于在计算机视觉和自然语言处理(NPL)等领域从事高强度数据科学任务的开发人员来说尤其有用。
阿斯利康的NPL团队使用Pythorch来定义和训练生物医学文本挖掘算法,这些算法可以在数据中工作,找到模式和趋势,并最终构建手头的信息。
然后将数据输入到知识图中,该图能够智能地将信息包连接在一起,从而使每个数据点都具有情境性。它就像一张信息网,它可以反映每一项数据的属性——基因、蛋白质、疾病、化合物——也可以反映不同类别之间的关系。
换句话说,知识图全面地组织了手头的所有科学数据。阿斯利康的工程师利用Microsoft Azure Machine Learning的计算能力,利用知识图训练一种算法,向科学家推荐新药靶标。
“我们将公共领域的研究和我们的内部研究合并成一个图形,可以轻松地对复杂信息进行编码,”爱德华兹说在机器上学习,我们可以训练机器学习模型来推荐新的药物靶点,并有助于为管道决策提供信息。”
药物发现的推荐算法对于那些在实验室里不断试验新药设计的科学家来说无疑是一个巨大的节省时间的承诺。但是爱德华兹和他的团队也希望他们正在创建的知识图可以帮助研究人员找到新的联系,探索新的路径,测试未经证实的理论,而不会浪费太多时间。
知识图可以缩小以详细查看问题的一个方面,还可以扩展以提供跨不同研究分支的更广泛的视角。因此,研究人员可以很容易地获得未开发的信息,这些信息可以为他们的项目带来额外的价值。
“我们的知识图允许研究人员提出有关基因、疾病、药物和安全信息的关键问题,以帮助确定和优先考虑药物靶点,”爱德华兹说而且,随着我们的数据和知识的不断发展,我们的图表也将不断发展,这意味着每一个新的实验都将受益于以前所学的一切。”
因此,这项技术的范围可能是巨大的。在全球流感大流行的背景下,这是一个值得坚持的好消息。