使用此“柠檬”进行机器学习创造更好的药物

普渡大学的研究人员创建了一个名为Lemon的新系统,用于快速挖掘生物分子相互作用数据,并与机器学习方法一起用于药物设计。

使用机器学习进行药物开发的挑战之一是为计算机创建一个过程,以从一组数据点中提取所需的信息。药物科学家必须提取生物学数据并训练软件,以了解典型的人体将如何与结合在一起的药物相互作用而形成药物。

普渡大学的药物发现研究人员创建了一个新的框架,用于挖掘用于训练机器学习模型的数据。名为柠檬的框架可帮助药物研究人员更好地挖掘蛋白质数据库(PDB),该数据库是一种具有14万多个生物分子结构的综合资源,每周都会发布新的结构。该研究成果发表在2019年10月15日的《生物信息学》(Bioinformatics)版上。

普渡大学的药物发现研究人员创建了一个新的框架,用于挖掘用于训练机器学习模型的数据。

普渡大学理学院分析与物理化学助理教授高拉夫·乔普拉(Gaurav Chopra)说:“ PDB是药物发现界的必备工具,”他与普渡大学药物发现研究所的其他研究人员合作,并领导了创建柠檬的团队。“问题在于,整理所有累积的数据可能要花费大量时间。机器学习可以提供帮助,但是您仍然需要一个强大的框架,计算机可以从中快速分析数据,以帮助创建安全有效的药物。”

Lemon软件平台是具有Python绑定的快速C ++ 11库,可在数分钟内挖掘PDB。在PDB中加载所有传统的mmCIF文件大约需要290分钟,但是,在8核计算机上应用简单的工作流程时,Lemon大约需要6分钟。Lemon允许用户编写自定义功能,将其包含在其软件套件中,并以标准方式开发自定义功能,从而为整个科学界生成独特的基准测试数据集。

与Chopra合作开发该平台的化学博士学位的乔纳森·芬(Jonathan Fine)说:“存放在PDB中的实验结构为结构和计算生物学的科学和教育界带来了许多进步,有助于推动药物开发和其他领域的发展。”“我们创建的Lemon是一站式商店,可以快速挖掘整个数据库并提取对开发药物至关重要的有用的生物学信息。”

Lemon之所以得名,是因为它最初旨在为药物设计软件创建基准测试集,并在PDB中识别柠檬,无法很好建模的生物分子相互作用。

软件开发工作是涉及Chopra及其团队的健康创新的最新项目。Lemon在GitHub上免费提供。详细文档可用。

乔普拉还与普渡大学研究基金会技术商业化办公室合作,为其实验室的其他创新申请了专利。

郑重声明:本文版权归原作者所有,转载文章仅为传播更多信息之目的,如作者信息标记有误,请第一时间联系我们修改或删除,多谢。