文献总结|药物发现中的匹配分子对分析:方法与当前应用

Category 碎碎念

doi.org/10.1021/acs.jmedchem.2c01787

本文介绍 2023 年由曹东升与侯廷军研究团队发表在 Journal of Medicinal Chemistry 上的一篇展望,文章原标题为 Matched Molecular Pair Analysis in Drug Discovery: Methods and Recent Applications,文章介绍了主要介绍了匹配分子对分析的理论与目前基于匹配分子对分析的实际应用。

匹配分子对(matched molecular pair, MMP)的概念自提出以来,已成为了从化合物中提取药物化学知识并用于指导先导化合物优化的标准方法,MMP 的定义是只在局部具有较小的结构差异的一对化合物。合成化学家、药物化学家借助匹配分子对分析(molecular matched pair analysis, MMPA)的手段,可以从人类研究过的海量化合物中总结出化学改造的方法、化学改造对于化合物性质的影响等重要经验知识。

MMPA 理论

MMP 搜索算法

n

在需要对大量分子数据做 MMPA 时,首要任务就是提取出其中的 MMP,MMP 搜索算法可以分为 3 类:

  1. 预设的变换规则:使用人为设计的切分规则分割分子,寻找分子数据中的 MMP,常用规则如 retrosynthetic combinatorial analysis procedure(RECAP)和 breaking of retrosynthetically interesting chemical substructures(BRICS)。这种方法的局限性也很明显,例如忽略了预设规则以外的 MMP 并且只能处理单点的化学结构变换。
  2. 基于最大公共子结构(maximum common substructure, MCS)的方法:先寻找指定分子的的公共结构,将其设定为固定部分,只有具有公共结构的分子才能构成 MMP,分子中除去公共结构所剩余的结构就是改变部分,所以该方法通常用用于表示化学变换的 SMIRKS 存储 MMP。这种方法的问题在于计算 MCS 的计算开销很大。
  3. 片段与索引(fragmentation and indexing, F+I)方法:该方法是目前寻找 MMP 最通用的方法,主要方法是在两非氢原子间的非环单键处切断,构建 key 与 value 片段的对应索引,通过键值对间的匹配寻找 MMP,具体方法可以参看前文

影响 MMPA 的关键因素

n

MMPA 的基本假设是,分子结构中一些小的结构改变将引起特定物理性质或是生物活性的改变。然而现实中化合物性质改变的原因更为复杂,表现出更为偶然的现象,例如分子改造中的活性悬崖(对分子仅做微小的改造而生物活性变化巨大)等,所以在 MMPA 中也要考虑到许多因素的影响。

  • 分子表示:2D 与 3D 分子结构都被用于 MMPA 研究中,2D 分子描述的主要优点是处理简单,但许多实践表明 3D 分子表示方法表示了分子的空间信息,使其对于微小的结构差异更为敏感,这对 MMPA 十分重要。
  • 环境特征:在早期的研究中,人们认为只有 MMP 中的化学转换改变了分子的性质,因此只针对化学转换进行研究,而没有考虑具体分子。如今人们已经意识到,在 MMPA 还需要考虑具体分子的结构以及改造位点等环境特征,不能只研究 MMP 中的化学转化规则。目前,大部分研究使用分子图或 SMILES 来表示 MMP 中的完整分子,用于 MMPA 研究。除了分子信息以外,也有研究将蛋白口袋的信息也融入 MMPA,这有助于更深入研究 MMP 转化对受体与配体间结合作用影响。
  • 统计显著性:MMPA 的统计分析对于研究 MMP 间性质的变化十分重要,因为一种化学转换可以引起多种性质的改变,多种化学转换也可能使分子的某些性质不发生改变。MMPA 的统计学研究发现,在同一化合物上所做的两个结构改造所产生的影响远不同于单一结构改造影响的加和,这也称为「不可加和性」效应,这意味着简单的单一结构改造间存在着相互作用。不可加和性同样影响了分子的溶解度等性质,在 MMPA 中对可加和性进行统计分析,可以更好地识别药物分子的构效关系与分子中潜在的相互作用。

MMPA 实际应用

MMPA 已经广泛应用在寻找得到目标性质分子所需的化学改造中(ADMET 优化),除了应用在先导化合物优化,MMPA 也用于靶点预测、生物电子等排体替换、构效关系确定、全新药物设计等任务中,这里主要介绍 MMPA 在分子结构改造和全新药物设计中的应用。

匹配分子序列

n

将多个仅具有一个子结构区别的分子组织起来,就得到了匹配分子序列(matching molecular series, MMS),该方法最早被用于药物分子构效关系的分析,将不同 MMS 组织起来还得到形成匹配分子序列图,用于决策分子改造的路线。称为 SAR 转移的方法通过对比两个 MMS 间化合物性质的变化,可以判断替换结构的效果与。

基于 MMPA 的全新药物设计

将 MMP 化学变换规则用于分子生成是全新药物设计中的重要步骤,输入的分子首先被分割为片段,然后通过 MMP 数据库搜索找到相应的化学转换,将这些化学转换用于输入分子就得到了新分子。也有研究提出了基于片段的 MMP 分子生成方法,主要步骤是收集 MMP 片段信息,通过遗传算法等方法合理地相互组合 MMP 片段,得到新分子。

也有研究使用分子骨架和分子骨架以外的子结构来构建分子生成模型,模型是使用 SMILES 的 RNN 模型,第一步是生成正确的分子骨架,第二步在分子骨架上添加结构改造得到正确的分子。此外,MMS 方法可以很容易地将分子分为若干类的类似物,也可以很方便地用于全新药物设计。DeepSARM 模型的目标是寻找生物作用类似而化学结构新颖的类似物,就使用了 MMS 方法,模型同时还考虑了靶点信息,扩大的 MMS 方法的应用范围。

展望

n

分子设计所面临的一个重要难题是如何基于有限的实验数据决定下一步的分子改造,MMPA 有助于人们从已有的分子改造数据中得到化学转换的信息。为了能更好地利用 MMPA,文章提出了以下几点展望:

  1. 将 QSAR 与 MMPA 相结合。QSAR 模型着重于整体的结构特征,MMPA 主要用于确定局部子结构的改变,在一定程度上二者是互补的,在未来 MMPA 也可能对 QSAR 模型的预测有帮助。
  2. 将 MMPA 的概念用于蛋白质等大分子。
  3. 融合 MMPA 相关的分子优化方法,构建自动化的分子优化流程。尽管目前 MMP 已经应用于分子生成,但 MMP 数据的提取等步骤还需要人工处理。文章提出了上图所示的预期 MMPA 工作流程,希望能够实现 MMP 的自动提取、组织、应用和评估。