机器翻译框架 OpenNMT 入门:快速上手
拆解项目代码的时候发现使用到了 onmt 这个古怪东西,查阅资料后才知道这是一个自然机器翻译的框架,是自然语言处理中常用的工具。但是相关资料又太少,于是不得不照着文档一点一点啃,最后留下了这篇笔记。
拆解项目代码的时候发现使用到了 onmt 这个古怪东西,查阅资料后才知道这是一个自然机器翻译的框架,是自然语言处理中常用的工具。但是相关资料又太少,于是不得不照着文档一点一点啃,最后留下了这篇笔记。
本文介绍于 2020 年发表在 Journal of Cheminformatics 上的一篇文章,文章原标题为 SMILES‑based deep generative scaffold decorator for de‑novo drug design,文章通过 MMP 算法得到训练数据,基于 RNN 模型构建了能对分子骨架进行改造的生成模型,模型能够生成具有指定改造位点的分子骨架,并使用分子片段对其改造从而得到新分子。
本文介绍于 2022 年发表在 Nature Communications 上的一篇文章,文章原标题为 Generative deep learning enables the discovery of a potent and selective RIPK1 inhibitor,文章通过构建 CRNN 模型,使用迁移学习、正则化强化和取样强化三种策略针对 RIPK1 靶点生成化合物,并从中得到了潜在的 RIPK1 抑制剂。
最近在折腾 OpenNMT 框架,CUDA 与 PyTorch 都是需要的依赖。虽然网络上已经有大量的 CUDA 安装教程,相信也比我写得全面且详细,但手头上的服务器正巧没有安装 CUDA,索性记录下来以备不时之需。
本文介绍于 2022 年发表在 Nature Machine Intelligence 上的一篇文章,文章原标题为 Improving De Novo Molecular Design with Curriculum Learning,文章介绍了深度学习中的课程学习,并将课程学习的策略用于 REINVENT 模型,相比于强化学习的策略,课程学习对解决复杂任务具有更好效果。
本文介绍于 2022 年发表在 Journal of Chemical Information and Modeling 上的一篇文章,文章原标题为 LibINVENT: Reaction-based Generative Scaffold Decoration for in Silico Library Design,文章基于 RNN 与 RL 构建了能够对分子进行结构改造的模型,模型在经过分子片段数据的训练后,模型能够在分子相应改造位点上连接不同化学结构,是构建虚拟化合物库的有利工具。
本文介绍于 2020 年发表在 Chemical Science 上的一篇文章,文章原标题为 SyntaLinker: automatic fragment linking with deep conditional transformer neural networks,文章将基于语义模型 Transformer 识别并连接分子片段,最终设计了一种分子片段连接工具 SyntaLinker,它能够有效完成有约束的分子片段连接任务。
本文介绍于 2022 年发表在 Journal of Chemical Information and Modeling 上的一篇文章,文章原标题为 De Novo Drug Design Using Reinforcement Learning with Graph-Based Deep Generative Models,文章借鉴了 REINVENT 模型的强化学习策略,将其用于基于图的分子生成模型,得到了较好的结果。
本文介绍于 2022 年发表在 Journal of Medicinal Chemistry 上的一篇文章,文章原标题为 ChemistGA: A Chemical Synthesizable Accessible Molecular Generation Algorithm for Real-World Drug Discovery,文章改进了传统的遗传算法,使其在药物分子生成的任务上具有比深度学习更优的表现效果。
本文介绍于 2019 年发表在 Journal of Cheminformatics 上的一篇文章,文章原标题为 Randomized SMILES strings improve the quality of molecular generative models。