背景
高达20%的天然产物处于类药五原则(Ro5)之外的化学空间,通常会在先导化合物优化阶段被淘汰。然而,许多此类天然产物类药物仍显示出治疗危重疾病的潜力(例如作为HIV蛋白酶抑制剂、抗癌药物和心脏兴奋剂等应用)。天然产物具有极高的结构多样性。与典型的合成类药小分子相比,天然产物通常具有更多sp3杂化的桥头原子、更多手性中心、更高的氧含量但更低的氮含量、更高的分子量、更多的氢键供受体、更低的计算脂水分配系数(cLogP)值、更高的分子刚性,且更倾向于脂环结构而非芳环结构。
天然化合物中显著的分子骨架多样性与类药特性,为在药物发现和先导化合物优化所需的优势化学空间内,构建新型天然产物衍生化合物库提供了设计基础(图1)。
图1. 2019年9月30日前获得批准的小分子药物(自1981年1月1日起),n=1394(图片来源:《天然产物杂志》2020年第83卷第3期770-803页)。
化合物库设计
此筛选库的设计基于二维指纹相似性过滤比对天然化合物支架,参考集来自Specnet、TARGETMOL、SELECKCHEM、ICC、AnalytiCon Discovery、TimTec及COCONUT等商业数据库。通过应用塔尼莫特相似度85%的阈值,最终从内部数据库中筛选出约11,400个结构多样化的化合物。
图2. 2021年FDA批准药物按化学结构分类示意图。本化合物库中的部分示例与今年获批的两种药物具有相似性。