您的购物车当前为空
基于机器学习决策树方法的PPI靶向化合物库
采用机器学习方法(决策树算法)对内部数据库中可靶向PPI的小分子化合物进行预测。该算法被公认为识别PPI活性分子的有效工具,其通过交叉验证方案平衡训练数据集的富集度、灵敏度与特异性,最终筛选出6,500余个结构多样性的PPI靶向化合物。
通过对比非PPI抑制剂与PPI抑制剂的独特物理化学特征,研究发现以下描述符在特定数值范围内与PPI结合剂存在相关性(图1):
• RDF 070m(≤ 3.31)——基于形状的描述符,定义半径为7Å球形空间内原子集合的径向分布函数
• UI(> 4.13)——不饱和指数,与双键、三键及芳香键等多重键数量直接相关
• SHP2(≤ 0.30)——根据几何矩阵距离分布推导的二级平均形状轮廓指数
• Mor11m(> -0.1)——通过不同角度散射函数(信号11/按原子质量加权)计算原子权重总和所得的描述符
基于Timbal、2P2I和iPPIDB数据集进行二维相似性搜索构建的PPI靶向库
通过二维指纹相似性搜索,从内部数据库中提取了超过2,500个类药筛选化合物。该搜索以来自TimbalDB(链接3)、2P2IDB(链接1)和iPPIDB(链接2)的参考化合物集(共18,936个化合物)为目标,相似度阈值为Tanimoto系数85%。所有具有反应性或非活性的化合物均已被排除在此筛选集之外。
该PPI筛选库包含针对以下来自TimbalDB的蛋白质-蛋白质复合物的潜在抑制剂(图3):
- Annexin A2/S100-A10
- Bcl-2 and Bcl-XL with BAX; BAK and BID
- BetaCatenin/Tcf4 & Tcf3
- BRD2/Ack
- BRD4/NUT
- CD80/CD28 (or CTLA-4)
- Clathrin/adaptor & accessory proteins
- c-Myc/Max
- p53/MDM2
- p53/MDMX
- Rac1/GEFs
- Rad51/BRCA2
- S100B/p53
- SOD1 dimer
- TNFa trimer or TNFa/TNFR
- Transthyretin tetramer
- Tubulin dimer
- UL30(Pol)/UL42 subunits of HSV type 1 DNA polymerase
- XIAP/Caspase9 or SMAC (BIR3 domanin)
- ZipA/FtsZ
- CRM1/Rev
- Cyclophilins
- E1/E2
- FKBP1A/FK506
- HIF-1a/p300
- IL-2/IL-2Ra
- Integrins
- Keap1/Nrf2
- K-Ras/SOS1
- MLL/Menin
基于"四规则"的PPI聚焦库
这套包含3000多种潜在PPPI调节剂的筛选库,是基于X. Morelli等人的研究成果构建。研究者通过分析已知PPI抑制剂的分子描述符,提出"四规则"(Ro4)来界定该类化合物的化学空间。根据其定义,符合以下特征的分子属于该空间:分子量≥400道尔顿、计算脂水分配系数≥4、氢键受体≥4、环系数量≥4。该PPI库还特别选用了sp3杂化碳富集的化合物,以确保分子复杂性和三维多样性。
| MW | clogP | HBA | Rings | RotBonds | Fsp3 |
| ≥400 | ≥4 | ≥4 | ≥4 | ≥4 | ≥0.4 |
基于二维相似性搜索的PPI靶向库
该筛选库包含超过13,500种能够抑制蛋白质-蛋白质相互作用(PPI)的化合物。
通过整合Binding DB、Pubmed DB和ChEMBL DB数据库,我们收集了一个参考库(≥4万种),其中包含对以下蛋白质复合物在PPI相关实验中具有活性的有机小分子:
- Menin/Histone-lysine N-methyltransferase MLL
- Importin subunit beta-1/Snurportin-1
- Runt-related transcription factor 1/Core-binding factor subunit beta
- MIF/CD74 (Macrophage migration inhibitory factor and HLA-DR antigens-associated invariant chain)
- Peroxisome proliferator-activated receptor gamma/Nuclear receptor corepressor 2
- Voltage-gated N-type calcium channel alpha-1B subunit/Amyloid beta A4 precursor protein-binding family A member 1
- Peroxisome proliferator-activated receptor gamma/Nuclear receptor coactivator 2
- Peroxisome proliferator-activated receptor gamma/Nuclear receptor coactivator 1
- Ras and Rab interactor 1/Tyrosine-protein kinase ABL1
- Peroxisome proliferator-activated receptor gamma/Nuclear receptor coactivator 3
- Cyclin-dependent kinases regulatory subunit 1/S-phase kinase-associated protein 2
- Tumor suppressor p53/oncoprotein Mdm2
- Keap1/p62
- ORAI1/STIM1
- MDM2/MDMX
- Perilipin-1/ABHD5 (Lipase co-activator protein, abhydrolase domain containing 5 (ABHD5) with perilipin-1 (PLIN1))
- Keap1/Nrf2
- Annexin A2/S100-A10
面向蛋白质相互作用且性质优化的化合物库
针对该筛选库,我们基于Bosc等人2020年发表的研究成果,根据蛋白质相互作用化合物的关键推荐性质,对专有的高通量筛选化合物集合进行了过滤筛选。筛选标准包括:
| aromatic rings | ≤ 6 |
| fused aromatic rings | ≤ 3 |
| rotatable bonds | ≤ 20 |
| heteroatoms | ≤ 12 |
| logP | -7 - 8 |
| logD | -7 - 8 |
| molecular weight | ≥ 300 |
| number of halogens (Br, I, Cl) | ≤ 5 |
| consecutive CH2 units | < 5 |





很棒

|