从ChemDiv 160万库存中基于Bemis-Murcko聚类工作流程筛选出的30万多样化选择:
- 为整个160万ChemDiv库存中的每个分子生成Bemis-Murcko骨架(BMS)
- 应用REOS、MedChem和PAINS过滤器去除反应性、毒性、混杂性及其他不良结构基团
- 然后应用物理化学性质过滤器去除非药物样分子
- 对于剩余的选择,为每个分子生成Bemis-Murcko骨架(BMS),计算唯一BMS的数量及每个BMS对应的分子数量
- 将选择分为三类以便未来聚类和多样性挑选:
a. 每个唯一BMS对应的单个分子数量:1-3
b. 每个唯一BMS对应的单个分子数量:4-1000
c. 每个唯一BMS对应的单个分子数量:>1000
- 使用RDKit MaxMin算法(Tanimoto,ECFP4,2048位)在每个类别内对每个BMS的单个分子进行迭代选择(即聚类),聚类大小(即每个BMS挑选的单个分子数量)通过公式计算
- 将所有三类选择合并为最终的30万集合