KyoTexサイエンス
KyoTex独自に開発した創薬加速化プラットフォームVTAL
- 創薬ターゲットの同定、Hit Finding、Hit to Lead、Lead Optimizationのいずれのステップでも活用できる汎用的な創薬プラットフォームとなり得る。
- 独自に開発したactive learning手法により、活性値/物性値の組み合わせの中から、少数のデータでもSAR空間を効率的に探索し、SARモデルを構築。 (*Active Learningに関する論文を多数発表。以下参照。)
- 最先端の機械学習の手法により、SAR空間を最適な形で分割、新規化合物の活性/物性を予測。
- 解釈性のある予測結果 (通常の深層学習を用いた手法では困難)。
KyoTexの創薬研究加速化プラットフォーム「VTAL」はActive Learningとその他の計算化学の Best Practicesに基づいて開発されています。
Active Learningとは、機械学習アルゴリズムを使って得られたSARデータを動的に解析し、より高活性、またはSARのより深い理解に結びつける化合物を提示する手法です。
この手法の利点は、数少ない化合物と実験データから、
可視化が難しい高次元データと実験結果を照らし合わせて有用なパターンを抽出し、
実験結果がない中でも最適な化合物を選べることです。
そして新しい実験データが得られれば、化合物と実験結果の関係のルールを随時更新します。
我々は、こうした仕組みで化合物の特性(高活性や低毒性など)を効率的に予測する機械学習モデルを
少量の実験データから構築できることを独自に見出し、論文を多く発表しています(Future Med Chem 2017など、その他は下記参照)。
創薬加速化プラットフォームVTALは、発表論文の手法をさらに工夫し、高活性化合物を 効率よく選択することを確認しています。
また、医薬品設計者・実験研究者にとって、機械学習の信憑性・信頼性は大きな課題です。
KyoTexはこの課題の重要性を認識し、VTALプラットフォームでは化合物の特性を予測する際に、
予測結果の信頼度・理由となるデータを表示し、医薬品設計者と研究チームが予測結果を
理解できるように開発しています。
Active Learning関連の有査読発表論文
- (2020) Active learning efficiently converges on rational limits of toxicity prediction and identifies patterns for molecule design
Computational Toxicology 15:100129 - (2020) Active learning effectively identifies minimal set of maximally informative and asymptotically performant cytotoxic structure-activity patterns in NCI-60 cell lines
RSC Medicinal Chemistry 11(9):1075-1087 - (2019) Applicability domain of active learning in chemical probe identification: convergence in learning from non-specific compounds and decision rule clarification
Molecules, 24(15):2716 - (2018) Chemogenomic active learning's domain of applicability on small, sparse qHTS matrices: a study using CYP450 and nuclear hormone receptor families
ChemMedChem, 13(6):511-521 ** "VIP paper"受賞 - (2017) Small Random Forest Models for Effective Chemogenomic Active Learning
Journal of Computer Aided Chemistry, 18:124-142 - (2017) Active learning for computational chemogenomics
Future Medicinal Chemistry, 9(4):381-402 ** "Landmark paper"受賞
Active LearningとVTAL関連の発表総説・白書
- (2020) Practical Chemogenomic Modeling and Molecule Discovery Strategies Unveiled by Active Learning
Systems Medicine: Integrative, Qualitative, and Computational Approaches - (2018) Selection of Informative Examples in Chemogenomic Datasets
Methods in Molecular Biology: Computational Chemogenomics - (2018) The Future of Computational Chemogenomics
Methods in Molecular Biology: Computational Chemogenomics - (2018) Parsing Compound-Protein Bioactivity Tables
Methods in Molecular Biology: Computational Chemogenomics
機械学習評価方法の有査読発表論文
- (2018) Classifiers and their metrics quantified
Molecular Informatics, 37(1-2):1700127 ** "Most downloaded paper 2018-2019"受賞 - (2018) Adaptive mining and model building of medicinal chemistry data with a multi-metric perspective
Future Medicinal Chemistry, 10(16):1885-1887