
主にケモインフォマティクスで活用できそうな外部データベースのまとめ。
API利用などで一括取得が可能なDB
Pubchem 化合物のデータベース。(APIを使った自動取得が可能) (参考:pubchem から化合物情報を一気に取得する)
ChemSpider 化合物のデータベース。(APIを使った自動取得が可能)
GDB-17,13,11 GDB-11:C,H,N,O,F から構成される原子数(水素は除く)が11個の化合物のデータベース GDB-13:C,H,N.O,D,Cl から構成される原子数(水素は除く)が13個の化合物のデータベース
MoleculeNet 機械学習による分子特性予測をテストするために設計されたベンチマーク用データセット。化学構造と量子化学計算出力値をまとめたデータセット(QM7, QM8, QM9)や 水溶解度(logP)のデータなどが収容。
(おそらく)一括取得不可
Polyinfo 高分子の物性に関するデータベース。利用するには登録が必要。スクレイピングなどのデータの一括取得は基本的には禁止されている。
Bordwell pKa Table pKa のデータベース。構造化データではないため解析に使用するにはデータの整形が必要。
一括取得の可否不明
ZINC15 バーチャルスクリーニング用途に市販化合物を集めたデータベース
ChEMBL 化学構造と生物活性データを集めた、医薬品・医薬品候補化合物データベース
PDB タンパク質の立体構造データベース
- CCDC 低分子や結晶構造のデータベース
- SDBS 有機化合物のスペクトルデータベース
参考
以下のHPの情報を使わせてもらいました。