Rdkitの紹介
-
Upload
seritaka -
Category
Self Improvement
-
view
993 -
download
12
description
Transcript of Rdkitの紹介
RDKitの紹介
iwatobipen
• 今日はきっかけになればってレベルで。
What is RDKit ?
●オープンソースのchemoinfo tool kitです。 -コアの部分はC++だから早いよ。 -Python2.x ラッパーあるよ。 -機械学習用の記述子色々あるよ。 -カートリッジサポートしてるよ。( PostgreSQL ) ●扱い -OS win/mac/linux サポート。 -GitHubでバージョン管理。 -ML結構活発。
Install
Linux: apt-getとか。Yumは調べてないです。 Windows: 32bit/64bit binariesでOK ! Mac: Homebrew
IPython & PANDAS
幸せの形
Macならこの辺が良いかと Winはバイナリがある。
http://fonnesbeck.github.io/ScipySuperpack/
サンプルデータ
まず読む
114分子読みました。
IPythonConsole使うと分子が インタラクティブに見えまーす
ここで少しデモ タイポ、躓きはご容赦を
駆け足でDIY感のある MMP & Graphics
Test Data
>python rfrag.py < input.txt > frag.txt
>python indexing.py < frag.txt > pair.txt
ある日のメール
やあみんな。 いくつかmmpの機能を追加したよ。 mol_transform.pyはユーザーが セットしたSmilesにMMPを適用して変換するんだ。(超適当)
Hi all, I have added some extra parts to the mmpa contrib. code which has recently been approved for open sourcing by GSK. Also, I have made some minor changes to the existing code but it should all work in the same way. The extra parts are: mol_transform.py This program applies a transform or transforms (generated by the MMP generation program) and applies it to a user set of smiles. This final piece completes the circle, so now you can find MMPs,、、、、、
Transform ( ゚∀゚ )キタ━━━!!!)
さっそくデータ準備
無駄にPANDASを使ってみる。
>python mol_transform.py -f only_pair.txt < beore.txt > after.txt
実行スクリプト ペアファイル 入力 出力
劇的 ビフォー アフター?
できた♪
MMP DB 簡単につくれたらいーねー♪
あるよ
create_mmp_db.py
https://github.com/rdkit/rdkit/tree/master/Contrib/mmpa
>python create_mmp_db.py < your_fragment.txt
これでどうだ!
mmp.dbというファイルができる(sqlite3)
テーブルが四つ出来た
化合物情報入ってる
活用部分 はこれから、、、
次はビジュアル系
某社のTool kit 素敵。
原子の寄与を考えて可視化している
あるある!
matplotlibも必要ですが
APIほぼ丸写しでOK。
カラーマップ指定
contourの荒さ
>python mol_viz.py crizotinib.mol
動け!
こんな感じのビューができます。
Similarity mapも最近報告されてます
FingerPrintの類似性を可視化も可能。
まとめ
Pythonベースで色々できる。 PANDAS/matplotlib/Scikit-learnとの四重奏? 機能はかなりリッチ。 開発が活発。 UGRMの資料もオープンです。 その他 配座発生、ROCS的な扱いもOK 何よりOSS。CADDチームのリソースを侵食しない
御礼
つたない発表にお付き合いいただき ありがとうございました。
追加リファレンス 順不同/全部じゃない
USRCAT: real-time ultrafast shape recognition with pharmacophoric constraints http://www.jcheminf.com/content/4/1/27/abstract Similarity maps - a visualization strategy for molecular fingerprints and machine-learning methods http://www.jcheminf.com/content/5/1/43/abstract hERG Me Out http://pubs.acs.org/doi/abs/10.1021/ci400308z Freely Available Conformer Generation Methods: How Good Are They? http://pubs.acs.org/doi/abs/10.1021/ci2004658 Similarity Boosted Quantitative Structure–Activity Relationship— A Systematic Study of Enhancing Structural Descriptors by Molecular Similarity http://pubs.acs.org/doi/abs/10.1021/ci300182p A Collection of Robust Organic Synthesis Reactions for In Silico Molecule Design http://pubs.acs.org/doi/abs/10.1021/ci200379p
参考URL
APIリファレンス http://www.rdkit.org/docs/index.html ユーザーミーティングスライド おすすめ。 http://www.rdkit.org/UGM/2012/ Wiki http://code.google.com/p/rdkit/w/list