Rdkitの紹介

42
RDKitの紹介 iwatobipen

description

オープンソースのRDKitのちょっとした紹介です。

Transcript of Rdkitの紹介

Page 1: Rdkitの紹介

RDKitの紹介

iwatobipen

Page 2: Rdkitの紹介

• 今日はきっかけになればってレベルで。

Page 3: Rdkitの紹介

What is RDKit ?

●オープンソースのchemoinfo tool kitです。 -コアの部分はC++だから早いよ。 -Python2.x ラッパーあるよ。 -機械学習用の記述子色々あるよ。 -カートリッジサポートしてるよ。( PostgreSQL ) ●扱い -OS win/mac/linux サポート。 -GitHubでバージョン管理。 -ML結構活発。

Page 4: Rdkitの紹介

Install

Linux: apt-getとか。Yumは調べてないです。 Windows: 32bit/64bit binariesでOK ! Mac: Homebrew

Page 5: Rdkitの紹介

IPython & PANDAS

幸せの形

Page 6: Rdkitの紹介

Macならこの辺が良いかと Winはバイナリがある。

http://fonnesbeck.github.io/ScipySuperpack/

Page 7: Rdkitの紹介

サンプルデータ

Page 8: Rdkitの紹介

まず読む

114分子読みました。

Page 9: Rdkitの紹介

IPythonConsole使うと分子が インタラクティブに見えまーす

Page 10: Rdkitの紹介

ここで少しデモ タイポ、躓きはご容赦を

Page 11: Rdkitの紹介
Page 12: Rdkitの紹介

駆け足でDIY感のある MMP & Graphics

Page 13: Rdkitの紹介

Test Data

Page 14: Rdkitの紹介

>python rfrag.py < input.txt > frag.txt

Page 15: Rdkitの紹介

>python indexing.py < frag.txt > pair.txt

Page 16: Rdkitの紹介

ある日のメール

Page 17: Rdkitの紹介

やあみんな。 いくつかmmpの機能を追加したよ。 mol_transform.pyはユーザーが セットしたSmilesにMMPを適用して変換するんだ。(超適当)

Hi all, I have added some extra parts to the mmpa contrib. code which has recently been approved for open sourcing by GSK. Also, I have made some minor changes to the existing code but it should all work in the same way. The extra parts are: mol_transform.py This program applies a transform or transforms (generated by the MMP generation program) and applies it to a user set of smiles. This final piece completes the circle, so now you can find MMPs,、、、、、

Page 18: Rdkitの紹介

Transform ( ゚∀゚ )キタ━━━!!!)

Page 19: Rdkitの紹介

さっそくデータ準備

Page 20: Rdkitの紹介

無駄にPANDASを使ってみる。

Page 21: Rdkitの紹介

>python mol_transform.py -f only_pair.txt < beore.txt > after.txt

実行スクリプト ペアファイル 入力 出力

劇的 ビフォー アフター?

Page 22: Rdkitの紹介

できた♪

Page 23: Rdkitの紹介

MMP DB 簡単につくれたらいーねー♪

Page 24: Rdkitの紹介

あるよ

Page 25: Rdkitの紹介

create_mmp_db.py

https://github.com/rdkit/rdkit/tree/master/Contrib/mmpa

Page 26: Rdkitの紹介

>python create_mmp_db.py < your_fragment.txt

これでどうだ!

mmp.dbというファイルができる(sqlite3)

Page 27: Rdkitの紹介

テーブルが四つ出来た

Page 28: Rdkitの紹介

化合物情報入ってる

Page 29: Rdkitの紹介

活用部分 はこれから、、、

次はビジュアル系

Page 30: Rdkitの紹介

某社のTool kit 素敵。

Page 31: Rdkitの紹介

原子の寄与を考えて可視化している

Page 32: Rdkitの紹介

あるある!

Page 33: Rdkitの紹介
Page 34: Rdkitの紹介

matplotlibも必要ですが

APIほぼ丸写しでOK。

カラーマップ指定

contourの荒さ

Page 35: Rdkitの紹介

>python mol_viz.py crizotinib.mol

動け!

Page 36: Rdkitの紹介

こんな感じのビューができます。

Page 37: Rdkitの紹介

Similarity mapも最近報告されてます

Page 38: Rdkitの紹介

FingerPrintの類似性を可視化も可能。

Page 39: Rdkitの紹介

まとめ

Pythonベースで色々できる。 PANDAS/matplotlib/Scikit-learnとの四重奏? 機能はかなりリッチ。 開発が活発。 UGRMの資料もオープンです。 その他 配座発生、ROCS的な扱いもOK 何よりOSS。CADDチームのリソースを侵食しない

Page 40: Rdkitの紹介

御礼

つたない発表にお付き合いいただき ありがとうございました。

Page 41: Rdkitの紹介

追加リファレンス 順不同/全部じゃない

USRCAT: real-time ultrafast shape recognition with pharmacophoric constraints http://www.jcheminf.com/content/4/1/27/abstract Similarity maps - a visualization strategy for molecular fingerprints and machine-learning methods http://www.jcheminf.com/content/5/1/43/abstract hERG Me Out http://pubs.acs.org/doi/abs/10.1021/ci400308z Freely Available Conformer Generation Methods: How Good Are They? http://pubs.acs.org/doi/abs/10.1021/ci2004658 Similarity Boosted Quantitative Structure–Activity Relationship— A Systematic Study of Enhancing Structural Descriptors by Molecular Similarity http://pubs.acs.org/doi/abs/10.1021/ci300182p A Collection of Robust Organic Synthesis Reactions for In Silico Molecule Design http://pubs.acs.org/doi/abs/10.1021/ci200379p

Page 42: Rdkitの紹介

参考URL

APIリファレンス http://www.rdkit.org/docs/index.html ユーザーミーティングスライド おすすめ。 http://www.rdkit.org/UGM/2012/ Wiki http://code.google.com/p/rdkit/w/list