“これから”のライフサイエンス研究とバイオインフォマティクス (Next...

90
© 2013 DBCLS Licensed under CC 表示 2.1 日本 #NGLSBI “これから” ライフサイエンス研究と バイオインフォマティクス 坊農 秀雅 情報・システム研究機構(ROIS) ライフサイエンス統合データベースセンター (DBCLS) Pictures from http://g86.dbcls.jp/togopic/ 1 Next Generation Life Science & Bioinformatics

description

2013年12月9日に富山大学杉谷キャンパスにて市民公開学術講演としてお話した際に使用したスライドです。

Transcript of “これから”のライフサイエンス研究とバイオインフォマティクス (Next...

Page 1: “これから”のライフサイエンス研究とバイオインフォマティクス (Next Generation Life Science & Bioinformatics)

© 2013 DBCLS Licensed under CC 表示 2.1 日本

#NGLSBI

“これから”の ライフサイエンス研究と バイオインフォマティクス

坊農 秀雅 情報・システム研究機構(ROIS)

ライフサイエンス統合データベースセンター(DBCLS)Pictures from

http://g86.dbcls.jp/togopic/!1

Next Generation Life Science & Bioinformatics

Page 2: “これから”のライフサイエンス研究とバイオインフォマティクス (Next Generation Life Science & Bioinformatics)

© 2013 DBCLS Licensed under CC 表示 2.1 日本

#NGLSBI

坊農秀雅•読み: ぼうのうひでまさ •趣味: 道の駅&温泉巡り、スキー、元鉄オタ •専門: ‒バイオインフォマティクス ‒ゲノム生物学(微生物→マウス、最近は昆虫)

•ドメイン: bonohu.jp

!2 bonohu!! [email protected]

• twitter可 •ハッシュタグは

#NGLSBI

Page 3: “これから”のライフサイエンス研究とバイオインフォマティクス (Next Generation Life Science & Bioinformatics)

© 2013 DBCLS Licensed under CC 表示 2.1 日本

#NGLSBI

本日のお題

1. ライフサイエンス研究の現状

2. バイオインフォマティクスとは

3. これからのライフサイエンス研究とバイオインフォマティクス

!3

Page 4: “これから”のライフサイエンス研究とバイオインフォマティクス (Next Generation Life Science & Bioinformatics)

© 2013 DBCLS Licensed under CC 表示 2.1 日本

#NGLSBI

1. ライフサイエンス研究の現状

Page 5: “これから”のライフサイエンス研究とバイオインフォマティクス (Next Generation Life Science & Bioinformatics)

© 2013 DBCLS Licensed under CC 表示 2.1 日本

#NGLSBI

Nature 464, 670-671 (2010)

!5

Page 6: “これから”のライフサイエンス研究とバイオインフォマティクス (Next Generation Life Science & Bioinformatics)

© 2013 DBCLS Licensed under CC 表示 2.1 日本

#NGLSBI

DNA塩基配列解読の超高速化•かつてはSanger法 •最近は「次世代シーケンサー(NGS)」 ‒Illumina: Sequence By Synthesis

• http://www.youtube.com/watch?v=womKfikWlxM

‒Life Technologies(Applied Biosystems) •ヌクレオチドがDNA鎖に取り込まれる過程でポリメラーゼによって放出される水素イオンを検出

• https://www.youtube.com/watch?v=MxkYa9XCvBQ

‒PacBio: 一分子・リアルタイム(SMRT®)検出 • https://www.youtube.com/watch?v=NHCJ8PtYCFc

!6

Page 7: “これから”のライフサイエンス研究とバイオインフォマティクス (Next Generation Life Science & Bioinformatics)

© 2013 DBCLS Licensed under CC 表示 2.1 日本

#NGLSBI

exomeの例

!7

Page 8: “これから”のライフサイエンス研究とバイオインフォマティクス (Next Generation Life Science & Bioinformatics)

© 2013 DBCLS Licensed under CC 表示 2.1 日本

#NGLSBI

whole genomeの例

!8

Page 9: “これから”のライフサイエンス研究とバイオインフォマティクス (Next Generation Life Science & Bioinformatics)

© 2013 DBCLS Licensed under CC 表示 2.1 日本

#NGLSBI

遺伝医学の入門書•遺伝医学やさしい系統講義18講 ‒例えば… ‒単一遺伝子疾患とメンデル遺伝学 ‒多因子疾患の遺伝学 ‒エピジェネティックス ‒集団遺伝学 ‒薬理遺伝学・ゲノム薬理学 ‒遺伝カウンセリング ‒など

!9

Page 10: “これから”のライフサイエンス研究とバイオインフォマティクス (Next Generation Life Science & Bioinformatics)

© 2013 DBCLS Licensed under CC 表示 2.1 日本

#NGLSBI

個人ゲノム解読: 新たな問題も

!10

Page 11: “これから”のライフサイエンス研究とバイオインフォマティクス (Next Generation Life Science & Bioinformatics)

© 2013 DBCLS Licensed under CC 表示 2.1 日本

#NGLSBI

MiSeq• Illumina社のデスクトップ次世代シーケンサ •富山大学にも導入済み •最新の v3 試薬だと1runで ‒300塩基(base) ‒5000万リード ‒→15 Gb(参考: ヒトハプロイドゲノム 約3Gb)

!11

Page 12: “これから”のライフサイエンス研究とバイオインフォマティクス (Next Generation Life Science & Bioinformatics)

© 2013 DBCLS Licensed under CC 表示 2.1 日本

#NGLSBI

次世代シーケンサからのデータ•FASTQフォーマットのファイル ‒4行/readが基本単位 ‒MiSeq v3 •5000万リードx4行 •=2億行

•ファイルサイズも2Gbyte/file超 ‒FAT32フォーマットでは扱えない

•いわゆる「開く」ことが不可能!12

SRR001356.1 2023DAAXX:5:1:123:563 length=33 TGTCGGTCCAGCTCGGCCTTGGGCTCCGTTTTC +SRR001356.1 2023DAAXX:5:1:123:563 length=33 -IIIIIIII8IIIIIIIIIII6IIIIIIIII9I @SRR001356.2 2023DAAXX:5:1:123:476 length=33 TCTGAACCCGACTCCCTTTCGATCGGCCGCGGG +SRR001356.2 2023DAAXX:5:1:123:476 length=33 IIIIIIIIIIIIIIIIIIIIIGIIIIIII-III @SRR001356.3 2023DAAXX:5:1:121:746 length=33 GTGGCAGCGTTTTTGGGCCCGCCGCTTGCCGTT +SRR001356.3 2023DAAXX:5:1:121:746 length=33 IIIII&IIIIIIIIIIIIIIIIHI1IIIIIIII

Page 13: “これから”のライフサイエンス研究とバイオインフォマティクス (Next Generation Life Science & Bioinformatics)

© 2013 DBCLS Licensed under CC 表示 2.1 日本

#NGLSBI

(・́ω`・)困ッタナァ...

Page 14: “これから”のライフサイエンス研究とバイオインフォマティクス (Next Generation Life Science & Bioinformatics)

© 2013 DBCLS Licensed under CC 表示 2.1 日本

#NGLSBI

2. バイオインフォマティクス とは?

Page 15: “これから”のライフサイエンス研究とバイオインフォマティクス (Next Generation Life Science & Bioinformatics)

© 2013 DBCLS Licensed under CC 表示 2.1 日本

#NGLSBI

バイオインフォマティクスとは•コンピュータを実験デバイスとして使って、生物学的に有意な結論を引き出そうとする学問 ‒坊農秀雅(2002)

•計算機科学の技術を応用して生物学の問題を解こうとする学問 ‒日本語版Wikipedia(2013/12/7版)

!15

Page 16: “これから”のライフサイエンス研究とバイオインフォマティクス (Next Generation Life Science & Bioinformatics)

© 2013 DBCLS Licensed under CC 表示 2.1 日本

#NGLSBI

バイオインフォマティクスの教科書1. バイオインフォマティクスの歴史と全貌 2. 配列の収集と蓄積 3. 対にした配列のアラインメント 4. 配列アラインメントの確率的,統計的解析入門 5. 多重配列アラインメント 6. 類似配列のデータベース検索 7. 系統推定 8. RNA二次構造の予測 9. 遺伝子予測と遺伝子調節 10.タンパク質の分類と構造予測 11.ゲノム解析 12.PerlとPerlモジュールを用いたバイオインフォマティクス・プログラミング 13.マイクロアレイの解析

!16

Page 17: “これから”のライフサイエンス研究とバイオインフォマティクス (Next Generation Life Science & Bioinformatics)

© 2013 DBCLS Licensed under CC 表示 2.1 日本

#NGLSBI

バイオインフォマティクスの範疇

!17

シミュレーション

イメージ解析

!

パスウェイ解析

遺伝子発現解析

!

アミノ酸配列解析 塩基配列解析

Page 18: “これから”のライフサイエンス研究とバイオインフォマティクス (Next Generation Life Science & Bioinformatics)

© 2013 DBCLS Licensed under CC 表示 2.1 日本

#NGLSBI

(かつての)バイオインフォマティクス研究者の職種別分類

•アルゴリズム屋!–方法を考える人!–「NP完全」がキーワード!

•実装屋!–プログラムやツールを書く人!

•解析屋!–プログラムを使って実際に生データを相手に手を動かす人

!18

数学的 抽象的

生物的 具体的ライフサイエンス研究

者の範疇!18

Page 19: “これから”のライフサイエンス研究とバイオインフォマティクス (Next Generation Life Science & Bioinformatics)

© 2013 DBCLS Licensed under CC 表示 2.1 日本

#NGLSBI

あなたも バイオインフォマティクス研究者!

!19

Page 20: “これから”のライフサイエンス研究とバイオインフォマティクス (Next Generation Life Science & Bioinformatics)

© 2013 DBCLS Licensed under CC 表示 2.1 日本

#NGLSBI

!20

Page 21: “これから”のライフサイエンス研究とバイオインフォマティクス (Next Generation Life Science & Bioinformatics)

© 2013 DBCLS Licensed under CC 表示 2.1 日本

#NGLSBI

0. 他力本願

!21

Photo by Hidemasa Bono on Dec.08, 2013

1. コピペ系

2. コマンドライン系3. ガチ系

バイオインフォマティクス研究者の分類(改) ~富山城の天守に喩えて~

Page 22: “これから”のライフサイエンス研究とバイオインフォマティクス (Next Generation Life Science & Bioinformatics)

© 2013 DBCLS Licensed under CC 表示 2.1 日本

#NGLSBI

1. コピペ系バイオインフォマティクス•配列断片などをコピー&ペースト(コピペ)してGUI(Graphical User Interface)で解析 ‒ウェブブラウザ上や専用ソフトウェア ‒コピペマティクスw

•武器 ‒ショートカットキー(例: ⌘+C, ⌘+V) ‒グーグル先生 ‒ソーシャルネットワーク(SNS) •Twitter

!22

Page 23: “これから”のライフサイエンス研究とバイオインフォマティクス (Next Generation Life Science & Bioinformatics)

© 2013 DBCLS Licensed under CC 表示 2.1 日本

#NGLSBI

2. コマンドライン系バイオインフォマティクス

•UNIXのコマンドライン上で、既存のツールを組み合わせて解析をする ‒Command line User Interface(CUI) (cf. GUI)

•たまに捨てコードを書く •武器 ‒shell script ‒Perl, Ruby ‒Python ‒R

!23

Page 24: “これから”のライフサイエンス研究とバイオインフォマティクス (Next Generation Life Science & Bioinformatics)

© 2013 DBCLS Licensed under CC 表示 2.1 日本

#NGLSBI

3. ガチ系バイオインフォマティクス•ある解析技術に特化したプログラムを書く ‒例えば、BLAST

•ライフサイエンスに興味あるのかな…!? •でもそういう人がプログラム作ってくれないと…いつも大変感謝しております

•武器 ‒C, C++ ‒Fortran

!24

Page 25: “これから”のライフサイエンス研究とバイオインフォマティクス (Next Generation Life Science & Bioinformatics)

© 2013 DBCLS Licensed under CC 表示 2.1 日本

#NGLSBI

0. 他力本願•他人にやらせる系 •自分の研究テーマなのに •「あなた、本当に研究者?」 •武器 ‒自然言語(関西弁が多い)

!25

Page 26: “これから”のライフサイエンス研究とバイオインフォマティクス (Next Generation Life Science & Bioinformatics)

© 2013 DBCLS Licensed under CC 表示 2.1 日本

#NGLSBI

考察•レベル0は論外。すぐにレベルアップを •時代が経ってソフトウェアが進化すれば、レベル1でもなんとかなる(はず) •早く目的の課題を解きたいのであれば、自らのレベルをさらに上げるしかない

!26

ぼうのふは レベル2にあがった!

Page 27: “これから”のライフサイエンス研究とバイオインフォマティクス (Next Generation Life Science & Bioinformatics)

© 2013 DBCLS Licensed under CC 表示 2.1 日本

#NGLSBI

レベルを上げるとは?•レベル0→1 ‒インターネットをもっと活用、ソフトウェア導入など、自らの意識改革で実現可能

•レベル1→2 ‒UNIX使いましょう •MacOSX: 「アプリケーション」→「ユティリティ」の「ターミナル」を常時起動 •Windows: cygwinを導入。できればMacOSXへ

‒cygwin: UNIX系の便利なプログラムを利用するためのツール!27

Page 28: “これから”のライフサイエンス研究とバイオインフォマティクス (Next Generation Life Science & Bioinformatics)

© 2013 DBCLS Licensed under CC 表示 2.1 日本

#NGLSBI

レベル1: GUIを決め込む•NGS解析GUIソフトウェア(有償)

–CLC Genomics workbench http://www.clcbio.co.jp/

–Avadis NGS http://www.avadis-ngs.com/

•遺伝子発現解析 ‒無償でいいものが多数 –例えば、GSEA(Gene Set Enrichment Analysis)のDAVID!

–Google 検索して調べましょう

!28

Page 29: “これから”のライフサイエンス研究とバイオインフォマティクス (Next Generation Life Science & Bioinformatics)

© 2013 DBCLS Licensed under CC 表示 2.1 日本

#NGLSBI

マイクロアレイ解析

!29

遺伝子アノテーション

oligoprobeに対応する遺伝子ごとの発現量

!29

Genespring

レベル1で可

Page 30: “これから”のライフサイエンス研究とバイオインフォマティクス (Next Generation Life Science & Bioinformatics)

© 2013 DBCLS Licensed under CC 表示 2.1 日本

#NGLSBI

データ形式の実際(マイクロアレイ)

!30

•タブ区切りテキスト!–数万(=スポットの数)行!

• (古い)Excelでも「開ける」!–Excel2003の行数制限内!

•コマンドライン操作なしで中身が直接見れる

!30

Page 31: “これから”のライフサイエンス研究とバイオインフォマティクス (Next Generation Life Science & Bioinformatics)

© 2013 DBCLS Licensed under CC 表示 2.1 日本

#NGLSBI

RNAseq

!31

•「次世代シーケンサを利用して、サンプル中の RNA の中身に関する情報を得るために cDNA をシーケンシングする方法」!–http://en.wikipedia.org/wiki/RNA-Seqより勝手に翻訳!

• Whole transcriptome shutgun sequencing(WTSS) や!

• Transcriptome sequencingとも

!31

Page 32: “これから”のライフサイエンス研究とバイオインフォマティクス (Next Generation Life Science & Bioinformatics)

© 2013 DBCLS Licensed under CC 表示 2.1 日本

#NGLSBI

RNAseq データ 解析の流れ

!32

ゲノムに対する多重配列アラインメント

.bam

ゲノムアノテーション

.gtf

予測転写単位ごとの(推定)発現量情報

SRR001356.1 2023DAAXX:5:1:123:563 length=33!TGTCGGTCCAGCTCGGCCTTGGGCTCCGTTTTC!+SRR001356.1 2023DAAXX:5:1:123:563 [email protected] 2023DAAXX:5:1:123:476 length=33!TCTGAACCCGACTCCCTTTCGATCGGCCGCGGG!+SRR001356.2 2023DAAXX:5:1:123:476 [email protected] 2023DAAXX:5:1:121:746 length=33!GTGGCAGCGTTTTTGGGCCCGCCGCTTGCCGTT!+SRR001356.3 2023DAAXX:5:1:121:746 length=33!IIIII&IIIIIIIIIIIIIIIIHI1IIIIIIII

FASTQゲノム .fa

1.tophat (bowtie)

2.cufflinks

3.cummeRbund!32

遺伝子アノテーション

上流はレベル2

Page 33: “これから”のライフサイエンス研究とバイオインフォマティクス (Next Generation Life Science & Bioinformatics)

© 2013 DBCLS Licensed under CC 表示 2.1 日本

#NGLSBI

レベル2: UNIXの使い方(CUI)デモ•出典: http://bit.ly/unixdemo131209

‒grep ‒ less ‒cut, sort, wc

!

•どうしてもWindowsという人はcygwinを –http://togotv.dbcls.jp/20110520.html 

!33

Page 34: “これから”のライフサイエンス研究とバイオインフォマティクス (Next Generation Life Science & Bioinformatics)

© 2013 DBCLS Licensed under CC 表示 2.1 日本

#NGLSBI

http://www.hiroogakuen.jp/weblog/archives/17598!34

レベル1-2

Page 35: “これから”のライフサイエンス研究とバイオインフォマティクス (Next Generation Life Science & Bioinformatics)

© 2013 DBCLS Licensed under CC 表示 2.1 日本

#NGLSBI

学部生でレベル2だとこんなことも

!35

•現在、学部4年生!

• First authorの論文がすでにaccepted

Page 36: “これから”のライフサイエンス研究とバイオインフォマティクス (Next Generation Life Science & Bioinformatics)

© 2013 DBCLS Licensed under CC 表示 2.1 日本

#NGLSBI

3. これからの ライフサイエンス研究と バイオインフォマティクス

Page 37: “これから”のライフサイエンス研究とバイオインフォマティクス (Next Generation Life Science & Bioinformatics)

© 2013 DBCLS Licensed under CC 表示 2.1 日本

#NGLSBI

バイオインフォマティクススキルがあれば、ライフサイエンス研究はできるか?

NOhttp://www.geocities.jp/papertoy_box/make/98CmdCar.html

Page 38: “これから”のライフサイエンス研究とバイオインフォマティクス (Next Generation Life Science & Bioinformatics)

© 2013 DBCLS Licensed under CC 表示 2.1 日本

#NGLSBI

車輪の両輪

•バイオインフォマティクスを含めた実験スキル •ライフサイエンスの知識

!38

研究前進

http://www.geocities.jp/papertoy_box/make/98CmdCar.html

Page 39: “これから”のライフサイエンス研究とバイオインフォマティクス (Next Generation Life Science & Bioinformatics)

© 2013 DBCLS Licensed under CC 表示 2.1 日本

#NGLSBI

ライフサイエンスの知識•蓄積された事実 ‒(これまで)教科書 ‒(最近は)データベース •特定のテーマに沿ったデータを集めて管理し、容易に検索・抽出などの再利用をできるようにしたもの

!39

Page 40: “これから”のライフサイエンス研究とバイオインフォマティクス (Next Generation Life Science & Bioinformatics)

© 2013 DBCLS Licensed under CC 表示 2.1 日本

#NGLSBI

ライフサイエンス分野の データベース

•PubMed, PubMedCentral(PMC) ‒論文のデータ

•DDBJ/EMBL/Genbank ‒塩基配列データ

•UniProtKB(かつてのSwissProt) ‒アミノ酸配列データ

•PDB ‒タンパク質の立体構造データ

!40

Page 41: “これから”のライフサイエンス研究とバイオインフォマティクス (Next Generation Life Science & Bioinformatics)

© 2013 DBCLS Licensed under CC 表示 2.1 日本

#NGLSBI

データベース乱立時代•Nucleic Acids Research •毎年年頭にDatabase issueを発刊 •2013年(最新版)の巻頭言

–http://nar.oxfordjournals.org/content/41/D1/D1.abstract

•1,512のDB! •多すぎ。把握困難

!41

統合しましょう

Page 42: “これから”のライフサイエンス研究とバイオインフォマティクス (Next Generation Life Science & Bioinformatics)

© 2013 DBCLS Licensed under CC 表示 2.1 日本

#NGLSBI

© 2013 DBCLS Licensed under CC 表示 2.1 日本

日本の「統合DB」とは?•生命科学分野のいわゆる「公共データベース」 •ライフサイエンスデータの流通業 •NBDC 、 DBCLS、DDBJ を中心に  日本中のさまざまな大学・研究機関が協力

•安心してすぐに利用できるデータを提供 •公共DBとして外に出す際にデータを綺麗に

!42

Page 43: “これから”のライフサイエンス研究とバイオインフォマティクス (Next Generation Life Science & Bioinformatics)

© 2013 DBCLS Licensed under CC 表示 2.1 日本

#NGLSBI

•基本的にユーザー登録なし •for profit(企業の方)もタダ

!43

無料で使えます

Page 44: “これから”のライフサイエンス研究とバイオインフォマティクス (Next Generation Life Science & Bioinformatics)

© 2013 DBCLS Licensed under CC 表示 2.1 日本

#NGLSBI

© 2013 DBCLS Licensed under CC 表示 2.1 日本

じゃ、どうやって?•やりたいことを「インターネット検索」して見つかります ‒要するにググって下さい

•見つからない場合は、NBDC portalから ‒かつてのYahoo!的なindexサイト

!44

Page 45: “これから”のライフサイエンス研究とバイオインフォマティクス (Next Generation Life Science & Bioinformatics)

© 2013 DBCLS Licensed under CC 表示 2.1 日本

#NGLSBI

© 2013 DBCLS Licensed under CC 表示 2.1 日本

http://biosciencedbc.jp/

!45

Page 46: “これから”のライフサイエンス研究とバイオインフォマティクス (Next Generation Life Science & Bioinformatics)

© 2013 DBCLS Licensed under CC 表示 2.1 日本

#NGLSBI

© 2013 DBCLS Licensed under CC 表示 2.1 日本

IntegbioDBカタログ

!46

Page 47: “これから”のライフサイエンス研究とバイオインフォマティクス (Next Generation Life Science & Bioinformatics)

© 2013 DBCLS Licensed under CC 表示 2.1 日本

#NGLSBI

© 2013 DBCLS Licensed under CC 表示 2.1 日本

生命科学DB横断検索

!47

Page 48: “これから”のライフサイエンス研究とバイオインフォマティクス (Next Generation Life Science & Bioinformatics)

© 2013 DBCLS Licensed under CC 表示 2.1 日本

#NGLSBI

© 2013 DBCLS Licensed under CC 表示 2.1 日本

生命科学DBアーカイブ

!48

Page 49: “これから”のライフサイエンス研究とバイオインフォマティクス (Next Generation Life Science & Bioinformatics)

© 2013 DBCLS Licensed under CC 表示 2.1 日本

#NGLSBI

© 2013 DBCLS Licensed under CC 表示 2.1 日本

バイオサイエンスデータベースセンター(NBDC)

•National Bioscience Database Center ‒Since 2011

•独立行政法人 科学技術振興機構(JST)の傘下

!49http://biosciencedbc.jp/about-us/projects-and-activitiesより引用

Page 50: “これから”のライフサイエンス研究とバイオインフォマティクス (Next Generation Life Science & Bioinformatics)

© 2013 DBCLS Licensed under CC 表示 2.1 日本

#NGLSBI

© 2013 DBCLS Licensed under CC 表示 2.1 日本© 2013 DBCLS Licensed under CC BY 2.1JAPAN

RDFによるDB統合ゲノムの配列情報と多種多様なアノテーションデータを個別のオントロジー、データ変換プログラムを開発し RDF 形式にして統合

!50

Slide from トーゴーの日シンポジウム2013 「データベース統合の実現に向けて2」 by 岡本忍 (DBCLS)

NCBI: BioProject/RefSeq -- 既存のリファレンス配列 DDBJ: Annotation pipeline/GTPS -- 新規ゲノム配列

ゲノム配列

UniProt: Protein functions and links Formats: GFF3, GTF, GVF, DAS, BED ... Tools: Cufflinks, BLAST, InterProt ...

アノテーション

NCBO: BioPortal, OBO (GO, SO ...) DBCLS: MEO, GMO, MCCV ...

オントロジー

INSDC, NCBI: SRA, GEODBCLS: RefEx, Kusarinoko GOLD, GSC: 環境メタデータBulk data: 文献, 画像 ...

実験・メタデータ

Page 51: “これから”のライフサイエンス研究とバイオインフォマティクス (Next Generation Life Science & Bioinformatics)

© 2013 DBCLS Licensed under CC 表示 2.1 日本

#NGLSBI

© 2013 DBCLS Licensed under CC 表示 2.1 日本

LSQA

!51

http://qa.lifesciencedb.jp/

Page 52: “これから”のライフサイエンス研究とバイオインフォマティクス (Next Generation Life Science & Bioinformatics)

© 2013 DBCLS Licensed under CC 表示 2.1 日本

#NGLSBI

© 2013 DBCLS Licensed under CC 表示 2.1 日本

和を以て貴しと為す

継続的に維持管理していくことが大事!52

Page 53: “これから”のライフサイエンス研究とバイオインフォマティクス (Next Generation Life Science & Bioinformatics)

© 2013 DBCLS Licensed under CC 表示 2.1 日本

#NGLSBI

© 2013 DBCLS Licensed under CC 表示 2.1 日本

!53

全部紹介している時間ないので

Page 54: “これから”のライフサイエンス研究とバイオインフォマティクス (Next Generation Life Science & Bioinformatics)

© 2013 DBCLS Licensed under CC 表示 2.1 日本

#NGLSBI

© 2013 DBCLS Licensed under CC 表示 2.1 日本

統合DBの活用法 統合TV

http://togotv.dbcls.jp/

Page 55: “これから”のライフサイエンス研究とバイオインフォマティクス (Next Generation Life Science & Bioinformatics)

© 2013 DBCLS Licensed under CC 表示 2.1 日本

#NGLSBI

© 2013 DBCLS Licensed under CC 表示 2.1 日本

統合TV (togoTV)•動画によるDBやツールのチュートリアル ‒ 各DBやツール名で検索

•統合データベース講演会AJACSの動画も •YouTubeにも

•約750の動画             (アップデート込)

!55クリエイティブ・コモンズ 表示 2.1 日本

http://togotv.dbcls.jp/

http://youtube.com/togotv

Page 56: “これから”のライフサイエンス研究とバイオインフォマティクス (Next Generation Life Science & Bioinformatics)

© 2013 DBCLS Licensed under CC 表示 2.1 日本

#NGLSBI

© 2013 DBCLS Licensed under CC 表示 2.1 日本

!56

NGS

Page 57: “これから”のライフサイエンス研究とバイオインフォマティクス (Next Generation Life Science & Bioinformatics)

© 2013 DBCLS Licensed under CC 表示 2.1 日本

#NGLSBI

© 2013 DBCLS Licensed under CC 表示 2.1 日本

!57

Page 58: “これから”のライフサイエンス研究とバイオインフォマティクス (Next Generation Life Science & Bioinformatics)

© 2013 DBCLS Licensed under CC 表示 2.1 日本

#NGLSBI

© 2013 DBCLS Licensed under CC 表示 2.1 日本

!58

Page 59: “これから”のライフサイエンス研究とバイオインフォマティクス (Next Generation Life Science & Bioinformatics)

© 2013 DBCLS Licensed under CC 表示 2.1 日本

#NGLSBI

© 2013 DBCLS Licensed under CC 表示 2.1 日本

!59

Page 60: “これから”のライフサイエンス研究とバイオインフォマティクス (Next Generation Life Science & Bioinformatics)

© 2013 DBCLS Licensed under CC 表示 2.1 日本

#NGLSBI

© 2013 DBCLS Licensed under CC 表示 2.1 日本

MotDB•Master of the DB「データベースの達人」 ‒「もっとDB? もういらん、増やさんといて!」

•統合DB講習会のテキスト置き場 ‒DBやツールの使い方の宝庫 ‒例えば… •RNAseq,ChIPseqのRによる解析方法 •遺伝子発現データの生物学的解釈方法 •Local BLASTのやり方(MacOSX, Windowsの両方)

!60

http://MotDB.dbcls.jp/

Page 61: “これから”のライフサイエンス研究とバイオインフォマティクス (Next Generation Life Science & Bioinformatics)

© 2013 DBCLS Licensed under CC 表示 2.1 日本

#NGLSBI

© 2013 DBCLS Licensed under CC 表示 2.1 日本

統合DBの活用法 1. 文献データ

新着論文レビュー 領域融合レビュー

Allie: 生命科学分野の略語/展開形検索 inMeXes: 逐次PubMed表現検索

Page 62: “これから”のライフサイエンス研究とバイオインフォマティクス (Next Generation Life Science & Bioinformatics)

© 2013 DBCLS Licensed under CC 表示 2.1 日本

#NGLSBI

© 2013 DBCLS Licensed under CC 表示 2.1 日本© 2013 DBCLS Licensed under CC BY 2.1JAPAN!62大人気のサービス

Page 63: “これから”のライフサイエンス研究とバイオインフォマティクス (Next Generation Life Science & Bioinformatics)

© 2013 DBCLS Licensed under CC 表示 2.1 日本

#NGLSBI

© 2013 DBCLS Licensed under CC 表示 2.1 日本© 2013 DBCLS Licensed under CC BY 2.1JAPAN

新着論文レビュー

!63クリエイティブ・コモンズ 表示 2.1 日本

http://first.lifesciencedb.jp/

Page 64: “これから”のライフサイエンス研究とバイオインフォマティクス (Next Generation Life Science & Bioinformatics)

© 2013 DBCLS Licensed under CC 表示 2.1 日本

#NGLSBI

© 2013 DBCLS Licensed under CC 表示 2.1 日本© 2013 DBCLS Licensed under CC BY 2.1JAPAN

領域融合レビュー

クリエイティブ・コモンズ 表示 2.1 日本!64

http://leading.lifesciencedb.jp/

Page 65: “これから”のライフサイエンス研究とバイオインフォマティクス (Next Generation Life Science & Bioinformatics)

© 2013 DBCLS Licensed under CC 表示 2.1 日本

#NGLSBI

© 2013 DBCLS Licensed under CC 表示 2.1 日本© 2013 DBCLS Licensed under CC BY 2.1JAPAN!65

http://allie.dbcls.jp/

Page 66: “これから”のライフサイエンス研究とバイオインフォマティクス (Next Generation Life Science & Bioinformatics)

© 2013 DBCLS Licensed under CC 表示 2.1 日本

#NGLSBI

© 2013 DBCLS Licensed under CC 表示 2.1 日本© 2013 DBCLS Licensed under CC BY 2.1JAPAN

inMeXes

!66 http://docman.dbcls.jp/im/

Page 67: “これから”のライフサイエンス研究とバイオインフォマティクス (Next Generation Life Science & Bioinformatics)

© 2013 DBCLS Licensed under CC 表示 2.1 日本

#NGLSBI

© 2013 DBCLS Licensed under CC 表示 2.1 日本© 2013 DBCLS Licensed under CC BY 2.1JAPAN!67

Page 68: “これから”のライフサイエンス研究とバイオインフォマティクス (Next Generation Life Science & Bioinformatics)

© 2013 DBCLS Licensed under CC 表示 2.1 日本

#NGLSBI

© 2013 DBCLS Licensed under CC 表示 2.1 日本© 2013 DBCLS Licensed under CC BY 2.1JAPAN!68

Life Science Dictionary のサイトにリンク

Page 69: “これから”のライフサイエンス研究とバイオインフォマティクス (Next Generation Life Science & Bioinformatics)

© 2013 DBCLS Licensed under CC 表示 2.1 日本

#NGLSBI

© 2013 DBCLS Licensed under CC 表示 2.1 日本

統合DBの活用法 2. 塩基配列データ

DDBJ DBCLS SRA GGRNA

GGGenome

Page 70: “これから”のライフサイエンス研究とバイオインフォマティクス (Next Generation Life Science & Bioinformatics)

© 2013 DBCLS Licensed under CC 表示 2.1 日本

#NGLSBI

© 2013 DBCLS Licensed under CC 表示 2.1 日本

突然ですが…DBCLS移転します•2013年度末に ‒柏の葉キャンパス駅前のビル ‒遺伝研DDBJ/CIBの隣のビル

•「統合」なのに分割移転w ‒予算的、制度的な都合

•物理的に「統合」 ‒DDBJ+DBCLS(一部)

!70でも、前から協調してやっています

Page 71: “これから”のライフサイエンス研究とバイオインフォマティクス (Next Generation Life Science & Bioinformatics)

© 2013 DBCLS Licensed under CC 表示 2.1 日本

#NGLSBI

© 2013 DBCLS Licensed under CC 表示 2.1 日本

!71

Page 72: “これから”のライフサイエンス研究とバイオインフォマティクス (Next Generation Life Science & Bioinformatics)

© 2013 DBCLS Licensed under CC 表示 2.1 日本

#NGLSBI

© 2013 DBCLS Licensed under CC 表示 2.1 日本© 2013 DBCLS Licensed under CC BY 2.1JAPAN

1. DBCLS SRA

• Yellow pages for NGS data archived!–Indexed by metadata. Search by....!

• Statistics!• Publications!• Diseases!

–Direct link to original DB(SRA)!• Pre-calculated QC data

!72

Search data

Download

Quality Check

Data processing

Analysis

Pipeline to help re-use public NGS data

http://SRA.dbcls.jp/

Page 73: “これから”のライフサイエンス研究とバイオインフォマティクス (Next Generation Life Science & Bioinformatics)

© 2013 DBCLS Licensed under CC 表示 2.1 日本

#NGLSBI

© 2013 DBCLS Licensed under CC 表示 2.1 日本© 2013 DBCLS Licensed under CC BY 2.1JAPAN

Statistics: studies

!73Picture from Togo Picture Gallery http://g86.dbcls.jp/togopic/

Page 74: “これから”のライフサイエンス研究とバイオインフォマティクス (Next Generation Life Science & Bioinformatics)

© 2013 DBCLS Licensed under CC 表示 2.1 日本

#NGLSBI

© 2013 DBCLS Licensed under CC 表示 2.1 日本

PUBLISHED OR NOT 公開されたデータを元にした論文はあるのか

!74

19%

paper publishednot published

NUMBER OF SUBMITTED STUDY

「論文を公開してからデータを公開する」!とは限らない

Page 75: “これから”のライフサイエンス研究とバイオインフォマティクス (Next Generation Life Science & Bioinformatics)

© 2013 DBCLS Licensed under CC 表示 2.1 日本

#NGLSBI

© 2013 DBCLS Licensed under CC 表示 2.1 日本© 2013 DBCLS Licensed under CC BY 2.1JAPAN

Search by publications

!75http://bit.ly/sra2pubmed

Page 76: “これから”のライフサイエンス研究とバイオインフォマティクス (Next Generation Life Science & Bioinformatics)

© 2013 DBCLS Licensed under CC 表示 2.1 日本

#NGLSBI

© 2013 DBCLS Licensed under CC 表示 2.1 日本© 2013 DBCLS Licensed under CC BY 2.1JAPAN

Search by diseases

!76

Page 77: “これから”のライフサイエンス研究とバイオインフォマティクス (Next Generation Life Science & Bioinformatics)

© 2013 DBCLS Licensed under CC 表示 2.1 日本

#NGLSBI

© 2013 DBCLS Licensed under CC 表示 2.1 日本© 2013 DBCLS Licensed under CC BY 2.1JAPAN

Search by diseases(cont.)

!77

Nakazato T, Ohta T, Bono H!Experimental design-based functional mining and characterization of high-throughput sequencing data in the Sequence Read Archive.!PLOS ONE. 2013; doi: 10.1371/journal.pone.0077910

Page 78: “これから”のライフサイエンス研究とバイオインフォマティクス (Next Generation Life Science & Bioinformatics)

© 2013 DBCLS Licensed under CC 表示 2.1 日本

#NGLSBI

© 2013 DBCLS Licensed under CC 表示 2.1 日本

GGRNA

!78

■ あらゆるキーワードや塩基配列・  アミノ酸配列からすばやく簡単に  遺伝子を検索するウェブサーバ

■ RefSeqのmRNA+ncRNAを   高速に全文検索する

■ PCRのプライマー、マイクロ  アレイのプローブ、siRNAの  標的配列を即座に確認

■ REST API提供により外部の  システムと連携可能

GooGle ライクな RNA 検索エンジンhttp://GGRNA.dbcls.jp/

Page 79: “これから”のライフサイエンス研究とバイオインフォマティクス (Next Generation Life Science & Bioinformatics)

© 2013 DBCLS Licensed under CC 表示 2.1 日本

#NGLSBI

© 2013 DBCLS Licensed under CC 表示 2.1 日本

!79

GooGle ライクな Genome 検索エンジンhttp://GGGenome.dbcls.jp/

Genomeも検索できたらええなあ… やりましょう!!

Page 80: “これから”のライフサイエンス研究とバイオインフォマティクス (Next Generation Life Science & Bioinformatics)

© 2013 DBCLS Licensed under CC 表示 2.1 日本

#NGLSBI

© 2013 DBCLS Licensed under CC 表示 2.1 日本

統合DBの活用法 3. 遺伝子発現データ

NCBI GEO目次 RefEx

Page 81: “これから”のライフサイエンス研究とバイオインフォマティクス (Next Generation Life Science & Bioinformatics)

© 2013 DBCLS Licensed under CC 表示 2.1 日本

#NGLSBI

© 2013 DBCLS Licensed under CC 表示 2.1 日本

GEO目次

!81

Page 82: “これから”のライフサイエンス研究とバイオインフォマティクス (Next Generation Life Science & Bioinformatics)

© 2013 DBCLS Licensed under CC 表示 2.1 日本

#NGLSBI

© 2013 DBCLS Licensed under CC 表示 2.1 日本

同じようなものが一杯あって、 どれを選んでいいか、わからない

!82

Page 83: “これから”のライフサイエンス研究とバイオインフォマティクス (Next Generation Life Science & Bioinformatics)

© 2013 DBCLS Licensed under CC 表示 2.1 日本

#NGLSBI

© 2013 DBCLS Licensed under CC 表示 2.1 日本

RefEx: 遺伝子発現 リファレンスデータセット

•臓器ごとの発現比較を4つの実験手法とBodyParts3Dで ‒正常組織・臓器における遺伝子発現のリファレンス ‒再利用可能で有用なパブリックデータの活用例 •「組織特異的遺伝子」検索機能の実装

!83

EST Classical Expressed Sequence Tags

GeneChip Affymetrix’s microarray

CAGE Cap Analysis of Gene Expression

RNAseq Transcriptome Sequencing

http://RefEx.dbcls.jp/

Page 84: “これから”のライフサイエンス研究とバイオインフォマティクス (Next Generation Life Science & Bioinformatics)

© 2013 DBCLS Licensed under CC 表示 2.1 日本

#NGLSBI

© 2013 DBCLS Licensed under CC 表示 2.1 日本© 2013 DBCLS Licensed under CC BY 2.1JAPAN

!84http://RefEx.dbcls.jp/

Page 85: “これから”のライフサイエンス研究とバイオインフォマティクス (Next Generation Life Science & Bioinformatics)

© 2013 DBCLS Licensed under CC 表示 2.1 日本

#NGLSBI

© 2013 DBCLS Licensed under CC 表示 2.1 日本© 2013 DBCLS Licensed under CC BY 2.1JAPAN

!85

Page 86: “これから”のライフサイエンス研究とバイオインフォマティクス (Next Generation Life Science & Bioinformatics)

© 2013 DBCLS Licensed under CC 表示 2.1 日本

#NGLSBI

© 2013 DBCLS Licensed under CC 表示 2.1 日本© 2013 DBCLS Licensed under CC BY 2.1JAPAN

!86

Page 87: “これから”のライフサイエンス研究とバイオインフォマティクス (Next Generation Life Science & Bioinformatics)

© 2013 DBCLS Licensed under CC 表示 2.1 日本

#NGLSBI

© 2013 DBCLS Licensed under CC 表示 2.1 日本

結語

!87

整備されてきた公共データベースをうまく活用して自分のやっていることに役立てていきましょう!

私もやっています

Page 88: “これから”のライフサイエンス研究とバイオインフォマティクス (Next Generation Life Science & Bioinformatics)

© 2013 DBCLS Licensed under CC 表示 2.1 日本

#NGLSBI

© 2013 DBCLS Licensed under CC 表示 2.1 日本

いつでもどこでもタダじゃない…

!88

Page 89: “これから”のライフサイエンス研究とバイオインフォマティクス (Next Generation Life Science & Bioinformatics)

© 2013 DBCLS Licensed under CC 表示 2.1 日本

#NGLSBI

© 2013 DBCLS Licensed under CC 表示 2.1 日本

結語2

!89

Page 90: “これから”のライフサイエンス研究とバイオインフォマティクス (Next Generation Life Science & Bioinformatics)

© 2013 DBCLS Licensed under CC 表示 2.1 日本

#NGLSBI

© 2013 DBCLS Licensed under CC 表示 2.1 日本

!90

photo by @hirabat (1st Bono Conference on 20130113 )

御清聴ありがとうございました

[email protected] !90

スライドのありか http://bit.ly/bono131209

We all level 2 and more!