第63回情報科学談話会(大林 武 准教授)
Transcript of 第63回情報科学談話会(大林 武 准教授)
情報処理装置「生命」の設計図を読み解く
大林武 (東北大・情報) [email protected]
自己紹介(大林武)
生物学 情報科学
11年 4年 7年東工大・生命
(千葉大・薬)東大・医科研 東北大・情報
バイオ インフォ マティクス
Bioinformatics / Computational Biology
Biology Informatics
Bioinformatics
Computational Biology
Biology Chemistry
Biochemistry
Chemical Biology
もくじ細胞システムの解明へ
遺伝子ネットワーク
情報処理システム
システムの進化
111010001001
000000111101
変換器
利用者のニーズ
情報処理システム
入力
出力
目的
様々な
トランジスタ
NANDゲート, NORゲート
CPU / GPU / FPGA
制御装置 / 演算装置 / レジスタ
半導体
原子
Software
細胞システム
グルコース濃度が上昇
タンブリングの抑制
変換器
子孫繁栄
入力
出力
目的
変動環境での
タンパク質(遺伝子)
Pathway
タンパク質複合体
アミノ酸
タンパク質ドメイン
原子
Genome
遺伝子型と表現型の関係性
ゲノム配列
複合体
機能
Protein Protein Protein Protein Protein Protein Protein
複合体 複合体複合体
Pathway Pathway
増殖速度表現型
捕食者対応力
遺伝子 遺伝子 遺伝子 遺伝子 遺伝子 遺伝子 遺伝子
システムの複製
複合体
機能
Protein Protein Protein Protein
複合体 複合体
Pathway Pathway
捕食者対応力増殖速度表現型
ゲノム配列
複合体
Protein Protein Protein Protein
複合体 複合体
Pathway Pathway
捕食者対応力増殖速度
ゲノム配列遺伝子 遺伝子 遺伝子 遺伝子 遺伝子 遺伝子 遺伝子 遺伝子
ゲノムのコピー
変化するゲノム
複合体
機能
Protein Protein Protein Protein
複合体 複合体
Pathway Pathway
捕食者対応力増殖速度表現型
ゲノム配列
ゲノムの変化
複合体
Protein Protein Protein Protein
複合体 複合体
Pathway Pathway
捕食者対応力増殖速度
ゲノム配列遺伝子 遺伝子 遺伝子 遺伝子 遺伝子 遺伝子 遺伝子 遺伝子
もくじ細胞システムの解明へ
遺伝子ネットワーク
情報処理システム
システムの進化
細胞システムの研究アプローチ
ゲノム配列
複合体
機能
Protein Protein Protein Protein Protein Protein Protein
複合体 複合体複合体
Pathway Pathway
増殖速度表現型
捕食者対応力
遺伝学
逆遺伝学
遺伝子 遺伝子 遺伝子 遺伝子 遺伝子 遺伝子 遺伝子
要素は決定できる
ゲノム配列
複合体
機能
Protein Protein Protein Protein Protein Protein Protein
複合体 複合体複合体
Pathway Pathway
増殖速度表現型
捕食者対応力
遺伝子 遺伝子 遺伝子 遺伝子 遺伝子 遺伝子 遺伝子
次々と決定されている ゲノム配列からほぼ決定できる
遺伝学
逆遺伝学
ヒトゲノムの一部
CCCTGTGGAGCCACACCCTAGGGTTGGCCAATCTACTCCCAGGAGCAGGGAGGGCAGGAGCCATCTATTGCTTACATTTGCTTCTGACACAACTGTGTTCACTAGCAACTCAAACAGACACCATGGTGCACCTGACACCTGAGGAGAAGTCTGCCGTTACTGCCCTGTGGGGCAAGGTGAACGTGGATGAAGTTGGTGGTGAGGCCCTGGGCAGGTTGGTATCAAGGTTACAAGACAGGTTTAAGGAGACCAATAGAAACTGGGCATGTGGAGACAGAGAAGACTCTTGGGTTTCAGATAGGCACTGACTCTCTCTGCCTATTGGTCTATTTTCCCACCCTTAGGCTGCTGGTGGTCTACCCTTGGACCCAGAGGTTCTTTGAGTCCTTTGGGGATCTGTCCACTCCTGATGCTGTTATGGGCAACCCTAAGGTGAAGGCTCATGGCAAGAAAGTGCTCGGTGCCTTTAGTGATGGCCTG
11番染色体: ヘモグロビンβサブユニット
ゲノムプロジェクト
# Gene: Protein-coding genes in Ensembl release 53 Icon: LSDB icon
Yeast1996年
6,698
1998年Nematode
20,176
2000年Fly
2001年Human
21,416
2002年Mouse
23,117
2004年Rat
22,59314,141# Genes
# Genes
20000~30000の遺伝子で生物が作られている
2000年Arabidopsis
30,53527,025
Rice2004年
Popula
45,555
2006年Tomato
2012年
35,00035,434
Grape
2007年 2008年
29,035
Lotus
Vertebrate Genomes in Ensembl DB
2015-11-08
DNA配列解読速度の爆発的上昇
http://www.ncbi.nlm.nih.gov/pubmed/19360079
パソコンの進歩よりも遥かに速い速度で発展している
機能モジュールをどう推定するか?
ゲノム配列
複合体
機能
Protein Protein Protein Protein Protein Protein Protein
複合体 複合体複合体
Pathway Pathway
増殖速度表現型
捕食者対応力
遺伝子 遺伝子 遺伝子 遺伝子 遺伝子 遺伝子 遺伝子
?
もくじ細胞システムの解明へ
遺伝子ネットワーク
情報処理システム
システムの進化
代謝ネットワーク
H
Hエタノール アセトアルデヒド
ADH
酢酸
ALDH
細胞情報を担う3タイプの分子
出典: Molecular Biology of THE CELL 5th
設計図
伝令
機能の実体
DNA
RNA
タンパク質
アルコール代謝遺伝子の発現パターン
ADH1B
ALDH2
NCBI GEO: GSE2361
肝臓で発現している
活動量データから友人関係を推定できる
http://ics.t.u-tokyo.ac.jp/ja/スマート活動量計データからの人間関係可視化/
東京大学 情報理工学研究科 下坂研究室
一次代謝系,二次代謝系とも共発現する
グルコシノレート
メチオニン
CYP79F1
REF2
SUR1
UGT74B1
SOT17
MAM1
BCAT4PGI
PFK
FBA
TIM
GAPC
PGK
iPGAM
ENO
PK
ピルビン酸
グルコース6P
MR < 30
長い生合成経路
クロロフィル a
グルタミン酸
全般的に共発現しているが 調節の鍵遺伝子がある
CRD1
GUN5
PORC
CHLD
CHLM
CHLI
CHLGPPOX
HEMC
HEMB
LIN2
HEME
HEMA
HEML
Protoporphyrin IX
MR < 50
基質の供給経路が複数ある場合
スクアレン
HDRHDSISPFCDPMEKISPDDXRDXPS1
HMG
MVD
MK
MVA1
ACAT2
SQS1
FPS1
共発現はパスウェイ間の繋がりを表す
メバロン酸経路 非メバロン酸経路
アセチルCoA ピルビン酸
IPPIPP
MR < 100
複数の代謝系の関係性
ADT
MEE17
CM 4CLC4H
PALコリスミ酸TS
IGPS
TRP1
AS
トリプトファン
PSP
PSAT
PGDH
3PG
PAI
EMB1144EPSPSSK
MEE32
DHS
E4P PEP
DQS
クマロイルCoA
MR < 30共通経路はどちらのパスウェイとも共発現している
遺伝子間関係の評価
本当に関係しているのか?
再現性 既知機能と無矛盾
ゲノム配列と無矛盾
比較する共発現の質 システムノイズの問題
生物種特異的 既知機能の限界
ゲノム情報の複雑さ
DHCR7と共発現する遺伝子(ヒト)
共発現が他種でサポートされない例
もくじ細胞システムの解明へ
遺伝子ネットワーク
情報処理システム
システムの進化
システム進化の研究に向けて
システム構造
ゲノム理解
システム動態
ACGTACGATCGTACAGCTAGCTAGCTCAGC
ゲノム配列ACGTACGATCGTACAGCTAGCTAGCTCAGC
ACGTACGATCGTACAGCTAGCTAGCTCAGC
階層構造の推定
ゲノム配列
複合体
機能
Protein Protein Protein Protein Protein Protein Protein
複合体 複合体複合体
Pathway Pathway
増殖速度表現型
捕食者対応力
遺伝子 遺伝子 遺伝子 遺伝子 遺伝子 遺伝子 遺伝子
?
Okamura et al (PLoS One 2015)
Lineage-Specific Coexpression
Xylan Arabinan
Glucan Cellulose
Monocot DicotOsa-m Zma-m Ath-m Gma-m
Osa-r Zma-r Ath-r Gma-r
Cellulose Synthase 6
Unknown Protein
Glycoside Hydrolase 9
Monocot Dicot1980 3509 201 3208529 14523 7 1179
Monocot Dicot9 16 11407 947615 300 5565 3459
Monocot Dicot5578 4854 9 3061176 1776 107 75
Monocot Dicot16 12 97 305101 42 30 28
Monocot Dicot127 106 3595 395723 69 5487 3049
Coex Platforms
Glycoside Hydrolase 3
Monocot plants Dicot plants
Substrate Substrate
Gene co-expression is evolving to acquire lineage-specific cellular functions.
Aoki et al (PCP 2016)
Gene Coexpression Databases
http://coxpresdb.jp http://atted.jp http://alcodb.jp
Animals PlantsAlgae
Medical EnvironmentalFood Biofuel
Users of ATTED-II, COXPRESdb
Based on Google Analytics
Country Yearly citation
0
25
50
75
100
125
Y2007 Y2014
(Session)
まとめ細胞システムの解明に向けて
遺伝子ネットワーク
情報処理システムとしての生物
システムの進化