第63回情報科学談話会(大林 武 准教授)

Post on 16-Apr-2017

372 views 1 download

Transcript of 第63回情報科学談話会(大林 武 准教授)

情報処理装置「生命」の設計図を読み解く

大林武 (東北大・情報) obayashi@ecei.tohoku.ac.jp

自己紹介(大林武)

生物学 情報科学

11年 4年 7年東工大・生命

(千葉大・薬)東大・医科研 東北大・情報

バイオ インフォ マティクス

Bioinformatics / Computational Biology

Biology Informatics

Bioinformatics

Computational Biology

Biology Chemistry

Biochemistry

Chemical Biology

もくじ細胞システムの解明へ

遺伝子ネットワーク

情報処理システム

システムの進化

111010001001

000000111101

変換器

利用者のニーズ

情報処理システム

入力

出力

目的

様々な

トランジスタ

NANDゲート, NORゲート

CPU / GPU / FPGA

制御装置 / 演算装置 / レジスタ

半導体

原子

Software

細胞システム

グルコース濃度が上昇

タンブリングの抑制

変換器

子孫繁栄

入力

出力

目的

変動環境での

タンパク質(遺伝子)

Pathway

タンパク質複合体

アミノ酸

タンパク質ドメイン

原子

Genome

遺伝子型と表現型の関係性

ゲノム配列

複合体

機能

Protein Protein Protein Protein Protein Protein Protein

複合体 複合体複合体

Pathway Pathway

増殖速度表現型

捕食者対応力

遺伝子 遺伝子 遺伝子 遺伝子 遺伝子 遺伝子 遺伝子

システムの複製

複合体

機能

Protein Protein Protein Protein

複合体 複合体

Pathway Pathway

捕食者対応力増殖速度表現型

ゲノム配列

複合体

Protein Protein Protein Protein

複合体 複合体

Pathway Pathway

捕食者対応力増殖速度

ゲノム配列遺伝子 遺伝子 遺伝子 遺伝子 遺伝子 遺伝子 遺伝子 遺伝子

ゲノムのコピー

変化するゲノム

複合体

機能

Protein Protein Protein Protein

複合体 複合体

Pathway Pathway

捕食者対応力増殖速度表現型

ゲノム配列

ゲノムの変化

複合体

Protein Protein Protein Protein

複合体 複合体

Pathway Pathway

捕食者対応力増殖速度

ゲノム配列遺伝子 遺伝子 遺伝子 遺伝子 遺伝子 遺伝子 遺伝子 遺伝子

もくじ細胞システムの解明へ

遺伝子ネットワーク

情報処理システム

システムの進化

細胞システムの研究アプローチ

ゲノム配列

複合体

機能

Protein Protein Protein Protein Protein Protein Protein

複合体 複合体複合体

Pathway Pathway

増殖速度表現型

捕食者対応力

遺伝学

逆遺伝学

遺伝子 遺伝子 遺伝子 遺伝子 遺伝子 遺伝子 遺伝子

要素は決定できる

ゲノム配列

複合体

機能

Protein Protein Protein Protein Protein Protein Protein

複合体 複合体複合体

Pathway Pathway

増殖速度表現型

捕食者対応力

遺伝子 遺伝子 遺伝子 遺伝子 遺伝子 遺伝子 遺伝子

次々と決定されている ゲノム配列からほぼ決定できる

遺伝学

逆遺伝学

ヒトゲノムの一部

CCCTGTGGAGCCACACCCTAGGGTTGGCCAATCTACTCCCAGGAGCAGGGAGGGCAGGAGCCATCTATTGCTTACATTTGCTTCTGACACAACTGTGTTCACTAGCAACTCAAACAGACACCATGGTGCACCTGACACCTGAGGAGAAGTCTGCCGTTACTGCCCTGTGGGGCAAGGTGAACGTGGATGAAGTTGGTGGTGAGGCCCTGGGCAGGTTGGTATCAAGGTTACAAGACAGGTTTAAGGAGACCAATAGAAACTGGGCATGTGGAGACAGAGAAGACTCTTGGGTTTCAGATAGGCACTGACTCTCTCTGCCTATTGGTCTATTTTCCCACCCTTAGGCTGCTGGTGGTCTACCCTTGGACCCAGAGGTTCTTTGAGTCCTTTGGGGATCTGTCCACTCCTGATGCTGTTATGGGCAACCCTAAGGTGAAGGCTCATGGCAAGAAAGTGCTCGGTGCCTTTAGTGATGGCCTG

11番染色体: ヘモグロビンβサブユニット

ゲノムプロジェクト

# Gene: Protein-coding genes in Ensembl release 53 Icon: LSDB icon

Yeast1996年

6,698

1998年Nematode

20,176

2000年Fly

2001年Human

21,416

2002年Mouse

23,117

2004年Rat

22,59314,141# Genes

# Genes

20000~30000の遺伝子で生物が作られている

2000年Arabidopsis

30,53527,025

Rice2004年

Popula

45,555

2006年Tomato

2012年

35,00035,434

Grape

2007年 2008年

29,035

Lotus

Vertebrate Genomes in Ensembl DB

2015-11-08

DNA配列解読速度の爆発的上昇

http://www.ncbi.nlm.nih.gov/pubmed/19360079

パソコンの進歩よりも遥かに速い速度で発展している

機能モジュールをどう推定するか?

ゲノム配列

複合体

機能

Protein Protein Protein Protein Protein Protein Protein

複合体 複合体複合体

Pathway Pathway

増殖速度表現型

捕食者対応力

遺伝子 遺伝子 遺伝子 遺伝子 遺伝子 遺伝子 遺伝子

もくじ細胞システムの解明へ

遺伝子ネットワーク

情報処理システム

システムの進化

代謝ネットワーク

H

Hエタノール アセトアルデヒド

ADH

酢酸

ALDH

細胞情報を担う3タイプの分子

出典: Molecular Biology of THE CELL 5th

設計図

伝令

機能の実体

DNA

RNA

タンパク質

アルコール代謝遺伝子の発現パターン

ADH1B

ALDH2

NCBI GEO: GSE2361

肝臓で発現している

活動量データから友人関係を推定できる

http://ics.t.u-tokyo.ac.jp/ja/スマート活動量計データからの人間関係可視化/

東京大学 情報理工学研究科 下坂研究室

一次代謝系,二次代謝系とも共発現する

グルコシノレート

メチオニン

CYP79F1

REF2

SUR1

UGT74B1

SOT17

MAM1

BCAT4PGI

PFK

FBA

TIM

GAPC

PGK

iPGAM

ENO

PK

ピルビン酸

グルコース6P

MR < 30

長い生合成経路

クロロフィル a

グルタミン酸

全般的に共発現しているが 調節の鍵遺伝子がある

CRD1

GUN5

PORC

CHLD

CHLM

CHLI

CHLGPPOX

HEMC

HEMB

LIN2

HEME

HEMA

HEML

Protoporphyrin IX

MR < 50

基質の供給経路が複数ある場合

スクアレン

HDRHDSISPFCDPMEKISPDDXRDXPS1

HMG

MVD

MK

MVA1

ACAT2

SQS1

FPS1

共発現はパスウェイ間の繋がりを表す

メバロン酸経路 非メバロン酸経路

アセチルCoA ピルビン酸

IPPIPP

MR < 100

複数の代謝系の関係性

ADT

MEE17

CM 4CLC4H

PALコリスミ酸TS

IGPS

TRP1

AS

トリプトファン

PSP

PSAT

PGDH

3PG

PAI

EMB1144EPSPSSK

MEE32

DHS

E4P PEP

DQS

クマロイルCoA

MR < 30共通経路はどちらのパスウェイとも共発現している

遺伝子間関係の評価

本当に関係しているのか?

再現性 既知機能と無矛盾

ゲノム配列と無矛盾

比較する共発現の質 システムノイズの問題

生物種特異的 既知機能の限界

ゲノム情報の複雑さ

DHCR7と共発現する遺伝子(ヒト)

共発現が他種でサポートされない例

もくじ細胞システムの解明へ

遺伝子ネットワーク

情報処理システム

システムの進化

システム進化の研究に向けて

システム構造

ゲノム理解

システム動態

ACGTACGATCGTACAGCTAGCTAGCTCAGC

ゲノム配列ACGTACGATCGTACAGCTAGCTAGCTCAGC

ACGTACGATCGTACAGCTAGCTAGCTCAGC

階層構造の推定

ゲノム配列

複合体

機能

Protein Protein Protein Protein Protein Protein Protein

複合体 複合体複合体

Pathway Pathway

増殖速度表現型

捕食者対応力

遺伝子 遺伝子 遺伝子 遺伝子 遺伝子 遺伝子 遺伝子

Okamura et al (PLoS One 2015)

Lineage-Specific Coexpression

Xylan Arabinan

Glucan Cellulose

Monocot DicotOsa-m Zma-m Ath-m Gma-m

Osa-r Zma-r Ath-r Gma-r

Cellulose Synthase 6

Unknown Protein

Glycoside Hydrolase 9

Monocot Dicot1980 3509 201 3208529 14523 7 1179

Monocot Dicot9 16 11407 947615 300 5565 3459

Monocot Dicot5578 4854 9 3061176 1776 107 75

Monocot Dicot16 12 97 305101 42 30 28

Monocot Dicot127 106 3595 395723 69 5487 3049

Coex Platforms

Glycoside Hydrolase 3

Monocot plants Dicot plants

Substrate Substrate

Gene co-expression is evolving to acquire lineage-specific cellular functions.

Aoki et al (PCP 2016)

Gene Coexpression Databases

http://coxpresdb.jp http://atted.jp http://alcodb.jp

Animals PlantsAlgae

Medical EnvironmentalFood Biofuel

Users of ATTED-II, COXPRESdb

Based on Google Analytics

Country Yearly citation

0

25

50

75

100

125

Y2007 Y2014

(Session)

まとめ細胞システムの解明に向けて

遺伝子ネットワーク

情報処理システムとしての生物

システムの進化