Title 生体分子ネットワークの数理モデリングとベイ...

97
Title 生体分子ネットワークの数理モデリングとベイズパラメ ータ推定法の研究( Dissertation_全文 ) Author(s) 村上, 陽平 Citation Kyoto University (京都大学) Issue Date 2014-03-24 URL https://doi.org/10.14989/doctor.k18120 Right 学位規則第9条第2項により要約公開; 許諾条件により本文 は2015-03-01に公開 Type Thesis or Dissertation Textversion ETD Kyoto University

Transcript of Title 生体分子ネットワークの数理モデリングとベイ...

Page 1: Title 生体分子ネットワークの数理モデリングとベイ …...したベイズの式の後分布の計算アルゴリズムとして、 マルコフ連鎖モンテカルロ法とポ

Title 生体分子ネットワークの数理モデリングとベイズパラメータ推定法の研究( Dissertation_全文 )

Author(s) 村上, 陽平

Citation Kyoto University (京都大学)

Issue Date 2014-03-24

URL https://doi.org/10.14989/doctor.k18120

Right 学位規則第9条第2項により要約公開; 許諾条件により本文は2015-03-01に公開

Type Thesis or Dissertation

Textversion ETD

Kyoto University

Page 2: Title 生体分子ネットワークの数理モデリングとベイ …...したベイズの式の後分布の計算アルゴリズムとして、 マルコフ連鎖モンテカルロ法とポ

生体分子ネットワークの数理モデリングと

ベイズパラメータ推定法の研究

村上 陽平

Page 3: Title 生体分子ネットワークの数理モデリングとベイ …...したベイズの式の後分布の計算アルゴリズムとして、 マルコフ連鎖モンテカルロ法とポ

2

Page 4: Title 生体分子ネットワークの数理モデリングとベイ …...したベイズの式の後分布の計算アルゴリズムとして、 マルコフ連鎖モンテカルロ法とポ

3

要旨

数理モデリングは、数理モデルを用いて現象の解析や予測などを行う研究方法である。

生体分子ネットワークの数理モデリングは、生命現象をネットワーク・システムレベルで

理解したり、実験結果を予測したりするために用いられる。このような生体分子ネットワ

ークの数理モデル構築の際にしばしば問題となるのは、モデル中のパラメータ値が実験的

に決定されていないことである。本研究ではこのような場合の対処法である、ベイズの式

を利用したベイズパラメータ推定法と、その計算アルゴリズムの研究を行った。また、数

理モデリングによる生命現象理解の例として、癌抑制遺伝子産物 p53 タンパク質の離散的

なパルス様濃度変化による細胞運命決定機構の数理モデリングを行った。

ベイズパラメータ推定法の研究では、従来用いられる時系列データだけでなく、ヒスト

グラムデータや分岐の存在を示唆する情報を取り扱えるようなベイズの式を考えた。考案

したベイズの式の事後分布の計算アルゴリズムとして、マルコフ連鎖モンテカルロ法とポ

ピュレーション型モンテカルロ法に実装した。考案したベイズの式と計算アルゴリズムを

評価するため、新たに導入した 1 転写因子モデルと既存のカスパーゼカスケードモデルに

適用して、有効性のテストを行った。テストの結果、時系列データだけでなくヒストグラ

ムデータや分岐情報を用いることで、正しいパラメータ値が高い信用性で求められること

が確認された。この結果は、用いた計算アルゴリズムに依存しなかった。また、事後分布

を構成するパラメータを用いることで、システム解析や予測が可能になることを確認した。

p53 パルスによる細胞運命決定機構の数理モデリング研究では、実験で観測される p53

パルスサイズの変動が細胞死決定の厳密さに及ぼす影響を調べた。また、p53によるアポト

ーシス促進因子 PUMAの転写活性化過程に着目し、転写活性化過程の協同性が細胞死決定

の厳密さに及ぼす影響とその理由を調べた。計算の結果、p53パルスサイズの変動は、パル

ス数による厳密な細胞死の決定を困難にした。また、p53による PUMA転写活性化過程の

協同性が強いほど、厳密な細胞死の決定は困難になった。この理由として、協同性が強い

ほど、転写活性化される PUMA発現レベルの変動が大きくなるためであることが示唆され

た。

Page 5: Title 生体分子ネットワークの数理モデリングとベイ …...したベイズの式の後分布の計算アルゴリズムとして、 マルコフ連鎖モンテカルロ法とポ

4

Page 6: Title 生体分子ネットワークの数理モデリングとベイ …...したベイズの式の後分布の計算アルゴリズムとして、 マルコフ連鎖モンテカルロ法とポ

5

目次

要旨 ......................................................................................................................................... 3

目次 ......................................................................................................................................... 5

略号 ......................................................................................................................................... 8

序論 ......................................................................................................................................... 9

第 1章 ベイズパラメータ推定法と計算アルゴリズム ......................................................... 11

1.1 背景と目的 ................................................................................................................. 12

1.1.1 数理モデリングとパラメータ推定 ...................................................................... 12

1.1.1.1 数理モデリングにおける問題点 ................................................................... 12

1.1.1.2 パラメータ推定法 ......................................................................................... 13

1.1.1.3 実験データとパラメータ推定 ....................................................................... 14

1.1.2 ベイズの式と事後分布の計算アルゴリズム ....................................................... 16

1.1.2.1 ベイズの式 .................................................................................................... 16

1.1.2.2 ベイズ事後分布の計算アルゴリズム ............................................................ 16

1.1.3 研究の目的........................................................................................................... 19

1.2 ベイズパラメータ推定法 ........................................................................................... 20

1.2.1 ヒストグラムデータ ............................................................................................ 20

1.2.2 分岐情報 .............................................................................................................. 22

1.2.3 時系列データ ....................................................................................................... 22

1.2.4 ベイズの式による全データの取り扱い ............................................................... 23

1.3 事後分布の計算アルゴリズム .................................................................................... 25

1.3.1 マルコフ連鎖モンテカルロ法 (MCMC) .............................................................. 25

1.3.2 ポピュレーションアニーリング (PA) ................................................................. 26

1.3.2.1 アルゴリズム ................................................................................................ 26

1.3.2.2 中間分布の設定............................................................................................. 28

1.4 数理モデル ................................................................................................................. 31

1.4.1 転写因子モデル ................................................................................................... 31

1.4.1.1 モデルと問題設定 ......................................................................................... 31

1.4.1.2 分岐情報 ....................................................................................................... 33

1.4.1.3 時系列データ ................................................................................................ 33

1.4.1.4 ヒストグラムデータ ..................................................................................... 33

1.4.1.5 ベイズの式によるデータの取り扱い ............................................................ 33

1.4.1.6 シミュレーションの設定 .............................................................................. 34

1.4.2 カスパーゼカスケードモデル ............................................................................. 37

Page 7: Title 生体分子ネットワークの数理モデリングとベイ …...したベイズの式の後分布の計算アルゴリズムとして、 マルコフ連鎖モンテカルロ法とポ

6

1.4.2.1 モデルと問題設定 ......................................................................................... 37

1.4.2.2 分岐情報 ....................................................................................................... 38

1.4.2.3 ヒストグラムデータ ..................................................................................... 39

1.4.2.4 ベイズの式によるデータの取り扱い ............................................................ 40

1.4.2.5 シミュレーションの設定 .............................................................................. 40

1.5 結果と考察 ................................................................................................................. 43

1.5.1 転写因子モデル ................................................................................................... 43

1.5.1.1 MCMCによるパラメータ推定 ...................................................................... 43

1.5.1.2 PAによるパラメータ推定 ............................................................................. 46

1.5.1.3 考察 ............................................................................................................... 46

1.5.2 カスパーゼカスケードモデル ............................................................................. 47

1.5.2.1 MCMCによるパラメータ推定 ...................................................................... 47

1.5.2.2 PAによるパラメータ推定 ............................................................................. 48

1.5.2.3 信用区間と相関係数の解釈 .......................................................................... 50

1.5.2.4 タンパク質濃度変化の双安定性への影響の予測 ......................................... 51

1.5.2.5 考察 ............................................................................................................... 52

1.6 まとめ ........................................................................................................................ 54

1.6.1 本研究の成果 ....................................................................................................... 54

1.6.2 今後の課題と展望 ................................................................................................ 54

第 2章 p53パルスによる細胞運命決定機構の数理モデリング .......................................... 57

2.1 背景と目的 ................................................................................................................. 58

2.1.1 p53パルスと細胞運命の決定 .............................................................................. 58

2.1.2 研究の目的........................................................................................................... 58

2.2 数理モデル ................................................................................................................. 60

2.2.1 モデルの設定 ....................................................................................................... 60

2.2.2 p53パルスの設定 ................................................................................................. 62

2.2.3 シミュレーションの設定 ..................................................................................... 63

2.3 結果と考察 ................................................................................................................. 64

2.3.1 数理モデルの性質 ................................................................................................ 64

2.3.2 細胞運命決定の厳密さ ........................................................................................ 65

2.3.3 p53による転写活性化過程の協同性.................................................................... 66

2.4 まとめ ........................................................................................................................ 69

2.4.1 本研究の成果 ....................................................................................................... 69

2.4.2 今後の展望と課題 ................................................................................................ 69

発表論文リスト .................................................................................................................... 71

謝辞 ....................................................................................................................................... 73

Page 8: Title 生体分子ネットワークの数理モデリングとベイ …...したベイズの式の後分布の計算アルゴリズムとして、 マルコフ連鎖モンテカルロ法とポ

7

付録 1 カスパーゼカスケードモデルの微分方程式・パラメータ・初期値 ........................ 75

付録 2 Bax活性化スイッチモデルの微分方程式・パラメータ ........................................... 81

付録 3 第 1章の周辺事後分布 ............................................................................................. 85

3.1 時系列データを ABCの枠組みで評価した場合の周辺事後分布(MCMC) ................. 85

3.2分散の周辺事後分布(MCMC) ...................................................................................... 86

3.3時系列データを ABCの枠組みで評価した場合の周辺事後分布(PA) ......................... 87

3.4 分散の周辺事後分布(PA) ............................................................................................ 88

3.5 カスパーゼカスケードモデルの周辺事後分布(PA) ................................................... 89

参考文献 ............................................................................................................................... 91

Page 9: Title 生体分子ネットワークの数理モデリングとベイ …...したベイズの式の後分布の計算アルゴリズムとして、 マルコフ連鎖モンテカルロ法とポ

8

略号

MCMC:Markov chain Monte Carlo methods (マルコフ連鎖モンテカルロ法)

PA:population annealing (ポピュレーションアニーリング)

SMC:sequential Monte Carlo (遂次モンテカルロ法)

ABC:approximate Bayesian computation

IPF:implicit positive feedback (インプリシットポジティブフィードバック)

Page 10: Title 生体分子ネットワークの数理モデリングとベイ …...したベイズの式の後分布の計算アルゴリズムとして、 マルコフ連鎖モンテカルロ法とポ

9

序論

数理モデルは、現実世界で起こる現象やその現象を生み出す機構を、微分方程式や確率

分布などの数式を用いて記述・表現したものである。適切に構築された数理モデルの解析

やシミュレーションを行うことで、注目している現象に関する知見を得ることができる。

数理モデリングとは、このような数理モデルの構築、解析とそれによる知見獲得の過程や

研究方法全体を指す言葉と考えることができる。数理モデルは現象を数値化し、現象を生

み出す機構も数式表現によって抽象化しているため、現象のもつ全ての情報を含んでいな

い。このため、数理モデルが現実の現象を完全な精確さで模倣・予測するのは不可能であ

ると考えられる。しかし、数理モデリングは情報の縮約によって現象を理解しやすくし、

完全ではないにせよ現象の予測も可能にしてくれる。

生物科学領域での数理モデリングの目的には、生命現象の生体分子ネットワークレベル

での理解、in vivo/in vitro 両レベルでの実験結果の予測や、薬物の生体分子ネットワーク

レベルでの作用の理解・予測といった医学への応用などが挙げられる。このような目的で

数理モデリングを行う際の問題として、数理モデル中のパラメータ情報の不足が挙げられ

る。すなわち、構築した数理モデル中に含まれる生化学反応速度定数やタンパク質・mRNA

量などのパラメータ値が、実験的に全て決定されているとは限らない、ということである。

このような状況に対処して数理モデリングを行う手段として、既存の実験結果をある程度

再現できるように未知のパラメータ値を決定するという方法がある。

このような背景の下で、本研究では、ベイズの式を用いることで様々な形式で表現され

た実験データを用いて未知のパラメータ値を推定するベイズパラメータ推定法と、その計

算アルゴリズムの開発を行った。また、数理モデリングによる生命現象理解の例として、

癌抑制遺伝子 p53による細胞運命決定機構に関する数理モデリング研究を行った。

本論文は 2 つの章から構成されている。第 1 章は、数理モデルのベイズパラメータ推定

法と計算アルゴリズムの研究である。第 2章は、p53による細胞運命決定機構に関する数理

モデリングの研究である。

Page 11: Title 生体分子ネットワークの数理モデリングとベイ …...したベイズの式の後分布の計算アルゴリズムとして、 マルコフ連鎖モンテカルロ法とポ

10

Page 12: Title 生体分子ネットワークの数理モデリングとベイ …...したベイズの式の後分布の計算アルゴリズムとして、 マルコフ連鎖モンテカルロ法とポ

11

第1章 ベイズパラメータ推定法と計算アル

ゴリズム

Page 13: Title 生体分子ネットワークの数理モデリングとベイ …...したベイズの式の後分布の計算アルゴリズムとして、 マルコフ連鎖モンテカルロ法とポ

12

1.1 背景と目的

本節では、第 1 章の研究の背景となる数理モデリングにおけるパラメータ推定と、ベイ

ズパラメータ推定法の基礎となるベイズの式について概説し、それらの問題点をふまえて

本研究の目的について述べる。

1.1.1 数理モデリングとパラメータ推定

1.1.1.1 数理モデリングにおける問題点

現実で観測された現象の数理モデリングは、2つのステップに分けて考えることができる

(図 1.1)。すなわち、1.現実で観測された現象を元に現象を生み出す機構を数式によって表

現する(数理モデルの構築)、2.構築した数理モデルの解析やシミュレーションによって注目

している現象の理解や新たな予測を行う(数理モデルの解析・シミュレーション)、である。

この過程のうちしばしば問題となるのは、数理モデル構築時にモデル中のパラメータ値の

全てが判明しているとは限らないということである。例えば、生体分子ネットワークの数

理モデリングでは、値が未知の酵素反応速度定数や細胞内タンパク質濃度などのパラメー

タが存在することがある。また、生体分子ネットワークにはネットワークモチーフとよば

れる特徴的なネットワークの構造単位が存在し、ネットワーク全体の機能や働きに影響を

与えることが知られているが(Alon, 2007; Mangan and Alon, 2003; Milo et al., 2002)、そ

の構造だけではネットワーク全体の機能や働きを完全に決定しないことも指摘されている

(Ingram et al., 2006)。よって、数理モデリングの対象とする生体分子ネットワーク構造が

決まっているとしても、その数理モデル中に値が未知のパラメータがある際には、何らか

の体系立てられた方法によって対処する必要がある。

図 1.1 数理モデリングの流れ. 現実で現

象が観測される→観測された現象を生み

出す機構を記述する数理モデルを構築す

る→数理モデルの解析やシミュレーショ

ンによって現象を理解したり、新たな現象

を予測したりする. パラメータ推定は数理

モデル構築の際の問題であり、既に観測さ

れている現象をある程度再現できるよう

に、パラメータ値を決定する必要がある.

Page 14: Title 生体分子ネットワークの数理モデリングとベイ …...したベイズの式の後分布の計算アルゴリズムとして、 マルコフ連鎖モンテカルロ法とポ

13

1.1.1.2 パラメータ推定法

数理モデル中に値が未知のパラメータがある場合の対処法として、既存の実験結果をある

程度再現できるようにパラメータ値を決定するという方法がある(図 1.1)。生体分子ネット

ワークの数理モデリングで用いられるパラメータ推定法として、最適化法が使用されるこ

とがある(Ashyraliyev et al., 2009)。例えば、進化的アルゴリズム(Whitley, 2001)は、代謝

経路や概日リズムを生み出す生体分子ネットワークの数理モデルのパラメータ推定に用い

られている(Mirsky et al., 2009; Moles et al., 2003; Zeilinger et al., 2006)。また、シミュ

レーテッドアニーリング(Kirkpatrick et al., 1983)は、代謝経路のパラメータ推定に利用さ

れている(Mendes and Kell, 1998)。

このような最適化法に対して、ベイズの定理に基づいたベイズの式を用いたパラメータ

推定法(以下ベイズパラメータ推定法)が提案されている(Eydgahi et al., 2013; Secrier et al.,

2009; Toni et al., 2009)。ベイズの定理に基づいた計算・解析方法は、生体分子ネットワー

ク数理モデルのパラメータ推定のみならず、モデル選択(Eydgahi et al., 2013; Kirk et al.,

2013; Toni et al., 2012; Toni and Stumpf, 2010a, b; Toni et al., 2009; Vyshemirsky and

Girolami, 2008)やバイオインフォマティクス(Wilkinson, 2007)などの領域でも用いられて

いる。ベイズパラメータ推定法では、拘束条件として用いる実験結果・データによって条

件づけられた、パラメータの事後分布を得ることを目的とする。ベイズパラメータ推定法

を最適化法として利用する場合、パラメータの事後分布の最頻値などを選んで最適値とみ

なすことができる。しかし、実験結果を再現するパラメータの最適値を“点”として推定

する最適化法と異なり、ベイズパラメータ推定法では結果を分布として得られるため、事

後分布の最適値周りの幅広さなどから推定値の不確実性を評価することができる(利点 1)。

また、あるパラメータの事後分布の幅が狭ければ、そのパラメータ値の変動は拘束条件と

して用いた実験結果に大きな影響を与えると予想できる。このような注目するシステムの

ふるまいへのパラメータの影響を評価する方法として、感受性解析や頑強性解析が存在す

るが(Eissing et al., 2007; Zi et al., 2005; Zi and Sun, 2005; Zi et al., 2008)、ベイズパラメ

ータ推定法においては事後分布の形状や幅広さからパラメータの感受性解析・頑強性解析

も可能となる(Secrier et al., 2009; Toni et al., 2009) (利点 2)。さらに、数値計算による事

後分布の計算では、事後分布を構成する大量のパラメータのサンプルを得ることができる

ため、異なるパラメータ間の相関などを調べることで、生体分子ネットワークを構成する

タンパク質や生化学反応間の関係性といった情報も得ることができる(Eydgahi et al.,

2013) (利点 3)。このように、パラメータの最適値を“点”として推定する最適化法と比べ

ると、ベイズパラメータ推定法にはいくつかの利点がある。特に、利点 2 と 3 のように、

パラメータ推定過程でシステムの解析も行うことができることは、大きな利点であると考

えられる。

Page 15: Title 生体分子ネットワークの数理モデリングとベイ …...したベイズの式の後分布の計算アルゴリズムとして、 マルコフ連鎖モンテカルロ法とポ

14

1.1.1.3 実験データとパラメータ推定

ベイズパラメータ推定法を用いるとき、既存の実験結果・データをパラメータ推定のため

の拘束条件として用いることになる。拘束条件として用いる実験データは、タンパク質量

の時系列データであることが多い(図 1.2.A)(Eydgahi et al., 2013; Secrier et al., 2009; Toni

et al., 2012; Toni et al., 2009)。しかし、パラメータ推定に必要な時系列データが必ずしも

入手可能であるとは限らない。さらに、注目する生体分子ネットワークに含まれる複数種

類の生体分子の時系列データを用いても、モデル中の全てのパラメータ推定値の不確実性

を十分小さくすることができないことが知られている(Gutenkunst et al., 2007)。このよう

な問題への対処法として、時系列データ以外の実験結果・データの利用を考えることがで

きる。

時系列データ以外の実験データとして、観測量のヒストグラムがある(図 1.2.B)。例えば、

TRAIL によって刺激を受けた細胞内でアポトーシス実行に関与する酵素である活性型

caspase-3濃度が低濃度から高濃度になるのにかかる時間は細胞ごとに異なり、多数の細胞

を用いたときのこれらの時間の分布は、刺激として用いる TRAIL濃度に依らず右に裾を引

く分布(ヒストグラム)となることが知られている(Albeck et al., 2008b)。他の例として、ガ

ンマ線照射による DNAダメージによって、細胞内で p53やMdm2タンパク質のパルスが

観測されることが知られているが(Batchelor et al., 2008; Geva-Zatorsky et al., 2006;

Lahav et al., 2004; Loewer et al., 2010; Purvis et al., 2012)、パルスの強度や幅、p53と

Mdm2 タンパク質のパルスピークの間隔は、対数正規分布で近似されうることが知られて

いる(Geva-Zatorsky et al., 2006)。このように、多数の細胞を用いた実験で得られた観測量

について、ヒストグラムやそれを近似する確率分布を用いて結果が記述されることがある。

また、時系列データやヒストグラムのように明確な形で表されないが、実験結果・デー

タから抽出できる情報として、分岐 (bifurcation)の存在を示唆する情報がある (図

1.2.C)(Novak and Tyson, 2008; Tyson et al., 2008; Tyson et al., 2003; Tyson and Novak,

2010)。分岐とは、注目する系を記述する数理モデルにおいて、数理モデル中のパラメータ

値を変化させたときに系の振る舞いが質的に変化することである(Strogatz, 2001)。例えば、

外部からの入力刺激に対する細胞(集団)の出力応答が、ある閾値を境にして全か無かの形式

に従うような場合や(図 1.2.C)、入力刺激を一時的に与えて刺激を除いた後でも系の状態が

刺激を与える前の状態に戻らないヒステリシスを示すような場合は、サドルノード分岐の

存在が示唆される。このような分岐に関して実験による確認がなされた例としては、アポ

トーシスシグナル伝達系(Sun et al., 2010)や血液の線溶系(Venkatraman et al., 2011)、細

胞周期の制御系(Pomerening et al., 2003; Sha et al., 2003; Yao et al., 2008)などが挙げら

れる。ただし、時系列データやヒストグラムと異なり、分岐を示唆する情報は陽な形で表

現されていないため、パラメータ推定を目的とした使用の可否についてはその都度検討す

る必要がある。

Page 16: Title 生体分子ネットワークの数理モデリングとベイ …...したベイズの式の後分布の計算アルゴリズムとして、 マルコフ連鎖モンテカルロ法とポ

15

このような時系列データ以外の実験データや情報も用いることができれば、時系列デー

タが入手できない場合でもパラメータ推定を行うことができる。また、時系列データに加

えて使用することで、推定したパラメータの不確実性を小さくすることができると考えら

れる。それでも不確実性を十分小さくできない場合は、ベイズパラメータ推定を用いる場

合に限り、推定された“点”としての特定のパラメータ値を用いるのではなく、パラメー

タの事後分布全体を用いて解析やシミュレーションを行う方法がある(Eydgahi et al.,

2013)。この点も、ベイズの定理に基づいた事後分布を求めることができるベイズパラメー

タ推定法の利点の 1つである。

図 1.2 様々な種類の実験結果・データの例. (A) 時系列データ. 観測時点におけるタンパク質濃度な

どがプロットされる. (B) ヒストグラムデータ. 多数の細胞を用いた実験などで、観測量の各値を示

した細胞の頻度が集計される. (C) 分岐の存在を示唆するデータ. 細胞集団に与える刺激を強くして

いくと、個々の細胞はある閾値(刺激=中)を境に強く応答するかしないかという、全か無かの形式で

ふるまう. このような結果は、サドルノード分岐の存在を示唆している.

Page 17: Title 生体分子ネットワークの数理モデリングとベイ …...したベイズの式の後分布の計算アルゴリズムとして、 マルコフ連鎖モンテカルロ法とポ

16

1.1.2 ベイズの式と事後分布の計算アルゴリズム

1.1.2.1 ベイズの式

ベイズの定理により、パラメータの事後分布 obsD| は、パラメータの事前分布 と

尤度 |obsDP によって

|| obsobs DPD

というベイズの式で表される。ここで、obsD は観測されたデータ、はパラメータベクトル

である。パラメータの事前分布 とは、パラメータに関する既存の知識や前提に基づい

て事前に決定されるパラメータの分布である。事前分布には、事前の知識や前提が無い場

合には、一様分布や大きな値の分散をもつ正規分布などが使用される。尤度 |obsDP とは、

あるパラメータ値のときにデータobsD が観測される尤もらしさの程度である。観測された

データobsD を固定して考えると、パラメータの値によって尤度 |obsDP の値は変化する

ことから、 |obsDP は尤度関数とも呼ばれる。パラメータの事後分布 obsD| はデータobsD

によって条件づけられたパラメータの分布である。ベイズの式は、パラメータの事後分布

は尤度と事前分布の積に比例するという関係性を表している。

ベイズパラメータ推定法では、実験結果obsD によって条件づけられたパラメータ値の事

後分布 obsD| を用いて、最適なパラメータ値の決定や、事後分布の幅広さなどから推定

値の不確実性の評価、パラメータの感受性解析などを行う。

1.1.2.2 ベイズ事後分布の計算アルゴリズム

1.1.1.2 節で述べたように様々な利点のあるベイズパラメータ推定法だが、そのパラメー

タ推定過程では事後分布の計算を必要とする。極めて簡単な統計モデルの場合には事後分

布を陽な数式として解析的に得ることが可能だが、本研究のように微分方程式で表された

数理モデルを用いる場合には、一般的に不可能である。そのような場合には、事後分布か

らのパラメータのサンプリングアルゴリズムとして、マルコフ連鎖モンテカルロ法

(Markov chain Monte Carlo methods 以下MCMC)(Hastings, 1970; Metropolis et al.,

1953)が利用される(Eydgahi et al., 2013)。

ここで、ベイズの式を用いたMCMCによるパラメータ推定の流れについて説明する。例

として次のような問題を考える。あるタンパク質濃度の時系列の実験結果があって(図 1.3.A

実験結果)、その実験結果を説明する数理モデルを作りたい。数理モデルを、あるパラメー

タ(例えばタンパク質の合成・分解速度)と時間を入力として、その時間のタンパク質濃度を

出力として返す関数の形で作ったが、実験結果を上手く説明できるパラメータの値がわか

Page 18: Title 生体分子ネットワークの数理モデリングとベイ …...したベイズの式の後分布の計算アルゴリズムとして、 マルコフ連鎖モンテカルロ法とポ

17

らない(図 1.3.A 数理モデル)。このような問題を解くために、ベイズの式を用いて MCMC

によってパラメータの分布を求める。MCMCでは、はじめに適当に選んだパラメータの値

(図 1.3.B の MCMC ステップ 0)から、各ステップで新たなパラメータ値をランダムに提案

する。そして、提案されたパラメータ値を受容するか棄却するか判定する。例えば、図 1.3.B-a

でステップ 1 からステップ 2 で提案されたパラメータ値のシミュレーション結果は実験結

果と近いため、尤度が大きく、そのパラメータ値は受容される。受容されれば、その新た

に提案されたパラメータ値に更新が行われる。一方、例えば図 1.3.B-bでステップ 2からス

テップ 3で提案されたパラメータ値のシミュレーション結果は実験結果とかけ離れており、

尤度が小さく、そのパラメータ値は棄却される。棄却されれば、その提案されたパラメー

タ値への更新は行われず、元のパラメータ値のままである(図 1.3.B-c)。この過程を繰り返

すことで得られるパラメータ値の系列は、各ステップでの新たなパラメータ値の提案と受

容/棄却の判定が適切であれば、ベイズの式の事後分布からのサンプルになっている(図

1.3.C)。これらのサンプルを集計すれば、事後分布の形状を描くこともできる(図 1.3.C)。

この事後分布を用いることで、最も確率の大きなパラメータ値を選ぶことができるし、事

後分布の幅からパラメータ値の不確実性についての情報を得ることもできる。以上が、ベ

イズの式を用いたMCMC によるパラメータ推定の流れである。

しかしMCMCでは、事後分布の形状によっては確率の低い領域から動きにくくなり、事

後分布全体からのサンプリングが困難になることが知られている(Sisson et al., 2007)。 こ

のような場合の対処法として、多数の粒子の集まりを用いて粒子を生成・消滅させること

で分布の計算を行う、ポピュレーション型モンテカルロ法 (population Monte Carlo)(Iba,

2001)と総称される方法を用いることができる。ポピュレーション型モンテカルロ法の中で、

遂次モンテカルロ法 (Sequential Monte Carlo 以下 SMC)(Del Moral, 2006)は生体分子ネ

ットワークの数理モデルのベイズパラメータ推定やモデル選択に利用されている(Secrier

et al., 2009; Toni et al., 2012; Toni and Stumpf, 2010b; Toni et al., 2009)。しかし、これら

の研究では、SMCは approximate Bayesian computation (以下 ABC)とよばれる枠組みで

使用されており、ABC でない通常のアプローチも含めた上での生体分子ネットワーク数理

モデルのベイズパラメータ推定やモデル選択へは適用されていない。また、これらのアル

ゴリズムを、時系列データ以外の実験結果・データを利用したベイズパラメータ推定法に

適用できるようにすれば、より信用性の高いパラメータ推定が可能になると考えられる。

Page 19: Title 生体分子ネットワークの数理モデリングとベイ …...したベイズの式の後分布の計算アルゴリズムとして、 マルコフ連鎖モンテカルロ法とポ

18

図 1.3 ベイズの式による MCMC を用いたパラメータ推定の概略. (A) 実験結果としてタンパク質

濃度の時系列データがあるときに、その実験結果を説明するための数理モデルを作る。このとき、数

理モデル中のパラメータ値は実験結果を再現できるように設定したい. (B) MCMC では各ステップ

で、 新たなパラメータ値の提案→受容/棄却の判断 を繰り返す. (C) Bのプロセスを繰り返してでき

るパラメータ値の系列を集計すれば、パラメータの事後分布を求めることができる.

Page 20: Title 生体分子ネットワークの数理モデリングとベイ …...したベイズの式の後分布の計算アルゴリズムとして、 マルコフ連鎖モンテカルロ法とポ

19

1.1.3 研究の目的

本研究の目的は、

1. 細胞生物学的実験に頻出するようなヒストグラムで表された実験結果や分岐を示唆す

る(量的ではなく)質的な情報も利用できるベイズパラメータ推定法の考案

2. 考案したベイズパラメータ推定法の MCMC やポピュレーション型モンテカルロ法へ

の実装方法の考案

の 2点である。

本研究では、時系列データ以外の実験結果・データも柔軟に取り扱うことができるベイ

ズパラメータ推定法の開発を行った。ヒストグラムで表された実験結果をベイズアプロー

チで取り扱えるようにするために、ABCを利用した。ABCは、尤度の評価が解析的・計算

的に困難である場合に、尤度の直接評価を回避して近似的な事後分布を得る方法である

(Beaumont et al., 2002; Marjoram et al., 2003; Sisson and Fan, 2011; Sisson et al., 2007;

Sunnaker et al., 2013)。ABCでは、観測データとシミュレーションデータの“距離”を測

る重み付け関数で尤度を置き換えているとみなすことができるため(Sisson and Fan, 2011)、

重み付け関数を適切に定義することによってヒストグラムで表された実験結果を取り扱え

るようにした。また、分岐を示唆する情報をベイズアプローチで取り扱えるようにするた

め、分岐の存在を前提としたパラメータの事前分布である分岐事前分布を、新たに定義・

導入した。

本研究では、考案したベイズパラメータ推定法を、MCMCとポピュレーション型モンテ

カルロ法で実装した。特に、ポピュレーション型モンテカルロ法の中で、ポピュレーショ

ンアニーリング(population annealing 以下 PA)(Hukushima and Iba, 2003)を用いて事後

分布からサンプリングする方法を考案した。

Page 21: Title 生体分子ネットワークの数理モデリングとベイ …...したベイズの式の後分布の計算アルゴリズムとして、 マルコフ連鎖モンテカルロ法とポ

20

1.2 ベイズパラメータ推定法

本節では、本研究で考案したベイズパラメータ推定法におけるヒストグラムデータ、分

岐情報、時系列データの取り扱い方法について説明する。最後に、それら複数の様々なタ

イプの実験結果・データを同時に取り扱うベイズの式について説明する。

1.2.1 ヒストグラムデータ

ヒストグラムデータをベイズアプローチで取り扱うために ABC を利用する。ABC は、

ベイズの式の尤度関数 |obsDP を、観測データとシミュレーションデータの“距離”を測

る重み付け関数 ,, simobsw DDdf で置き換えることで、近似的な事後分布を得る方法である

と解釈できる。ここでsimD はパラメータの下でのシミュレーションデータ、 simobs DDd , は

観測データとシミュレーションデータの距離、はデータ間の距離の許容範囲である。重み

付け関数は、観測データとシミュレーションデータの距離が近い場合は大きな値を、遠い

場合は小さな値をとるように設定する。例えば、重み付け関数を

simobssimobsw DDdIDDdf ,,,

とすると、ベイズの式の事後分布は

simobssimobs DDdIDDd , ,|

と近似される(Marjoram et al., 2003; Secrier et al., 2009; Sisson and Fan, 2011; Sisson et

al., 2007; Toni and Stumpf, 2010b; Toni et al., 2009)。ここで I は()内の条件が満たされ

れば 1、満たされないなら 0となる指示関数とする。この例では、観測データとシミュレー

ションデータの距離が 以下ならそのパラメータの事後確率が 0ではなく、 より大きい

なら事後確率が 0 になる。重み付け関数は、観測データとシミュレーションデータ間の距

離が近いときに大きな値を取るように定義されるなら、指示関数以外の設定も可能である

(Sisson and Fan, 2011)。ただし、ABCの枠組みで重み付け関数を用いた場合に得られる事

後分布は、真の事後分布を近似する“近似事後分布”である。

ヒストグラムは、実験で注目する観測量expo の関数

exphist of とみなすことができる。ここ

で、観測量expo に対する関数

exphist of の値は、ヒストグラムの高さである。この解釈は、観

測量を確率変数とみなしたときに、ヒストグラムが確率密度関数で近似されうる

(Geva-Zatorsky et al., 2006)ことからも、理にかなっている。

これらをふまえて、あるパラメータ値におけるシミュレーションによって、実験で注目

Page 22: Title 生体分子ネットワークの数理モデリングとベイ …...したベイズの式の後分布の計算アルゴリズムとして、 マルコフ連鎖モンテカルロ法とポ

21

する観測量expo に相当する観測量

simo の値が得られたとき、実験データとシミュレーション

データの距離を simhist of と定義する(図 1.4)。これは ABCにおける重みづけ関数を

simhistsimobsw ofDDdf ,,

と設定していることに相当する。ただし、このときの重み付け関数は、通常の ABC の場合

と異なり尤度に相当するものではなくなるため、ヒストグラムデータを用いて得られる事

後分布は、ABCの枠組みの近似事後分布からも離れた意味でのパラメータの分布になる。

この設定では、シミュレーションで得られた観測値が実際の実験で高頻度に得られる観

測値であれば、そのシミュレーションで用いたパラメータ値に大きな重み付けがなされる

ことになる(図 1.4 sim1o の場合)。逆に、シミュレーションで得られた観測値が実験で得られ

る可能性の低い観測値であれば、そのシミュレーションで用いたパラメータ値に小さな重

み付けがなされる(図 1.4 sim2o の場合)。このような重み付け結果は、直観的にも理にかなっ

たものであると考えられる。

図 1.4 ヒストグラムデータの取り扱い例. ある観測量に関して図のようなヒストグラムデータが実

験で得られているとする. あるパラメータにおけるシミュレーションで観測量の値simo が得られたな

ら、そのパラメータは simhist of で重みづけられる. 例えば、実験で得られやすい値がシミュレーショ

ンで得られたならば(sim1o )、そのパラメータは重い重み付けがなされる( sim1hist of ). 実験で得られに

くい値がシミュレーションで得られたならば(sim2o )、そのパラメータは軽い重み付けがなされる

( sim2hist of ).

Page 23: Title 生体分子ネットワークの数理モデリングとベイ …...したベイズの式の後分布の計算アルゴリズムとして、 マルコフ連鎖モンテカルロ法とポ

22

1.2.2 分岐情報

分岐の存在を示唆するような実験結果・データをベイズアプローチで取り扱うために、

分岐の存在を前提とした事前分布として、分岐事前分布 bifを定義・導入する。分岐事前

分布とは、分岐の存在を考慮しない通常の事前分布 に従うパラメータのうち、シミュ

レーションなどによって分岐が起こることが確認されたパラメータからなる事前分布と定

義する。指示関数を用いると

bifIbif

と表すことができる。ここで bifI はパラメータのもとで分岐が起これば 1、おこらなけ

れば 0 の値をとる指示関数である。注目する生体分子ネットワークシステムで、分岐の存

在を示唆する実験結果だけが存在し、他の時系列データやヒストグラムデータなどが無い

場合は、パラメータ推定の際に尤度関数を使用せず分岐事前分布だけを用いることになる。

そのような場合の事後分布は、

bifI

D bifobs

|

となり、実質的に分岐事前分布となる。

1.2.3 時系列データ

時系列データのベイズアプローチによる取り扱いは、システム生物学の問題において既

に確立されている(Eydgahi et al., 2013; Toni et al., 2009)。時系列データの取り扱いでは、

実験データとシミュレーションデータの差を、正規分布などの確率分布に従う誤差として

評価することが多い(Eydgahi et al., 2013)。例えば、時点 ),...1( Ttt における実験データ

値を t

expx 、パラメータの下でのシミュレーションデータ値を t

simx とすると、正規分布の分

散を時点に関わらない定数 2 とするとき、尤度は

2

21

2 2

1exp

2

1| t

sim

t

exp

T

t

obs xxDP

と表される。ここでは、実験による観測データは TtxD t

expobs ,,.,1| である。

Page 24: Title 生体分子ネットワークの数理モデリングとベイ …...したベイズの式の後分布の計算アルゴリズムとして、 マルコフ連鎖モンテカルロ法とポ

23

時系列データは、ABCの枠組みの中でも取り扱うことができる(Toni and Stumpf, 2010b;

Toni et al., 2009)。システム生物学で用いられる場合の ABCでは、重み付け関数を指示関

simobssimobsw DDdIDDdf ,,,

と定義することが多い。指示関数中の観測データとシミュレーションデータの距離

s i mobs DDd , には、例として残差二乗和

T

t

t

sim

t

expsimobs xxDDd1

2,

などが用いられる。データ間の距離の許容範囲である は、問題に応じて経験的に設定され

る(Toni and Stumpf, 2010b; Toni et al., 2009)。ただし、時系列データを ABCの枠組みで

重み付け関数を用いて取り扱った場合に得られる事後分布は、真の事後分布を近似する近

似事後分布である。

1.2.4 ベイズの式による全データの取り扱い

ここでは実験結果・データとして、ヒストグラムデータ ),...,1( IiDi

hist 、分岐情報

),...,1( JjD j

bif 、時系列データ ),...,1( KkDk

time がそれぞれ複数存在する場合、それら全データ

を利用したベイズパラメータ推定法を可能とするベイズの式を考える。

サンプリングの対象となる事後分布 K

timetime

J

bifbif

I

histhist DDDDDD ,...,,,...,,,...,| 111 が、尤度関数、重

みづけ関数、事前分布によってどのように表されるかを考える。分岐情報群について、全

ての分岐情報を満たす分岐事前分布 all

bifを考えると、ベイズの定理により、事後分布は

all

bif

K

timetime

I

histhist

K

timetime

J

bifbif

I

histhist

DDDDP

DDDDDD

|,...,,,...,

,...,,,...,,,...,|

11

111

と表される。さらに各分岐の存在の有無を、指示関数 jbifI を用いて表すと、事後分布は

J

j

jK

timetime

I

histhist

K

timetime

J

bifbif

I

histhist

bifIDDDDP

DDDDDD

1

11

111

|,...,,,...,

,...,,,...,,,...,|

Page 25: Title 生体分子ネットワークの数理モデリングとベイ …...したベイズの式の後分布の計算アルゴリズムとして、 マルコフ連鎖モンテカルロ法とポ

24

と表すことができる。ここで

J

j

jall

bif bifI1

である。次に、尤度関数を各実験データの条件付き分布に展開すると

K

k

J

j

jk

time

I

i

i

hist

J

j

j

histhisthisthist

I

histtime

K

time

K

time

J

j

jK

timetime

I

histhist

bifIDPDP

bifIDPDDPDDDDDP

bifIDDDDP

1 11

1

112111

1

11

||

|,|...,,...,,,...,|

|,...,,,...,

と表すことができる。以上の式変形では恣意的だが、全ての実験結果・データは各々独立

であると仮定した。ここで、ABC の枠組みの中でヒストグラムデータ取り扱うと、

i

sim

i

hist

i

hist ofDP | と置き換えることができるので、事後分布は

J

j

jK

k

k

time

I

i

i

sim

i

hist

K

timetime

J

bifbif

I

histhist

bifIDPof

DDDDDD

111

111

|

,...,,,...,,,...,|

と表される。実際の事後分布からのパラメータサンプリングの計算は、この展開式を用い

て行うことになる。さらに、時系列データも ABCの枠組みで取り扱う場合には、尤度の代

わりに kk

sim

k

time

k

w

k

time DDdfDP ,,| のように重み付け関数を利用して、時系列データとシ

ミュレーションデータの距離を評価する。この場合の事後分布は

J

j

jK

k

kk

sim

k

time

k

w

I

i

i

sim

i

hist

K

timetime

J

bifbif

I

histhist

bifIDDdfof

DDDDDD

111

111

,,

,...,,,...,,,...,|

と表される。ただし、時系列データを ABCの枠組みで重み付け関数を用いて取り扱った場

合に得られる事後分布は、真の事後分布を近似する近似事後分布である。また、ヒストグ

ラムデータを用いて得られる事後分布は、ABC の枠組みの近似事後分布からも離れた意味

でのパラメータの分布である。

Page 26: Title 生体分子ネットワークの数理モデリングとベイ …...したベイズの式の後分布の計算アルゴリズムとして、 マルコフ連鎖モンテカルロ法とポ

25

1.3 事後分布の計算アルゴリズム

本節では、考案したベイズパラメータ推定法の事後分布からのパラメータサンプリング

アルゴリズムとして、MCMCと PAを用いる方法について説明する。

1.3.1 マルコフ連鎖モンテカルロ法 (MCMC)

MCMC(Hastings, 1970; Metropolis et al., 1953)は、サンプリングを行いたい確率分布に

従う乱数を発生させるアルゴリズムである。ベイズパラメータ推定法では、サンプリング

を行いたい確率分布はパラメータの事後分布だが、本研究ではベイズの式で通常の事前分

布でなく分岐事前分布を用いるため、MCMCアルゴリズムの最初のステップで分岐事前分

布によるパラメータの初期化を行うことにする。その結果得られるMCMCのメトロポリス

-ヘイスティングス(MH)アルゴリズムは、MCMCの総ステップ数をNとすると以下のよう

になる。

[MCMC-MHアルゴリズム]

MC1.0 を分岐事前分布

J

j

jall

bif bifI1

に従うように初期化する.

MC2.提案分布qによって候補値 nq |~' を提案する.

MC3.以下の確率 で '1 nとする.

n

K

timetime

J

bifbif

I

histhistn

n

K

timetime

J

bifbif

I

histhist

qDDDDDD

qDDDDDD

|',...,,,...,,,...,|

'|,...,,,...,,,...,|',1min

111

111

そうでなければnn 1とする.

MC4. n<Nなら n=n+1としてMC2へもどる. n=Nなら終了する.

このMCMCアルゴリズムは、パラメータの事後分布 K

timetime

J

bifbif

I

histhist DDDDDD ,...,,,...,,,...,| 111 が

定常分布になるように設計されている。実際の計算では、事後分布を展開した

J

j

jK

k

k

time

I

i

i

sim

i

hist

K

timetime

J

bifbif

I

histhist bifIDPofDDDDDD111

111 |,...,,,...,,,...,|

Page 27: Title 生体分子ネットワークの数理モデリングとベイ …...したベイズの式の後分布の計算アルゴリズムとして、 マルコフ連鎖モンテカルロ法とポ

26

に置き換えて、 の計算を行う。また、MC1のパラメータの初期化の際には、ABCの枠組

みで時系列データやヒストグラムデータを取り扱う場合は、それらの重み付け関数値が 0

とならないように初期化する必要がある。

1.3.2 ポピュレーションアニーリング (PA)

1.3.2.1 アルゴリズム

PA は、ポピュレーション型モンテカルロ法の 1 つであり、annealed importance

sampling(Neal, 2001)を拡張して開発されたアルゴリズムである。Annealed importance

samplingでは、分布を構成する粒子のもつ重みがしばしば大きく変動して計算が安定しな

い場合があるため、この問題を解決するために粒子の復元抽出(resampling)過程が PAアル

ゴリズム内に含まれている(Hukushima and Iba, 2003)。同じポピュレーション型モンテカ

ルロ法である SMC と比べたときの PA の利点として、PA は最適化法であるシミュレーテ

ッドアニーリングを多数の粒子に独立に行うアルゴリズムと解釈できるため、最適化法と

しての使用・解釈が容易であるということが挙げられる。

PAは、サンプリングの容易な初期分布から中間分布とよばれる分布群を経て最終分布ま

で徐々に系の温度を下げる“焼きなまし(annealing)”によって、サンプリングを行いたい

対象である最終分布からのサンプルを得る方法である。これまでの研究では、PAは主に統

計力学領域で用いられてきた(Hukushima and Iba, 2003; Machta, 2010)。統計力学の問題

では、系のパラメータとして陽に温度を含んでいるため、PAの適用は容易である。しかし、

本研究のベイズパラメータ推定法の事後分布は温度パラメータを陽に含まない。そのため、

温度パラメータを陽に含まないあらゆる確率分布に適用できるように、PAを改変する必要

がある。そこで、annealed importance sampling でも利用されている仮想的逆温度

)10( ff を導入する(Neal, 2001; Vyshemirsky and Girolami, 2008)。仮想的逆温度を

0から 1に徐々に上げていくことは、統計力学の問題で系の温度を徐々に下げていくことに

相当する。仮想的逆温度を用いると、パラメータの初期分布が 、サンプリングを行い

たい最終分布が事後分布 obsD| であるとき、アニーリングで通過する中間分布 IMf は

fff

obsIM Df

1|

と定義される。仮想的逆温度が 0 のときには中間分布は初期分布のみに比例し、仮想的逆

温度を 1 まで上げれば中間分布は最終分布のみに比例する。m 番目の中間分布の仮想的逆

温度を ),...,0( Mmf

m とすると、 00 f 、 1f

M とすれば、 f

0 のとき初期分布、 f

M のとき

最終分布となる。このとき PA アルゴリズムは、統計力学で用いられるバージョン

(Hukushima and Iba, 2003)から、以下のように書き換えられる。

Page 28: Title 生体分子ネットワークの数理モデリングとベイ …...したベイズの式の後分布の計算アルゴリズムとして、 マルコフ連鎖モンテカルロ法とポ

27

[PAアルゴリズム]

PA1. ),...,1( Lll を、 f

IMf 0 に独立に従うように初期化する(Lは総粒子数).

各粒子の重みを Lwl /10 と初期化する.

PA2. 1m から Mm まで、各mで全粒子に対して独立に以下の手順を行う.

(a)次式に従うように各粒子の重みを更新し、全粒子の重みの和が 1となるように

重みを正規化する.

l

IM

l

IMl

m

l

m fm

fm

f

fww

11

(b)定常分布が fm

IMf となるような有限回のMCMCを各粒子に独立に行う.

(c)適当なタイミングで次のリサンプリングを行う.

<リサンプリング>

各粒子の選ばれる確率を

L

l

l

m

l

ml

w

wP

1

として L個の粒子を復元抽出する.

(d) 1 mm として(a)にもどる.

ステップ PA2(c)の適当なタイミングとして、本研究では SMC で用いられている

ESS(effective sample size)の値によって、リサンプリングの判断を下す(Sisson et al., 2007)。

ESSは

L

l

l

mw

ESS

1

2

1

で定義される。ESSは、全ての粒子が均等な重みをもっていれば L、1つの粒子だけが全て

の重みをもっていれば 1 となるので、粒子の重みの偏りを表していることになる。ESS が

事前に設定した閾値以下ならリサンプリングを行うこととする。本研究では Sisson らの研

Page 29: Title 生体分子ネットワークの数理モデリングとベイ …...したベイズの式の後分布の計算アルゴリズムとして、 マルコフ連鎖モンテカルロ法とポ

28

究に従い、リサンプリング判定の閾値を 2/ESS とした(Sisson et al., 2007)。

1.3.2.2 中間分布の設定

本研究で考案したベイズパラメータ推定法を PAで実装する際、実験結果・データの種類

によって様々な中間分布の設定を以下のように考えることができる。

1.ヒストグラムデータ

ヒストグラムデータの場合は、仮想的逆温度を用いることでアニーリングを行うことがで

きる。パラメータ推定に使用する実験がヒストグラムデータだけである場合は、事後分布

I

i

i

sim

i

hist

I

histhist ofDD1

1 ,...,|

となるので、PAの初期分布 を事前分布 とすれば、中間分布は

f

f

f

fff

I

i

i

sim

i

hist

I

i

i

sim

i

hist

I

histhistIM

of

of

DDf

1

1

1

11 ,...,|

となる。仮想的逆温度を 0 から 1 まで上昇させると、徐々にヒストグラムの形が影響して

いくことになる。

2.分岐情報

パラメータ推定に使用する実験が分岐情報だけである場合は、事後分布が

J

j

jJ

bifbif bifIDD1

1 ,...,|

となって指示関数の積になる。この場合は、徐々に系の温度を下げるアニーリングを、徐々

に推定に用いる分岐情報が増える過程とみなす。m番目の中間分布を

Page 30: Title 生体分子ネットワークの数理モデリングとベイ …...したベイズの式の後分布の計算アルゴリズムとして、 マルコフ連鎖モンテカルロ法とポ

29

)0( mff

m

IM

),...1(1

JmbifIfm

j

j

IM

fm

とすれば、m を 0 から J まで増やすことで分岐情報が 1 つずつ影響していくことになり、

アニーリングの過程を模倣できる。

3.時系列データ

時系列データは、実験データとシミュレーションデータの差をガウス分布などの確率分布

に従う誤差として評価する場合は、仮想的逆温度を用いてアニーリングを行うことができ

る。パラメータ推定に使用する実験が時系列データだけである場合は、事後分布が

K

k

k

time

K

timetime DPDD1

1 |,...,|

となり、PAの初期分布 を事前分布 とすれば、中間分布は

f

f

f

fff

K

k

k

time

K

k

k

time

K

timetimeIM

DP

DP

DDf

1

1

1

11

|

|

,...,|

となる。仮想的逆温度を 0 から 1 まで上昇させると、徐々に誤差を評価する確率分布の形

が影響していくことになる。

一方、時系列データを ABCの枠組みで取り扱う場合は、事後分布が重み付け関数を含む

K

k

kk

sim

k

time

k

w

K

timetime DDdfDD1

1 ,,,...,|

となる。この場合は、データ間の距離の許容範囲である を徐々に小さくすることで、アニ

ーリング過程を模倣することができる(Toni et al., 2012; Toni and Stumpf, 2010b; Toni et

al., 2009)。具体的には、m番目の中間分布を

Page 31: Title 生体分子ネットワークの数理モデリングとベイ …...したベイズの式の後分布の計算アルゴリズムとして、 マルコフ連鎖モンテカルロ法とポ

30

K

k

k

m

k

sim

k

time

k

wIM DDdfff

m

1

,,

として、m の増加で各 kについて k

m が徐々に小さな値をとるようにすれば、アニーリング

の過程を模倣できる。全ての kについて k

0 とすれば、初期分布は事前分布と一致する

ことになる。

これらのヒストグラムデータ、分岐情報、時系列データが混在している場合にも、同様

にアニーリングを行うことができる。例えば、はじめに分岐情報を徐々に増やしながらア

ニーリングを行ったあとで、ヒストグラムデータと時系列データそれぞれに異なる仮想的

逆温度を設定してアニーリングを行う、などである。このように様々な種類の実験結果・

データが混在している場合でも、柔軟に中間分布を設定することで、PAを用いたベイズパ

ラメータ推定が可能となる。

Page 32: Title 生体分子ネットワークの数理モデリングとベイ …...したベイズの式の後分布の計算アルゴリズムとして、 マルコフ連鎖モンテカルロ法とポ

31

1.4 数理モデル

本研究では、考案したベイズパラメータ推定法と計算アルゴリズムを 2 つの数理モデル

に適用して、有効性のテストを行った。本節では、それら 2 つの数理モデルについて説明

する。はじめに新たに導入した簡単な 1 転写因子モデルについて説明し、次に Legewie ら

によって構築された既存のカスパーゼカスケードモデル(Legewie et al., 2006)について説

明する。

1.4.1 転写因子モデル

本節では、はじめに 1 転写因子モデルの構造と微分方程式について説明し、推定対象の

パラメータを明示する。次に、テストに用いるために生成した分岐情報、ヒストグラムデ

ータ、時系列データについて説明する。最後に、この問題のベイズの式への適用とMCMC

と PAを用いた具体的なシミュレーションの設定について説明する。

1.4.1.1 モデルと問題設定

考案したベイズパラメータ推定法と計算アルゴリズムのテストのために、転写因子に相

当するタンパク質 1 変数のみからなる、簡単な 1転写因子モデルを導入した(図 1.5.A)。こ

のモデルでは、転写因子 Xがポジティブフィードバックによって自身の発現を促進する。X

濃度[X]を変数としたモデルの微分方程式は

nn

n

pdsXK

XkXkk

dt

Xd

][

][][

][

となる。X 濃度は生成(右辺第 1 項)、分解(右辺第 2 項)、ポジティブフィードバックによる

生成(右辺第 3項)によって変動する。

この 1転写因子モデルにおいて、テストのためにパラメータ推定問題として答えの値

)5.0,0.1,0.1(),,( Kkk pdanswer

を設定し、この値の情報を使わずにこれらの値のパラメータ推定を行うこととした。モデ

ルの入力刺激は合成速度定数 sk とし、ヒル定数nの値は問題の単純化のため 5n に固定して、

これらのパラメータは既知とした。また、ここではパラメータや時間の次元は考えない。

Page 33: Title 生体分子ネットワークの数理モデリングとベイ …...したベイズの式の後分布の計算アルゴリズムとして、 マルコフ連鎖モンテカルロ法とポ

32

以下の節では、これら答えの値と既知として固定した値にパラメータ値を設定して、テス

トに用いる“実験データ”に相当する分岐情報、時系列データ、ヒストグラムデータを生

成してある。

図 1.5 1 転写因子モデル. (A) 1 転写因子モデルの構造. φからの矢印は Xの生成、φへの矢印は分

解、X自身へもどる矢印はポジティブフィードバックを表す. (B) 分岐解析図. 赤は安定定常状態 青

は不安定定常状態を表す. (C) 0.1sk のときの時系列データ. TeはX濃度が最大濃度の90%に達する

までにかかった時間を表している. (D) 観測ノイズを加えた場合の時系列データ. (E) 微分方程式に

ノイズを加えた場合の時間 100における X濃度の分布. (F) 微分方程式にノイズを加えた場合に X濃

度が最大濃度の 90%に到達するまでにかかった時間の分布

Page 34: Title 生体分子ネットワークの数理モデリングとベイ …...したベイズの式の後分布の計算アルゴリズムとして、 マルコフ連鎖モンテカルロ法とポ

33

1.4.1.2 分岐情報

構築した 1転写因子モデルでは、系への入力刺激であるsk の値の変化によって 25.0sk 付

近でサドルノード分岐が起こり、sk がサドルノード分岐点より小さい場合は 2つの安定定常

状態と 1 つの不安定定常状態をもち、大きい場合は 1 つの安定定常状態をもつという双安

定性を示す(図 1.5.B)。よって、sk がサドルノード分岐点より小さい双安定領域にある場合

に X 濃度は低いが、サドルノード分岐点より大きくなれば高濃度状態になり、いったん高

濃度になれば入力刺激が無くなっても( 0sk )高濃度が保たれるという不可逆性を示す。こ

の分岐情報をbifD と表し、パラメータ推定に用いた。

1.4.1.3 時系列データ

1 転写因子モデルで 0.1sk のとき X 濃度は図 1.5.C のような時系列を示す。実際の実験

ではデータ観測の際に観測ノイズが加わると考えられるため、正規分布 )01.0,0(N に従うノ

イズが観測時に加わるとして、時間 1ごとに観測された時系列データを生成した(図 1.5.D)。

この時系列データをtimeD と表し、パラメータ推定に用いた。

1.4.1.4 ヒストグラムデータ

ヒストグラムデータの観測量として、 0.1sk のときの時間 100における X濃度(図 1.5.E)

と、X 濃度が最大濃度の 90%に到達するまでにかかった時間(execution time 以下 Te)(図

1.5.F)の 2つを採用した。実際の細胞では転写や翻訳過程も含めた化学反応は確率的に生起

するため、それらの揺らぎの効果を模倣して微分方程式に正規分布 )1,0(N に従うノイズを

加えて 10000 回モンテカルロ法を行うことで両観測量のヒストグラムデータを生成した。

時間 100 における X 濃度のヒストグラムデータを ][ X

histD 、Teのヒストグラムデータを T

histD と

表し、パラメータ推定に用いた。

1.4.1.5 ベイズの式によるデータの取り扱い

全てのデータ・情報を利用した場合のベイズの式の事後分布は、時系列データを尤度関

数で取り扱う場合は、

bifIDPofof

DDDD

time

X

sim

X

hist

T

sim

T

hist

timebif

X

hist

T

hist

|

,,,|

][][

][

Page 35: Title 生体分子ネットワークの数理モデリングとベイ …...したベイズの式の後分布の計算アルゴリズムとして、 マルコフ連鎖モンテカルロ法とポ

34

と表される。時系列データを ABCの枠組みで重み付け関数を用いて取り扱う場合の事後分

布は、

bifIDDdfofof

DDDD

simtimew

X

sim

X

hist

T

sim

T

hist

timebif

X

hist

T

hist

,,

,,,|

][][

][

と表される。

1.4.1.6 シミュレーションの設定

・分岐情報

分岐情報の指示関数 bifI は、 2.0,0.0sk のときに 2つの安定定常状態と 1つの不安定定

常状態をもち、 0.1,3.0sk のときに 1つの安定定常状態をもつ場合に 1の値をとるとし、そ

うでなければ 0の値をとるとした。

・ヒストグラムデータ

ヒストグラムデータの重み付け関数 T

sim

T

hist of と ][][ X

sim

X

hist of は、シミュレーションの結果得ら

れる各観測量の値 T

simo と ][ X

simo を入力としてヒストグラムの相対頻度値を出力とする関数とし

た。

・時系列データ

時系列データの尤度は、時点に関わらない分散 2 をもつ正規分布を用いてデータ間誤差

を評価した

2

2

10

12 2

1exp

2

1| t

sim

t

time

t

time xxDP

とした。時系列データをこのように取り扱う場合は、分散 2 も推定対象のパラメータとし

た。

また、ABCの枠組みによる計算の際の重み付け関数 ,, simtimew DDdf は

simtimesimtimew DDdIDDdf ,,,

とし、指示関数中の観測データとシミュレーションデータの距離 simobs DDd , は、

Page 36: Title 生体分子ネットワークの数理モデリングとベイ …...したベイズの式の後分布の計算アルゴリズムとして、 マルコフ連鎖モンテカルロ法とポ

35

10

1

2,

t

t

sim

t

timesimtime xxDDd

とした。MCMCによる計算でのデータ間の距離の許容範囲 は、 2.0 とした。

・アニーリング

PAのアニーリングは、時系列データやヒストグラムデータに関わらず、仮想的逆温度を

用いる際は、アニーリングスケジュールを

アニーリングスケジュール 1: 0.1,75.0,5.0,.25.0,0.0,,,, 43210 fffff

または、

アニーリングスケジュール 2: 0.1,1.0,01.0,.001.0,0.0,,,, 43210 fffff

とした。時系列データでデータ間の距離の許容範囲を用いる場合には、アニーリングスケ

ジュールを

アニーリングスケジュール 3: 2.0,1,5,.10,50,,,, 43210

とした。最終分布の許容範囲値 2.04 は、MCMCによる計算の場合と同じ値である。

・事前分布

推定対象となるパラメータの事前分布 は、常用対数スケールでの一様分布とした。

一様分布の上限と下限は、各パラメータの答えの値 )5.0,0.1,0.1(),,( Kkk pdanswer の 10

倍と 0.1倍の値とした。また、分散 2 の推定も行う場合(同節の“時系列データ”参照)、 2

の事前分布は常用対数スケールで 0.00001~10.0の範囲の一様分布とした。

・提案分布

MCMC と PA 内の MCMC ステップにおける提案分布qによるパラメータ候補値の提案

は、1つのパラメータをランダムに選び、一様分布 ]25.0,25.0[ に従う乱数 uを用いて、 u10

を乗じた値を候補値とした。また、分散 2 の推定も行う場合(同節の“時系列データ”参照)

で、分散 2 が値を変えるパラメータとして選ばれた場合は、一様分布 ]75.0,75.0[ に従う

乱数 uを用いて、 u10 を乗じた値を候補値とした。

Page 37: Title 生体分子ネットワークの数理モデリングとベイ …...したベイズの式の後分布の計算アルゴリズムとして、 マルコフ連鎖モンテカルロ法とポ

36

・事後分布の計算

MCMC では 3.3×106ステップの計算を行った。はじめの 0.3×106ステップはバーンイ

ンとして捨て、残りの 3.0×106ステップのうち 3 ステップに 1 回のパラメータ値を用いて

事後分布の計算を行った。ただし、分散 2 の推定も行う場合(同節の“時系列データ”参照)

は、MCMC では合計 4.4×106ステップの計算を行い、はじめの 0.4×106ステップはバー

ンインとして捨て、残りの 4.0×106ステップのうち 4 ステップに 1 回のパラメータ値を用

いて事後分布の計算を行った。

PAでは 1.0×105個の粒子を用いて事後分布の計算を行った。また、粒子ごとに 3ステッ

プのMCMCを PAアルゴリズム内で行った。ただし、分散 2 の推定も行う場合(同節の“時

系列データ”参照)は、粒子ごとに 4 ステップずつの MCMC を PA アルゴリズム内で行っ

た。

・95%信用区間の計算

MCMC で事後分布の計算に使ったパラメータサンプルを用いて 95%信用区間の計算を

行った。95%信用区間は、区間の両外側の領域がそれぞれ 2.5%のデータを含む区間として

定義した。また、信用区間の幅を、信用区間の上限値と下限値の比の常用対数として定義

した。

・数値計算

微分方程式の数値計算には 4次のルンゲクッタ法を用いた。ステップサイズを 0.01とし、

時間 100まで合計 10000ステップの計算を行った。X濃度の初期値は 0とした。分岐解析

における定常解は、微分方程式の右辺を 0 とした方程式をニュートンラフソン法によって

解くことで求めた。定常解の安定性解析は、微分方程式を線形近似して得られるヤコビ行

列の各定常解での固有値を計算することで行った。

Page 38: Title 生体分子ネットワークの数理モデリングとベイ …...したベイズの式の後分布の計算アルゴリズムとして、 マルコフ連鎖モンテカルロ法とポ

37

1.4.2 カスパーゼカスケードモデル

本節では、はじめに Legewie らによって構築された既存のカスパーゼカスケードモデル

について説明し、推定対象となるパラメータを明示する。次に、テストに用いるための分

岐情報と実験の文献(Albeck et al., 2008a; Albeck et al., 2008b)から得たヒストグラムデー

タを近似する確率分布について説明する。最後に、この問題のベイズの式への適用とMCMC

と PAを用いた具体的なシミュレーションの設定について説明する。

1.4.2.1 モデルと問題設定

Legewie らによって構築されたカスパーゼカスケードの数理モデルは、ミトコンドリア

から放出されたシトクロム Cが Apaf-1を介してアポトーシス実行に関わる酵素 caspase-3

を活性化するまでのアポトーシスシグナル伝達経路をモデル化しており(図 1.6.A)、モデル

中の相互作用は常微分方程式系によって表現されている(付録 1) (Legewie et al., 2006)。こ

のネットワーク構造の特徴は、活性型 caspase-3が caspase-9を活性化するポジティブフィ

ードバックと、カスパーゼ阻害タンパク質 XIAPが caspase-9と caspase-3の両方に結合し

て阻害するポジティブフィードバックである(図 1.6.B)。特に、後者のポジティブフィード

バックはインプリシットポジティブフィードバック(implicit positive feedback 以下 IPF)

とよばれ、サドルノード分岐の存在、活性型 caspase-3が低濃度か高濃度のどちらかの状態

しか安定にとりえない双安定性、活性型 caspase-3が一度高濃度状態になれば低濃度状態に

戻らない不可逆性にとって重要であると考えられている(Legewie et al., 2006)。このような

双安定性と不可逆性の生物学意義として、caspase-3はアポトーシスにおける DNA断片化

を起こすタンパク質の活性を制御していることから(Janicke et al., 1998; Wolf et al., 1999)、

caspase-3 の中間濃度状態が安定でなく高濃度状態から低濃度状態へ遷移しないことは、

caspase-3 の部分的な活性化によりゲノムにダメージをもつ悪性細胞出現の防止に重要で

あると考えられている(Albeck et al., 2008a; Vaughan et al., 2002)。また、ノイズによる不

適切なアポトーシス誘発の回避も、生物学的意義の 1 つと考えられている(Albeck et al.,

2008a)。

数理モデル中で、IPFは XIAP(X)と 4種類の caspase-9(C9, AC9, C9*, AC9*)+1種類の

caspase-3(C3*)間の、合計 5 種類の相互作用として記述されている(図 1.6.A)。これらの相

互作用に関わるパラメータのうち、X-C9間と X-C3*間の会合速度定数の値は実験的に決定

されている(Riedl et al., 2001; Salvesen and Duckett, 2002)。そこで、パラメータ推定のテ

スト問題として(実験的に決定されている値を使わずに)、IPFに関わるパラメータのうち、

5 種類すべての XIAP-caspase 間相互作用の会合速度定数 *)3( CXkasso 、 )9( CXkasso 、

)9( ACXkasso 、 *)9( CXkasso 、 *)9( ACXkasso のパラメータ推定を行うこととした(付録 1)。

Page 39: Title 生体分子ネットワークの数理モデリングとベイ …...したベイズの式の後分布の計算アルゴリズムとして、 マルコフ連鎖モンテカルロ法とポ

38

このパラメータ推定のテスト問題では、実験的に決定されている速度定数については、実

験値と推定した値とを比較することができる。ただし、問題の単純化のため、XIAP-caspase

間相互作用の解離速度定数のパラメータ推定は行わないこととした。また、ベイズパラメ

ータ推定過程で行うことのできるシステム解析の例として、95%信用区間と相関係数を用い

た解析を行った。さらに、パラメータ推定で得られる事後分布全体を用いて、caspase-3、

caspase-9、XIAP のいずれかのタンパク質濃度をそれぞれ増加または減少させた場合の、

活性型 caspase-3濃度の双安定性に与える影響についての予測も行った。

1.4.2.2 分岐情報

Legewieらのモデルでは、系への入力刺激である Apaf-1濃度の値の変化によっておよそ

3nM付近でサドルノード分岐が起こり、Apaf-1濃度がサドルノード分岐点より小さい場合

は 2 つの安定定常状態と 1 つの不安定定常状態をもち、大きい場合は 1 つの安定定常状態

をもつという双安定性を示す(図 1.7.A)。よって、Apaf-1濃度がサドルノード分岐点より小

図 1.6 カスパーゼカスケードモデル. (A) モデルの構造. 実線の矢印はタンパク質間の複合体形

成・解離、活性化過程を表す. 点線の矢印は反応の促進を表す. モデルへの入力刺激は A、出力は

C3*である. 赤矢印はインプリシットポジティブフィードバックを表す. 略称は A: Apaf-1、C9:

caspase-9、C3: caspase-3、X: XIAP、*:活性型. (B) モデルの相互作用の要約図. 矢印は活性化過

程を表す. 先にバーのある赤線は結合阻害過程を表す. XIAPによる両 caspaseの結合阻害が、イン

プリシットポジティブフィードバックの実体である.

Page 40: Title 生体分子ネットワークの数理モデリングとベイ …...したベイズの式の後分布の計算アルゴリズムとして、 マルコフ連鎖モンテカルロ法とポ

39

さい双安定領域にある場合には活性型 caspase-3濃度は低いが、サドルノード分岐点より大

きくなれば高濃度状態になる。また、いったん高濃度状態になれば、入力刺激が無くなっ

ても(Apaf-1濃度 = 0)高濃度状態が保たれるという不可逆性を示す。この分岐情報をbifD と

表し、パラメータ推定に用いた。

1.4.2.3 ヒストグラムデータ

Legewieらのモデルでは、Apaf-1濃度が 20nMのとき、活性型 caspase-3の濃度変化が

図 1.7.Bのようになる。このような活性型 caspase-3の時系列に関して、活性型 caspase-3

濃度が低濃度から高濃度になるまでにかかる時間(switching time 以下 Ts)のヒストグラム

と平均値と標準偏差が、細胞集団を用いた実験によって得られている(Albeck et al., 2008b)。

しかし、文献からヒストグラムの相対頻度の正確な値を読み取ることは不可能であるため、

対数正規分布(Limpert et al., 2001)と、実験で得られている平均値と標準偏差(Albeck et al.,

図 1.7 カスパーゼカスケードモデルの性質. (A) 分岐解析図. 赤は安定定常状態 青は不安定定常状

態を表す. (B) Apaf-1濃度=20nMのときの時系列データ. Tsは switching time、Teは execution time

を表す. (C) 対数正規分布で近似された Tsの分布. (D) 対数正規分布で近似された Teの分布.

Page 41: Title 生体分子ネットワークの数理モデリングとベイ …...したベイズの式の後分布の計算アルゴリズムとして、 マルコフ連鎖モンテカルロ法とポ

40

2008b)を用いて、Tsのヒストグラムデータを近似する関数を考えた(図 1.7.C)。具体的な関

数形については、1.4.2.5 節で述べる。このヒストグラムデータを近似する関数としてのデ

ータを swi

histD と表し、パラメータ推定に用いた。

また、ミトコンドリアからシトクロム C が流出してから活性型 caspase-3 濃度が高濃度

になるまでにかかる時間(execution time 以下 Te)は個々の細胞ごとに異なるが、およそ

10~20 分程度であることが実験的に知られている(Albeck et al., 2008a)。しかし、文献に

Te のヒストグラムデータは示されていないため、Ts と同様に対数正規分布に従うと仮定し

て、Teが10~20分の範囲になるような関数を考えた(図1.7.D)。具体的な関数形については、

1.4.2.5 節で述べる。このような関数としてのデータを exe

histD と表し、パラメータ推定に用い

た。

1.4.2.4 ベイズの式によるデータの取り扱い

全てのデータ・情報を利用した場合のベイズの式の事後分布は

bifIofof

DDD

exe

sim

exe

hist

swi

sim

swi

hist

bif

exe

hist

swi

hist

,,|

と表される。

1.4.2.5 シミュレーションの設定

・分岐情報

分岐情報の指示関数 bifI は、Apaf-1濃度が 0.001、2.0のときに 2つの安定定常状態と

1つの不安定定常状態をもち、Apaf-1濃度が 20.0のときに 1つの安定定常状態をもつ場合

に 1の値をとるとし、そうでなければ 0の値をとるとした。

・ヒストグラムデータ

ヒストグラムデータの重み付け関数 swi

sim

swi

hist of と exe

sim

exe

hist of は、文献(Albeck et al., 2008a;

Albeck et al., 2008b)に基づき、それぞれ以下の対数正規分布に設定した(図 1.7.C、D)。

2

22ln

2

1exp

2

1s

swi

sim

ss

swi

sim

swi

sim

swi

hist oo

of

2

22ln

2

1exp

2

1e

exe

sim

ee

exe

sim

exe

sim

exe

hist oo

of

Page 42: Title 生体分子ネットワークの数理モデリングとベイ …...したベイズの式の後分布の計算アルゴリズムとして、 マルコフ連鎖モンテカルロ法とポ

41

ただし、s と s は期待値が 23 分と標準偏差が 10 分となるように設定し(Albeck et al.,

2008b)、e と e は期待値が 15 分と標準偏差が 3 分となるように設定した(Albeck et al.,

2008a)。観測量 swi

simo は、活性型 caspase-3濃度がシミュレーションでの活性型 caspase-3最

大濃度の 2.5%から 97.5%になるまでにかかる時間と定義した。観測量 exe

simo は、活性型

caspase-3濃度が時間 0分からシミュレーションでの活性型 caspase-3最大濃度の 90%にな

るまでにかかる時間と定義した。

・アニーリング

PAのアニーリングの仮想的逆温度は、アニーリングスケジュールを

アニーリングスケジュール 1: 0.1,75.0,5.0,.25.0,0.0,,,, 43210 fffff

または、

アニーリングスケジュール 2: 0.1,1.0,01.0,.001.0,0.0,,,, 43210 fffff

とした。

・事前分布

推定対象となる 5 種類の会合速度定数 *)3( CXkasso 、 )9( CXkasso 、 )9( ACXkasso 、

*)9( CXkasso 、 *)9( ACXkasso について、事前分布 を常用対数スケールでの一様分布と

した。一様分布の上限と下限を、各パラメータの答えの値(付録 1)の 10倍と 0.1倍の値とし

た。

・提案分布

MCMCと PA内のMCMCにおける提案分布qによるパラメータ候補値の計算は、1つの

パラメータをランダムに選び、一様分布 ]5.0,5.0[ に従う乱数 uを用いて、 u10 を乗じた値

を候補値とした。

・事後分布の計算

MCMC では 5.5×106ステップの計算を行った。はじめの 0.5×106ステップはバーンイ

ンとして捨て、残りの 5.0×106ステップのうち 5 ステップに 1 回のパラメータ値を用いて

事後分布の計算を行った。

PAでは 1.0×105個の粒子を用いて事後分布の計算を行った。また、粒子ごとに 5ステッ

プのMCMCを PAアルゴリズム内で行った。

Page 43: Title 生体分子ネットワークの数理モデリングとベイ …...したベイズの式の後分布の計算アルゴリズムとして、 マルコフ連鎖モンテカルロ法とポ

42

・95%信用区間の計算

MCMCで事後分布の計算に使ったパラメータサンプルを用いて、95%信用区間の計算を

行った。95%信用区間は、区間の両外側の領域がそれぞれ 2.5%のデータを含む区間として

定義した。また、信用区間の幅を、信用区間の上限値と下限値の比の常用対数として定義

した。

・相関係数の計算

MCMCで事後分布の計算に使ったパラメータサンプルを用いて、パラメータ間の相関係

数の計算を行った。相関係数は常用対数スケールで計算した。

・タンパク質濃度変化の双安定性への影響の予測

Caspase-3、caspase-9、XIAP それぞれの合成速度定数 3 ksc 、 9ksc 、ksxi を 1 つ選び、

値(付録 1)を 2 倍か 1/2 倍して、事後分布を構成する全パラメータに対して分岐解析を行っ

た。Apaf-1濃度を 0から 1刻みで 20まで増加させて分岐解析を行い、1回でも 2つの安定

定常状態と 1つの不安定定常状態をもつなら双安定性をもつと判定した。この基準の下で、

事後分布を構成する全パラメータ中で双安定性を示したものの割合を、双安定性割合とし

て計算した。双安定性割合の計算の際には、MCMCの場合は事後分布の全てのパラメータ

が同じ重みを持つとし、PAの場合は各粒子のもつ重みで双安定性割合を重み付けした。

・数値計算

連立微分方程式の数値計算には 4 次のルンゲクッタ法を用いた。ステップサイズを 0.01

分とし、時間 500分まで合計 50000 ステップの計算を行った。モデル中の各タンパク質濃

度の初期値は付録 1 の表のように設定した。分岐解析における定常解は、全ての微分方程

式の右辺を 0 とした連立方程式をニュートンラフソン法によって解くことで求めた。定常

解の安定性解析は、微分方程式を線形近似して得られるヤコビ行列の各定常解での固有値

を計算することで行った。

Page 44: Title 生体分子ネットワークの数理モデリングとベイ …...したベイズの式の後分布の計算アルゴリズムとして、 マルコフ連鎖モンテカルロ法とポ

43

1.5 結果と考察

1.5.1 転写因子モデル

本節では、はじめに 1 転写因子モデルのパラメータ推定結果について説明する。節の最

後に、本テスト結果をふまえて、考案したベイズの式を用いたベイズパラメータ推定法と

各アルゴリズムへの実装について考察する。

1.5.1.1 MCMCによるパラメータ推定

MCMCで得られた各パラメータの周辺事後分布のヒストグラムを図 1.8に示す。ヒスト

グラム中の赤で色づけされた階級の中央値が、各パラメータの答えの値である。本研究で

は周辺事後分布の最頻値をパラメータの推定量とすることとし、赤矢印で表している。ま

た、95%信用区間幅の計算結果を図 1.9に示す。

従来行われるように、時系列データのみを用いて正規分布でデータ間誤差を評価した場

合は、各パラメータの推定値が答えの値に一致するか近い値になっていた(図 1.8.A)。しか

し、dk のように信用区間が比較的狭く推定値の信用性の高いパラメータもあったが、他の

2つのパラメータの信用区間は 1オーダー程度の幅があり、推定値の信用性が高いとはいえ

なかった(図 1.9)。正規分布の分散の推定値は、答えの値と極めて近い値が推定された(付録

3.2.A)。ABC の枠組みでデータ間誤差を評価した場合も、おおよそ同じような形の周辺事

後分布が得られた(付録 3.1.A)。

ヒストグラムデータのみを用いた場合は、時系列データを用いた場合と似たような周辺

事後分布が得られた(図 1.8.B)。周辺事後分布が似ているため、信用区間の幅も近い値とな

った(図 1.9)。この結果は、時系列データとヒストグラムデータのそれぞれの生成方法は異

なっても、両データが似たような情報をもっていたことを示唆している。

分岐情報のみを用いた場合は、各パラメータの推定値が答えの値に近い値になっていた

(図 1.8.C)。しかし、pk が小さな値をとりにくいということ以外は、周辺事後分布は一様分

布のようになり、信用区間も非常に広く、推定値の信用性も低かった(図 1.9)。

時系列データと分岐情報を用いた場合は、尤度に正規分布を用いてデータ間誤差を評価

した場合も、ABC の枠組みで計算を行った場合も、各パラメータの推定値が答えの値に一

致した(図 1.8.D、付録 3.1.B)。さらに 1 種類だけのデータ・情報を用いた場合と比べて全

てのパラメータで信用区間が大きく狭まっており、推定値の信用性が高くなった(図 1.9)。

また、尤度で用いた正規分布の分散の推定値は、答えの値と一致した(付録 3.2.B)。

ヒストグラムデータと分岐情報を用いた場合は、各パラメータの推定値が答えの値に一

致するか極めて近い値になった(図 1.8.E)。さらに、1 種類だけのデータ・情報を用いた場

Page 45: Title 生体分子ネットワークの数理モデリングとベイ …...したベイズの式の後分布の計算アルゴリズムとして、 マルコフ連鎖モンテカルロ法とポ

44

合と比べて、全てのパラメータで信用区間が大きく狭まっており、推定値の信用性が高く

なった(図 1.9)。この場合も、時系列データと分岐情報を用いた場合と似たような周辺事後

分布が得られた。この結果も、時系列データとヒストグラムデータが似たような情報をも

っていたことを示唆している。

図 1.8 MCMCによって計算された 1 転写因子モデルの各パラメータの周辺事後分布. 赤い階級の

中央値が答えの値. 赤い矢印は周辺事後分布の最頻値. (A) 時系列データを用いた場合. (B) ヒスト

グラムデータを用いた場合. (C) 分岐情報を用いた場合. (D) 時系列データと分岐情報を用いた場

合. (E) ヒストグラムデータと分岐情報を用いた場合.

Page 46: Title 生体分子ネットワークの数理モデリングとベイ …...したベイズの式の後分布の計算アルゴリズムとして、 マルコフ連鎖モンテカルロ法とポ

45

図 1.9 95%信用区間幅. ヒストグラ

ムの色は図 1.8で、青:時系列データ、

赤:ヒストグラムデータ、緑:分岐情

報、ピンク:時系列データと分岐情報、

シアン:ヒストグラムデータと分岐情

報、を用いた場合に対応している.

図1.10 PAによって計算された1転写因子モデルの各パラメータの周辺事後分布. 赤い階級の中央

値が答えの値. 赤い矢印は周辺事後分布の最頻値. (A) アニーリングスケジュール 1で時系列データ

と分岐情報を用いた場合. (B) アニーリングスケジュール 2 で時系列データと分岐情報を用いた場

合. (C) アニーリングスケジュール 1でヒストグラムデータと分岐情報を用いた場合. (D) アニーリ

ングスケジュール 2でヒストグラムデータと分岐情報を用いた場合.

Page 47: Title 生体分子ネットワークの数理モデリングとベイ …...したベイズの式の後分布の計算アルゴリズムとして、 マルコフ連鎖モンテカルロ法とポ

46

1.5.1.2 PAによるパラメータ推定

PA で得られた各パラメータの周辺事後分布のヒストグラムを図 1.10 と付録 3.3、3.4 に

示す。これらの PA による周辺事後分布の計算結果は、MCMC で得られた結果とほとんど

一致していた。また、PAのアニーリングスケジュールが異なっても、最終的に得られる周

辺事後分布はほとんど一致していた。異なるアルゴリズムで同様の事後分布が得られたこ

とから、得られた事後分布の計算結果は信頼性の高いものであると考えられる。

1.5.1.3 考察

前述の結果より、データや情報を単独ではなく、複合して用いることで、推定値は答え

の値と一致するか極めて近い値をとりやすくなることがわかった。また、同時に信用区間

幅が狭まり、信用性の高いパラメータ推定が可能となることがわかった。これは、本研究

で考案した方法を用いることでパラメータ推定に使用できる情報量が増え、正しい値を高

い信用性で求められる可能性が高まることを示している。

時系列データの取り扱いの際に、尤度に正規分布を用いてデータ間誤差を評価した場合

と ABCの枠組みで計算を行った場合を比べると、得られたパラメータの周辺事後分布には

大きな違いは見られなかった。しかし、パラメータ推定問題や尤度などの設定によって、2

つの方法の結果に大きな食い違いが生じる可能性がある。そのような場合には、両アプロ

ーチでより狭い信用区間を示した結果の方を採用するなどの基準を定めて、パラメータ推

定を行う必要があると考えられる。

MCMC と PA のそれぞれで得られた事後分布には大きな違いがなかった。これは、考案

したベイズパラメータ推定法の実装アルゴリズムとして、両アルゴリズムが適切であるこ

とを示している。しかしMCMCでは、事後分布の形によっては、事後分布全体からのサン

プリングが困難になることが知られているため(Sisson et al., 2007)、例えば複数の実験結

果を拘束条件として用いた高次元のパラメータ空間からのサンプリングなどの複雑な問題

の際には、PAを用いるほうが安全であると考えられる。

さらに PAでは、仮想的逆温度のアニーリングスケジュールが異なっても、最終的に得ら

れる周辺事後分布はほとんど一致していた。この結果は理論的に得られるべき結果であり、

本研究における PAのアニーリングスケジュールが適切であったことを示唆している。また、

得られた事後分布の計算結果は信頼性の高いものであることを示唆している。

Page 48: Title 生体分子ネットワークの数理モデリングとベイ …...したベイズの式の後分布の計算アルゴリズムとして、 マルコフ連鎖モンテカルロ法とポ

47

1.5.2 カスパーゼカスケードモデル

本節では、はじめにカスパーゼカスケードモデルのパラメータ推定結果について説明す

る。次に、信用区間と相関係数を用いたシステムのふるまいの解析について説明する。ま

た、各タンパク質濃度を増加・減少させた場合の、活性型 caspase-3濃度の双安定性への影

響を、事後分布全体を用いて予測した結果を説明する。節の最後に、考案したベイズの式

を用いたパラメータ推定法と、ベイズパラメータ推定法によるシステム解析・予測につい

て考察を行う。

1.5.2.1 MCMCによるパラメータ推定

MCMC によって計算した各パラメータの周辺事後分布のヒストグラムを図 1.11 から図

1.15 に示す。ヒストグラム中の赤で色づけされた階級の中央値が、実験的に決定されてい

る値である(Riedl et al., 2001; Salvesen and Duckett, 2002)。ヒストグラム中の緑で色づけ

された階級の中央値が、実験的に決定されていないが Legewie らの研究で用いられた値で

ある(Legewie et al., 2006)。本研究では周辺事後分布の最頻値をパラメータの推定量とする

こととし、赤矢印で表している。

はじめに、実験的に値の決定されているパラメータの推定結果に注目する。パラメータ

*)3( CXkasso の推定結果は、分岐情報のみを用いた場合には、推定値は答えの値と外れてい

た(図 1.11)。しかし、ヒストグラムデータとして swi

histD や exe

histD のいずれかが加わると、推定値

は答えの値と近くなった。さらに両方のヒストグラムデータを用いると、推定値は答えの

値と一致した。パラメータ )9( CXk asso の推定結果は、分岐情報をのみを用いた場合とヒス

トグラムデータのうち swi

histD を加えて用いた場合には、推定値は答えの値と外れていた(図

1.12)。しかし分岐情報に加えてヒストグラムデータ exe

histD を用いた場合には、推定値は答え

の値と極めて近い値を推定することができた。これらの 2 つのパラメータ推定では、パラ

メータ推定に用いる情報・データの数が増えることで、実験的に決定されている値を推定

することができた。

次に、実験的に値が決定されていないパラメータの推定結果に注目する。パラメータ

)9( ACXk asso の推定結果は、分岐情報をのみを用いた場合とヒストグラムデータのうち swi

histD

を加えて用いた場合には、推定値は答えの値と大きく外れていた(図 1.13)。分岐情報に加え

てヒストグラムデータ exe

histD を用いた場合には、大きな値をとりにくい傾向が見られたが、周

辺事後分布は明らかなピークを示さなかった。パラメータ *)9( CXk asso は、全ての場合にお

いて推定値は Legewie らの研究で用いられた値を推定した (図 1.14)。パラメータ

*)9( ACXk asso は、パラメータ推定に用いるデータ・情報に関わらず、大きな値をとりにく

い傾向が見られ、推定値もおおよそ同じ値だった(図 1.15)。これらの 3つのパラメータ推定

Page 49: Title 生体分子ネットワークの数理モデリングとベイ …...したベイズの式の後分布の計算アルゴリズムとして、 マルコフ連鎖モンテカルロ法とポ

48

では実験的に答えの値が得られていないため、パラメータ推定の結果の成否について判断

できない。

1.5.2.2 PAによるパラメータ推定

PA によって計算した各パラメータの周辺事後分布のヒストグラムを付録 3.5 に示す。こ

れらの PA による周辺事後分布の計算結果は、MCMC で得られた結果とほとんど一致して

いた。また、PAのアニーリングスケジュールが異なっても、最終的に得られる周辺事後分

布はほとんど一致していた。異なるアルゴリズムで同様の事後分布が得られたことから、

得られた事後分布の計算結果は信頼性の高いものであると考えられる。

図 1.11 MCMC によって計算され

たカスパーゼカスケードモデルの

*)3( CXkasso の周辺事後分布. 赤い

階級の中央値が実験で決定されてい

る値. 赤い矢印は周辺事後分布の最

頻値 . (A) 分岐情報を用いた場合 .

(B) 分岐情報とTsのヒストグラムデ

ータを用いた場合. (C) 分岐情報と

Te のヒストグラムデータを用いた

場合. (D) 分岐情報と両方のヒスト

グラムデータを用いた場合.

図 1.12 MCMC によって計算され

たカスパーゼカスケードモデルの

)9( CXkasso の周辺事後分布. 赤い

階級の中央値が実験で決定されてい

る値. 赤い矢印は周辺事後分布の最

頻値 . (A) 分岐情報を用いた場合 .

(B) 分岐情報とTsのヒストグラムデ

ータを用いた場合. (C) 分岐情報と

Te のヒストグラムデータを用いた

場合. (D) 分岐情報と両方のヒスト

グラムデータを用いた場合.

Page 50: Title 生体分子ネットワークの数理モデリングとベイ …...したベイズの式の後分布の計算アルゴリズムとして、 マルコフ連鎖モンテカルロ法とポ

49

図 1.13 MCMC によって計算され

たカスパーゼカスケードモデルの

)9( ACXkasso の周辺事後分布 . 緑

の階級の中央値がLegewieらの用い

た値. 赤い矢印は周辺事後分布の最

頻値 . (A) 分岐情報を用いた場合 .

(B) 分岐情報とTsのヒストグラムデ

ータを用いた場合. (C) 分岐情報と

Te のヒストグラムデータを用いた

場合. (D) 分岐情報と両方のヒスト

グラムデータを用いた場合.

図 1.14 MCMC によって計算され

たカスパーゼカスケードモデルの

*)9( CXkasso の周辺事後分布. 緑の

階級の中央値がLegewieらの用いた

値. 赤い矢印は周辺事後分布の最頻

値. (A) 分岐情報を用いた場合. (B)

分岐情報と Ts のヒストグラムデー

タを用いた場合. (C) 分岐情報と Te

のヒストグラムデータを用いた場

合. (D) 分岐情報と両方のヒストグ

ラムデータを用いた場合.

図 1.15 MCMC によって計算され

たカスパーゼカスケードモデルの

*)9( ACXkasso の周辺事後分布. 緑

の階級の中央値がLegewieらの用い

た値. 赤い矢印は周辺事後分布の最

頻値 . (A) 分岐情報を用いた場合 .

(B) 分岐情報とTsのヒストグラムデ

ータを用いた場合. (C) 分岐情報と

Te のヒストグラムデータを用いた

場合. (D) 分岐情報と両方のヒスト

グラムデータを用いた場合.

Page 51: Title 生体分子ネットワークの数理モデリングとベイ …...したベイズの式の後分布の計算アルゴリズムとして、 マルコフ連鎖モンテカルロ法とポ

50

1.5.2.3 信用区間と相関係数の解釈

各パラメータの 95%信用区間に注目すると、2 つのパラメータ )9( CXk asso と

)9( ACXk asso の信用区間がヒストグラムデータ exe

histD を加えた場合に狭くなることがわかる

(図 1.16)。この結果は、Apaf-1 が活性化してから活性型 caspase-3 が高濃度になるまでに

かかる時間 Teの決定に、XIAP と結合していないフリーの C9 濃度と AC9 濃度が重要であ

ることを示唆している。この理由の解釈は、次のようになると考えられる。Apaf-1 による

刺激によってはじめに活性化されるのは C9 と AC9 であり、これが caspase-3 を活性化す

る。Caspase-3が活性化するとポジティブフィードバックが働きはじめ、入力刺激が増幅さ

れて、活性型 caspase-3濃度が急激に上昇する。このようにポジティブフィードバックの働

き始めるタイミングが caspase-3 濃度の急激な上昇のタイミングを決定しているため、

caspase-3 を活性化することでポジティブフィードバックのスイッチを入れることのでき

るフリーな C9 濃度と AC9 濃度は適切な領域にある必要がある。このことが、XIAP との

会合速度定数の信用区間幅に反映されていると解釈できる。

この解釈は、相関係数からも正当化されると考えられる (表 1.1)。 )9( CXk asso と

)9( ACXk asso 間の相関係数は、値自体は大きくないが、ヒストグラムデータ exe

histD が加わるこ

とで負の相関が強くなる。負の相関が強まることは、フリーな C9 濃度と AC9 濃度のどち

らかが適当な濃度で存在する必要があることを示唆している。それによってポジティブフ

ィードバックのスイッチを入れるタイミングが適切に調節され、活性型 caspase-3が高濃度

になるタイミングが調節される。このことが、結果的に XIAP との会合速度定数に反映さ

れていると解釈できる。

図 1.16 95%信用区間幅. ヒストグラ

ムの色は図 1.11 から図 1.15 で、青:

分岐情報、赤:分岐情報と Tsのヒスト

グラムデータ、緑:分岐情報と Teのヒ

ストグラムデータ、ピンク:分岐情報

と両方のヒストグラムデータ、を用い

た場合に対応している.

Page 52: Title 生体分子ネットワークの数理モデリングとベイ …...したベイズの式の後分布の計算アルゴリズムとして、 マルコフ連鎖モンテカルロ法とポ

51

表 1.1 パラメータ間の相関係数

パラメータ 1/パラメータ 2 bifD bifD

swi

histD bifD

swi

histD bifD

swi

histD exe

histD

)9( CXk asso / )9( ACXkasso -0.321 -0.328 -0.557 -0.572

)9( CXk asso / *)9( CXkasso -0.092 -0.071 -0.168 -0.178

)9( CXk asso / *)9( ACXkasso -0.009 0.019 -0.098 -0.101

)9( CXk asso / *)3( CXkasso 0.356 0.328 0.185 0.131

)9( ACXkasso / *)9( CXkasso 0.050 0.085 -0.014 0.043

)9( ACXkasso / *)9( ACXkasso 0.022 0.019 -0.042 -0.050

)9( ACXkasso / *)3( CXkasso -0.084 -0.060 -0.152 -0.094

*)9( CXkasso / *)9( ACXkasso 0.109 0.092 0.221 0.188

*)9( CXkasso / *)3( CXkasso 0.460 0.509 0.622 0.629

*)9( ACXkasso / *)3( CXkasso 0.101 0.085 0.192 0.145

1.5.2.4 タンパク質濃度変化の双安定性への影響の予測

各タンパク質濃度を 2倍に増加させた場合と 1/2倍に減少させた場合の活性型 caspase-3

の双安定性割合を、図 1.17 に示す。事後分布全体を用いて計算した場合は、計算アルゴリ

ズムに関わらず、caspase-9濃度を増加させた場合と XIAP濃度を減少させた場合は、系が

双安定性を示さなかった(図 1.17.A)。また、caspase-3濃度を増加させた場合は、系が双安

定性を示しにくくなった。これらは、アポトーシスを促進するようなタンパク質濃度の変

化である。一方で、caspase-9、caspase-3 濃度を減少させた場合や XIAP 濃度を増加させ

た場合は、双安定性割合に大きな変化が見られなかった。これらは、アポトーシスを抑制

するようなタンパク質濃度の変化である。1.5.2.1 節で推定したパラメータの最頻値を用い

た場合でも、同様の結果が得られた(図 1.17.B)。ただし、この場合の双安定性は、選ばれた

パラメータの最頻値によって双安定性を示すか示さないかという、全か無かの形式で決定

された。

これらの結果から、アポトーシスを抑制するようなタンパク質濃度の変化より、アポト

ーシスを促進するようなタンパク質濃度の変化のほうが、活性型 caspase-3の双安定性に大

きな影響を与えることが予測される。また、事後分布全体を用いた結果からは、caspase-3

濃度の増加より、caspase-9濃度の増加や XIAP濃度の減少の方が、活性型 caspase-3の双

安定性により大きな影響を与えることが予測される。

Page 53: Title 生体分子ネットワークの数理モデリングとベイ …...したベイズの式の後分布の計算アルゴリズムとして、 マルコフ連鎖モンテカルロ法とポ

52

1.5.2.5 考察

カスパーゼカスケードモデルでは、パラメータ推定に時系列データを直接用いることが

できなかったが、分岐情報やヒストグラムデータを用いることで、実験的に値が決定され

ているパラメータ値の推定が可能になった。また、分岐情報に加えてヒストグラムデータ

も用いることで信用区間が狭まり、信用性の高いパラメータ推定が可能となった。これは、

本研究で考案した方法を用いることでパラメータ推定に使用できる情報量が増え、正しい

値を高い信用性で求められる可能性が高まることを示している。

MCMC と PA のそれぞれで得られた事後分布には、大きな違いがなかった。これは、考

案したベイズの式の実装アルゴリズムとして、両アルゴリズムが適切であることを示して

いる。さらに PAでは、仮想的逆温度のアニーリングスケジュールが異なっても、最終的に

得られる周辺事後分布はほとんど一致していた。この結果は理論的に得られるべき結果で

あり、本研究における PAのアニーリングスケジュールが適切であったことを示唆している。

また、得られた事後分布の計算結果は信頼性の高いものであることを示唆している。

信用区間と相関係数の解析によって、パラメータ推定に用いた実験結果を再現するのに

図 1.17 タンパク質発現を促進・抑制した場合の活性型 caspase-3の双安定割合. upは 2倍に発現

を促進、downは 1/2 倍に発現を抑制した場合. 略称は C9:caspase-9、C3:caspase-3. (A) 事後分

布全体を構成するパラメータを用いた場合. (B) 周辺事後分布の最頻値を用いた場合. (a) MCMC で

計算した事後分布を用いた場合. (b) アニーリングスケジュール 1 の PA で計算した事後分布を用

いた場合. (c) アニーリングスケジュール 2の PAで計算した事後分布を用いた場合.

Page 54: Title 生体分子ネットワークの数理モデリングとベイ …...したベイズの式の後分布の計算アルゴリズムとして、 マルコフ連鎖モンテカルロ法とポ

53

重要なパラメータを特定し、その相互作用のもつ、系のふるまいにおける意味を解釈する

ことができた。一般にMCMCや PAを用いた事後分布の計算では、事後分布を構成するた

めに大量のパラメータデータをサンプリングで得ることになる。本研究のように、この過

程で得られる大量のパラメータデータを用いて相関係数などを計算すれば、系のふるまい

のパラメータへの依存性について調べることができる。

事後分布全体を用いた解析によって、各タンパク質濃度の増加・減少が、系の双安定性

にどの程度影響を及ぼすかについて予測することができた。“点”推定値を用いた解析では

影響を全か無かでしか予測できないのに対し、事後分布全体を用いた解析では影響の程度

を予測することができるため、より定量的な予測が可能になると考えられる。

Page 55: Title 生体分子ネットワークの数理モデリングとベイ …...したベイズの式の後分布の計算アルゴリズムとして、 マルコフ連鎖モンテカルロ法とポ

54

1.6 まとめ

1.6.1 本研究の成果

本章では、生体分子ネットワークの数理モデリングにおけるベイズパラメータ推定法、

実装アルゴリズム、2つの適用事例とその結果について説明した。

両適用事例において、パラメータ推定に用いる実験結果・データが増えるとともに、正

しいパラメータ値をより高い信用性で推定できることが示された。これは、本研究で考案

したベイズパラメータ推定法が柔軟な実験結果・データの取り扱いを可能にし、ベイズの

式に取り込める情報の幅を広げたことによるものであると考えられる。

MCMC と PA で得られる事後分布に大きな違いが無く、両アルゴリズムは考案したベイ

ズの式の実装アルゴリズムとして適当であることが示された。しかし、MCMCでは問題に

よって事後分布全体からのサンプリングが困難になる場合があるため(Sisson et al., 2007)、

複雑な問題に適用する際には PAを用いるほうが安全であると考えられる。

事後分布の信用区間や、事後分布計算の際に得られる大量のパラメータデータを用いた

相関の解析により、パラメータ推定と同時にシステム解析も行うことができた。また、タ

ンパク質濃度変化の系のふるまいへの影響の程度の予測も行うことができた。このような

事後分布を構成する大量のパラメータデータを用いた解析や予測は、ベイズパラメータ推

定法の利点であると考えられる。

本研究で考案したベイズパラメータ推定法と実装アルゴリズムは、生体分子ネットワー

クの数理モデリングに限らず、生態学、工学、薬学、経済学など様々な領域の数理モデリ

ングのパラメータ推定問題に適用できる。例えば、時系列データを得にくいような場合や、

時点を固定したデータが多く存在する場合には、本研究で考案したヒストグラムデータを

取り扱う方法や分岐情報などの質的な情報を取り扱う方法は有用であると考えられる。各

研究領域でのデータ表現の形式は多様であると考えられることからも、本研究で考案した

方法は広くパラメータ推定問題に有用であると考えられる。

1.6.2 今後の課題と展望

本研究では、比較的少ないパラメータ数のパラメータ推定問題を設定して考案した方法

を適用した。しかし、実際に取り扱う問題は、複数の実験結果で条件づけられた高次元の

パラメータの事後分布などであると考えられるので、パラメータによっては信用性の高い

推定が困難になることが予想される。また、推定したパラメータから実験結果を予測する

際、細胞集団の平均的なふるまいではなく、細胞集団中の個々の細胞がどのようにふるま

Page 56: Title 生体分子ネットワークの数理モデリングとベイ …...したベイズの式の後分布の計算アルゴリズムとして、 マルコフ連鎖モンテカルロ法とポ

55

い、その結果として細胞集団全体がどうふるまうかを予測したい場合もありうる。これら

の問題を取り扱うためには、事後分布から代表的なパラメータを 1 つ選ぶのではなく、事

後分布を構成するパラメータ全体を使った予測方法(Eydgahi et al., 2013)が有効であると

考えられる。本研究でも事後分布全体を用いた予測を行ったが、高次元のパラメータ推定

や細胞集団の個々の細胞のふるまいの予測方法について、今後検討する必要がある。

本研究では数理モデルの構造は決定されているとして、シミュレーション結果の実験結

果へのあてはまりの良さに基づいて、パラメータ値を推定した。しかし実際には、複数の

モデル構造の候補があり、その中からより良いモデルを選ぶようなモデル選択問題の存在

が考えられる。生体分子ネットワークの数理モデリングにおけるモデル選択問題では、モ

デルの複雑さをパラメータ数でペナルティとして考慮する AIC(Akaike, 1974)や

BIC(Schwarz, 1978)などの情報量規準に基づくモデル選択が行われることがある(Aoki et

al., 2011; Kirk et al., 2013)。しかし、時系列データなどは実験で得られるデータ数には限

りがあるため、データ数が十分大きな場合に有効な規準である AICや BICの使用の危険性

が指摘されている(Eydgahi et al., 2013)。このような問題の解決のため、モデルの周辺尤度

に基づいたベイズモデル選択法(Eydgahi et al., 2013; Toni et al., 2012; Toni and Stumpf,

2010b; Toni et al., 2009; Vyshemirsky and Girolami, 2008)が近年用いられている。これら

をふまえて、本研究で考案したベイズの式を用いたベイズモデル選択法の考案や、計算ア

ルゴリズムの開発も今後の課題である。

Page 57: Title 生体分子ネットワークの数理モデリングとベイ …...したベイズの式の後分布の計算アルゴリズムとして、 マルコフ連鎖モンテカルロ法とポ

56

Page 58: Title 生体分子ネットワークの数理モデリングとベイ …...したベイズの式の後分布の計算アルゴリズムとして、 マルコフ連鎖モンテカルロ法とポ

57

第 2章 p53パルスによる細胞運命決定機構

の数理モデリング

Page 59: Title 生体分子ネットワークの数理モデリングとベイ …...したベイズの式の後分布の計算アルゴリズムとして、 マルコフ連鎖モンテカルロ法とポ

58

2.1 背景と目的

本節では、第 2 章の研究の背景となる p53 パルスと細胞運命の関係について概説し、そ

れらをふまえて本研究の目的について述べる。

2.1.1 p53パルスと細胞運命の決定

癌抑制遺伝子産物である p53 は、様々な種類のストレスに応答してアポトーシスの誘発

や細胞周期の停止、DNA 修復などに関わる遺伝子発現を調節する転写因子である(Aylon

and Oren, 2007; Batchelor et al., 2009; Vogelstein et al., 2000)。p53は、細胞が受けた

DNAダメージが軽度で修復可能なら DNA修復を促す遺伝子発現を促進し、DNA ダメージ

が重度であればアポトーシスを誘発する遺伝子発現を促進すると考えられている(Aylon

and Oren, 2007; Vousden and Lane, 2007)。近年、腫瘍細胞を用いた一連の実験において、

ガンマ線照射による DNA ダメージにより、離散的なパルス様の p53 濃度の変化が個々の

細胞レベルで観測された(Batchelor et al., 2008; Geva-Zatorsky et al., 2006; Lahav et al.,

2004; Loewer et al., 2010; Purvis et al., 2012)。このとき、個々の p53 パルスの幅・高さ・

パルス間間隔はパルスごとに異なるが、それらの平均値は DNAダメージ量に依存せず、p53

パルスの数だけが DNAダメージによって増加すると考えられている(Lahav et al., 2004)。

これをふまえた、DNAダメージ量に依存した p53パルスの数がある閾値より多ければ細胞

がアポトーシスを起こし、少なければ細胞は生存できるという、“細胞が p53パルスの数を

数えて生死を決定する”という仮説が提示されている(Tyson, 2004)。

これらの実験や仮説をもとに、数理モデルを用いた p53 パルスと細胞運命決定の関係に

ついての研究が、既に複数行われている(Sun et al., 2009; Wee et al., 2009; Zhang et al.,

2007, 2009a; Zhang et al., 2009b; Zhang et al., 2010, 2011)。これらの研究では、細胞が

p53パルス数を数えるメカニズムを提案しているが、個々のパルスごとのサイズの変動が考

慮されていないため、発生したパルスの数によって細胞の運命は厳密に決まっている。し

かし、実際の細胞ではパルスサイズは変動するため、細胞の運命は、p53パルスの数で厳密

には決定されないことが予想される。

2.1.2 研究の目的

本研究の目的は、数理モデリングによって

1. 実験で観測されている p53 パルスサイズの変動が細胞運命決定の厳密さに及ぼす影響

を調べる

Page 60: Title 生体分子ネットワークの数理モデリングとベイ …...したベイズの式の後分布の計算アルゴリズムとして、 マルコフ連鎖モンテカルロ法とポ

59

2. 細胞運命決定の厳密さに影響を与える要因とメカニズムを調べる

の 2点である。

本研究では、Sunらのアポトーシスシグナル伝達経路の数理モデル(Sun et al., 2009)をも

とにして、細胞死決定の厳密さが、サイズの変動する p53パルスによってどのような影響

を受けるのかについて調べた。また、細胞死決定の厳密さに影響する要因として、p53によ

るアポトーシス促進因子 PUMA(Nakano and Vousden, 2001; Villunger et al., 2003; Yu et

al., 2001)の転写活性化過程の協同性に注目し、協同性が細胞死決定の厳密さにどのような

影響を及ぼすのかについて解析した。

Page 61: Title 生体分子ネットワークの数理モデリングとベイ …...したベイズの式の後分布の計算アルゴリズムとして、 マルコフ連鎖モンテカルロ法とポ

60

2.2 数理モデル

本節では、はじめに数理モデルの構造について説明する。次に、数理モデルへの入力刺

激として用いるサイズの変動する p53 パルスの生成方法について説明し、節の最後に具体

的なシミュレーションの設定について説明する。

2.2.1 モデルの設定

Sunらによって構築された数理モデルは、DNAダメージを受けた細胞で p53パルスが生

成され、ダメージシグナルがアポトーシスシグナル伝達経路に伝わってアポトーシスが誘

発されるまでをモデル化している(Sun et al., 2009)。しかし Sunらのモデルでは生成され

る p53 パルスのサイズが決定論的に決まっているため、実験で観測されるパルスサイズの

変動を表現できない。そこで本研究では、p53 パルスサイズの変動の効果を調べるために、

Sun らの数理モデル中で p53 パルス生成に関わる部分を除いた、ミトコンドリアアポトー

シスシグナル伝達経路の部分である“Bax 活性化スイッチモデル”を採用した(図 2.1、付

録 2)。

この数理モデルは p53 による PUMA 発現と、ミトコンドリア外膜に存在する、PUMA

を含めた Bcl-2 ファミリータンパク質群の相互作用(Brenner and Mak, 2009; Youle and

Strasser, 2008)をモデル化している(図 2.1)。モデルへの入力刺激は、ガンマ線照射による

DNAダメージで誘発・生成される p53パルスである。p53は Bcl-2ファミリータンパク質

の中で、PUMAの発現を促進する。p53によって転写活性化された PUMAは、アポトーシ

スを阻害する Bcl-2ファミリータンパク質である Bcl-2と複合体を形成して、その働きを抑

制する。Bcl-2の働きが抑制されると、Bcl-2から結合抑制を受けていた Baxや、Activator

と総称されるアポトーシスを促進する Bcl-2 ファミリータンパク質が働けるようになる。

Bax は、Activator や活性型 Bax によって活性化され、活性型 Bax が二量体を形成する

(Ruffolo and Shore, 2003; Tan et al., 2006)。活性型 Baxの二量体や多量体はミトコンドリ

ア外膜上の孔であり(Cory and Adams, 2002; Eskes et al., 2000)、形成された孔を介してミ

トコンドリアからシトクロム C が細胞質へ流出し、カスパーゼを活性化することでアポト

ーシスが誘発される。数理モデルの出力は、この活性型 Bax 二量体を実体とする孔の形成

量(形成される孔分子の濃度)である。このネットワークの特徴的な構造は、活性型 Bax

が不活性型 Bax を活性化するポジティブフィードバックと、Bcl-2 が Activator と活性型

Bax の両方に結合して阻害することによるインプリシットポジティブフィードバックであ

る。これらのポジティブフィードバックが、孔形成の双安定性や不可逆性にとって重要で

あると考えられている(Chen et al., 2007; Cui et al., 2008; Sun et al., 2009)。

Page 62: Title 生体分子ネットワークの数理モデリングとベイ …...したベイズの式の後分布の計算アルゴリズムとして、 マルコフ連鎖モンテカルロ法とポ

61

数理モデル中の相互作用は Sun らのモデルと同様の微分方程式よって表現したが、モデ

ル中のいくつかのパラメータは実験の文献に基づいて変更した(付録 2)(Weinberg et al.,

2004; Yu et al., 2001)。特に、p53による PUMA発現は Hill関数

nn

n

pKp

pkssp

]53[)53(

]53[53

によって表現し(付録 2)、協同性の指標である Hill定数 nの初期設定値を 2.0にした。これ

は in vitroの実験で、p53の DNAへの結合が、Hill定数 1.8の Hill関数で近似されること

に依拠している(Weinberg et al., 2004)。

図 2.1 Bax 活性化スイッチモデル. モデルへの入力刺激は p53、出力は Pore である. 黒い実線の

矢印はタンパク質間の複合体形成・解離とタンパク質の活性化・不活性化過程を表す. p53からの赤

い点線の矢印は転写活性化を表す. 黒い点線の矢印は反応の促進を表す. 略称は Act:Activator、

Pore:孔(活性型 Bax二量体)、*:活性型.

Page 63: Title 生体分子ネットワークの数理モデリングとベイ …...したベイズの式の後分布の計算アルゴリズムとして、 マルコフ連鎖モンテカルロ法とポ

62

2.2.2 p53パルスの設定

本研究では、実験で観測されているパルスサイズに基づき、ガウス関数を用いて p53 パ

ルスを表現することとした。ここで、パルスサイズは、パルスの幅、高さ、(パルスが複数

個である場合の)パルス間間隔の 3 つの変量から決定されるものとする。実験で、p53 パル

スの幅とパルス間間隔の平均値と標準偏差は、それぞれ 350±160分と 440±100分である

ことが知られている(Lahav et al., 2004)。パルスの高さの平均値は明示されていないが、変

動係数(標準偏差/平均値)は 0.7であることがわかっている。本研究では、パルスの高さの平

均値はシミュレーションに基づいて設定した(2.3.1節)。

これらのパルスサイズを決定する変量を用いて、ガウス関数によって時間 t における n

番目の p53パルスの p53濃度を

6

,2

,2

exp)](53[2

2WWDnDt

Htp

と表現することにした。ただし、Hは p53パルスの高さ、Dはパルス間間隔、Wはパルス

の幅とする。パルスの高さ、間隔、幅の各値は、それぞれの平均値と標準偏差をパラメー

タとして持つ正規分布に従うとした。複数個の p53 パルスは、各パルスの高さ、間隔、幅

が独立に正規分布に従うとして乱数を発生させ、各パルスを重ね合わせることで表現した。

このような設定の下で発生させた p53パルスの例を図 2.2に示す。

図2.2 p53パルスの例. 各パルスの高

さ、幅、間隔は、乱数を使ってそれぞ

れ独立に発生させている.

Page 64: Title 生体分子ネットワークの数理モデリングとベイ …...したベイズの式の後分布の計算アルゴリズムとして、 マルコフ連鎖モンテカルロ法とポ

63

2.2.3 シミュレーションの設定

連立微分方程式の数値計算には 4 次のルンゲクッタ法を用いた。ステップサイズを 0.01

分とし、時間 3000分まで合計 300000ステップの計算を行った。モデル中の各タンパク質

濃度の初期値は、p53濃度を 0としたときの定常状態の値に設定した。分岐解析における定

常解は、全ての微分方程式の右辺を 0 とした連立方程式をニュートンラフソン法によって

解くことで求めた。定常解の安定性解析は、微分方程式を線形近似して得られるヤコビ行

列の各定常解での固有値を計算することで行った。

アポトーシスの判定は、時間 3000分における孔濃度の値を基準に行い、分岐解析の結果

(2.3.1節)に基づいて 100nMを超えている場合にアポトーシスが起こったと判定した。

アポトーシス割合は、モンテカルロシミュレーションを独立に 1000回行い、その中でア

ポトーシスが起こったと判定されたシミュレーション回数の割合として定義した。

Page 65: Title 生体分子ネットワークの数理モデリングとベイ …...したベイズの式の後分布の計算アルゴリズムとして、 マルコフ連鎖モンテカルロ法とポ

64

2.3 結果と考察

本節では、はじめに数理モデルの基本的な性質について、シミュレーション結果の説明

を行う。次に、p53パルスサイズの変動によって、細胞死決定の厳密さがどの程度影響を受

けるのか説明する。節の最後に、p53によるアポトーシス促進因子 PUMAの転写活性化過

程の協同性が細胞死決定の厳密さに与える影響と、その理由の解析結果について説明する。

2.3.1 数理モデルの性質

はじめに、数理モデルの性質を定性的に理解するため、分岐解析を行った(図 2.3)。分岐

解析の結果、Sun らのモデルからいくつかのパラメータを変更しても、孔濃度の双安定性

と不可逆性が確認された(図 2.3.A)。また、Hill関数の Hill定数を、初期設定値である 2か

ら 1 や 4 に変更しても、孔濃度の双安定性と不可逆性が確認された(図 2.3.B、C)。サドル

ノード分岐点の p53 濃度は Hill 定数の違いによって変化したが、孔濃度が安定・不安定定

常状態でそれぞれ取りうる値は大きく変化しなかった。本研究ではこれらの分岐解析の結

果をふまえて、アポトーシス判定基準の孔濃度を、高低 2 つの安定定常状態濃度の間にあ

る、100nMに設定した。

また、Hill 定数の値ごとにアポトーシスを起こすのに必要な p53 パルスの高さを計算し

た(表 2.1)。ここではパルス間間隔と幅は、それぞれの平均値である 440分と 350分に設定

した。パルス数が多くなると、アポトーシスを起こすのに必要なパルスの高さは減少した。

一方で、異なる Hill 定数値の場合の結果を比べると、Hill 定数が大きくなるほどアポトー

シスを起こすのに必要なパルスの高さは高くなった。これらのパルスの高さに関する結果

は、以降の計算と解析で用いた。

図 2.3 分岐解析図. 赤は安定定常状態 青は不安定定常状態を表す. (A) Hill定数=2の場合. (B) Hill

定数=1の場合. (C) Hill定数=4 の場合.

Page 66: Title 生体分子ネットワークの数理モデリングとベイ …...したベイズの式の後分布の計算アルゴリズムとして、 マルコフ連鎖モンテカルロ法とポ

65

表 2.1 アポトーシス誘発に必要な p53パルスの高さ[nM]

p53パルス数 Hill定数=1 Hill定数=2 Hill定数=4

1 158 343 464

2 88 254 394

3 67 221 366

4 57 203 351

5 51 192 341

2.3.2 細胞運命決定の厳密さ

パルスの高さに関する結果をふまえて、パルスサイズの変動が細胞死決定の厳密さに及

ぼす影響について調べた。p53 パルスの高さの平均値は、Hill 定数が初期設定値である 2

のときに、パルス数 2 と 3 でアポトーシスを起こすのに必要な高さの中間値である、

237.5nM (=(254nM+221nM)/2) に設定した。また、実験で得られているパルスサイズの変

動値(パルス変動率=1 と定義する)は腫瘍細胞におけるものであり、正常細胞では変動が小

さくなると考えられている(Tyson, 2006)。そこで、本研究では正常細胞に相当するものと

して、パルス間間隔、幅、高さの標準偏差と変動係数の全てを 0.5倍したパルス変動率=0.5

の場合、全てを 0.25 倍したパルス変動率=0.25 の場合、全てを 0 としてパルスサイズが全

く変動しないパルス変動率=0 の計算も行った。計算の結果、パルス変動率=0 の場合は、

パルス数が 2 個では全くアポトーシスは起こらないが、パルス数が 3 個ではアポトーシス

割合が 100%になった(図 2.4)。この結果はパルスの高さの設定によるものであり、パルス

数の違いによって厳密に細胞の生死が決定されるということである。しかし、パルス変動

率が上がるとアポトーシス割合のカーブが S 字型から双曲線型へ変化し、厳密な生死の決

定が困難になる傾向がみられた(図 2.4)。

次に、パルス変動率を固定したときに、Hill 定数の違いが細胞死決定の厳密さにどのよ

うな影響を及ぼすのかについて調べた。ここで、Hill 定数が 1 と 4 のときの p53 パルスの

高さの平均値は、Hill 定数が 2 のときと同様、パルス数 2 と 3 でアポトーシスを起こすの

に必要な高さの中間値である、77.5nM(=(88nM+67nM)/2)と 380nM(=(254nM+221nM)/2)

にそれぞれ設定した。この設定は、Hill 定数の違いの影響を公平に評価するためである。

計算の結果、Hill 定数が大きくなるとアポトーシス割合のカーブが S 字型から双曲線型へ

変化し、厳密な生死の決定が困難になる傾向がみられた(図 2.5)。特にパルス変動率が 0.25

の場合は、S字型が徐々に緩やかになるような傾向がみられた(図 2.5.A)。

まとめると、パルス変動率が大きくなるほど厳密な生死の決定が困難になり、Hill 定数

Page 67: Title 生体分子ネットワークの数理モデリングとベイ …...したベイズの式の後分布の計算アルゴリズムとして、 マルコフ連鎖モンテカルロ法とポ

66

が大きくなるほど厳密な生死の決定が困難になるという傾向がみられた。

2.3.3 p53による転写活性化過程の協同性

最後に、Hill 定数の違いが細胞死決定の厳密さに影響する理由を調べた。はじめに、パ

ルスサイズを決定する変量であるパルス間間隔、幅、高さのうち、どの値の変動が最も強

く影響するのか調べた。そのために、パルス間間隔、幅、高さのうち 1 つをそれぞれの平

均値に固定して計算を行った。計算の結果、パルスの高さを平均値に固定した場合は、パ

ルス変動率の違いに関わらず、Hill 定数の違いは細胞死決定の厳密さに影響を及ぼさなか

った(図 2.6.A)。一方で、パルス間間隔や幅をそれぞれの平均値に固定した場合は、Hill 定

数が大きくなると厳密な運命の決定が困難になる傾向がみられた(図 2.6.B、C)。これらの

結果は、パルスの高さの変動が、Hill 定数の違いにおいて厳密な生死の決定に影響を及ぼ

図 2.5 細胞死決定の厳密さへの Hill定数の影響. (A) パルス変動率=0.25、(B) パルス変動率=0.5、

(C) パルス変動率=1.0. 各色は青:Hill 定数=1.0、赤:Hill 定数=2.0、緑:Hill 定数=4.0 の場合を

示す.

図 2.4 p53 パルス数とアポトーシス割

合の関係. 青:パルス変動率=0.0、赤:

パルス変動率=0.25、黄:パルス変動率

=0.5、緑:パルス変動率=1.0.

図 2.4 Hill定数が 2 (初期設定値) の

ときの p53パルス数とアポトーシス割

合の関係. 青:パルス変動率=0.0、赤:

パルス変動率=0.25、黄:パルス変動率

=0.5、緑:パルス変動率=1.0.

Page 68: Title 生体分子ネットワークの数理モデリングとベイ …...したベイズの式の後分布の計算アルゴリズムとして、 マルコフ連鎖モンテカルロ法とポ

67

す、ほとんど唯一の因子であることを示唆している。

このようなパルスの高さの変動が Hill 定数の違いで厳密な生死の決定に影響を及ぼす理

由を明らかにするため、Hill関数の解析を行った。ここではパルス変動率が 0.25である場

合を例として、パルスの高さだけが平均値±標準偏差の区間で変動したとき、数理モデル

中のHill関数(2.2.1節、付録 2 )の値がどの程度変動するのかについて調べた。計算の結果、

Hill定数が小さい場合はHill関数値の変動が小さいが、Hill定数が大きいほどHill 関数値

の変動が大きくなった(図 2.7)。この結果は、p53による PUMA転写活性化過程の協同性が

大きいほど、PUMA 発現レベルの変動が大きくなり、厳密な生死の決定が困難になりやす

いことを示唆している。

Page 69: Title 生体分子ネットワークの数理モデリングとベイ …...したベイズの式の後分布の計算アルゴリズムとして、 マルコフ連鎖モンテカルロ法とポ

68

図 2.7 p53 パルスの高さの変動と Hill 関

数値の関係. 各色は青:Hill 定数=1.0、

赤:Hill定数=2.0、緑:Hill定数=4.0での

Hill 関数を示す. 横軸の各色の太線の区間

は各Hill定数でのp53パルス高の平均±標

準偏差の変動. 縦軸の各色の矢印の区間は

対応する Hill関数値の変動.

図 2.6 細胞死決定の厳密さへの Hill定数の影響. (A) パルス変動率=0.25、(B) パルス変動率=0.5、

(C) パルス変動率=1.0. (a) パルスの高さを平均値に固定. (b) パルスの幅を平均値に固定. (c) パル

ス間間隔を平均値に固定. 各色は青:Hill定数=1.0、赤:Hill定数=2.0、緑:Hill定数=4.0の場合

を示す.

Page 70: Title 生体分子ネットワークの数理モデリングとベイ …...したベイズの式の後分布の計算アルゴリズムとして、 マルコフ連鎖モンテカルロ法とポ

69

2.4 まとめ

2.4.1 本研究の成果

本章では、サイズの変動する p53 パルスの細胞死決定への影響の数理モデリングを行っ

た。特に、p53による PUMA転写活性化過程の協同性が、細胞死決定の厳密さに及ぼす影

響について調べた。

実験的に観測されているパルスサイズの変動を考慮すると、PUMA 転写活性化過程の協

同性が大きいほど、厳密な生死の決定は困難になった。これは、協同性が大きいほど、PUMA

発現レベルが大きく変動するためであると解釈することができた。

本研究では、p53パルスの高さの値(濃度)が実験的に明らかでないため、Hill定数の違い

が結果に影響しないように p53 パルスの高さを設定して Hill 関数の解析を行った。このよ

うなHill関数の解析自体は、純粋に数式上での解析である。よって、実際の p53 パルス濃

度の値が明らかになれば、同様の解析で協同性の違いが細胞死決定の厳密さに及ぼす影響

を、より現実に即して調べることができると考えられる。

2.4.2 今後の展望と課題

本研究では、細胞死決定の厳密さに影響する要因として、p53によるアポトーシス促進因

子 PUMA 発現の協同性にのみ着目して解析を行った。これは重要な要因の 1 つだったが、

実際には Bcl-2 ファミリータンパク質間の複雑な相互作用も細胞死決定の厳密さに影響を

及ぼしていると考えられる。そのような様々な要因の包括的な解析には、第 1 章で導入し

たようなベイズパラメータ推定法や、パラメータの感受性解析などを行う必要があると考

えられる。

また、本研究ではミトコンドリアアポトーシスシグナル伝達経路のみに着目したが、p53

は転写因子として細胞周期の制御や DNA 修復にも関わっている(Aylon and Oren, 2007;

Batchelor et al., 2009; Vogelstein et al., 2000)。これらの過程も細胞運命決定に影響を及ぼ

すと考えられるため、p53パルスの影響の及ぶ範囲を広く考察した上で、細胞運命決定の厳

密さに影響する要因を解析する必要がある。

Page 71: Title 生体分子ネットワークの数理モデリングとベイ …...したベイズの式の後分布の計算アルゴリズムとして、 マルコフ連鎖モンテカルロ法とポ

70

Page 72: Title 生体分子ネットワークの数理モデリングとベイ …...したベイズの式の後分布の計算アルゴリズムとして、 マルコフ連鎖モンテカルロ法とポ

71

発表論文リスト

1. Rigor of cell fate decision by variable p53 pulses and roles of cooperative gene

expression by p53.

Yohei Murakami, Shoji Takada

BIOPHYSICS (2012) 8: 41-50

2. Bayesian Parameter Inference by Markov Chain Monte Carlo with Hybrid Fitness

Measures: Theory and Test in Apoptosis Signal Transduction Network.

Yohei Murakami, Shoji Takada

PLOS ONE (2013) 8(9): e74178

Page 73: Title 生体分子ネットワークの数理モデリングとベイ …...したベイズの式の後分布の計算アルゴリズムとして、 マルコフ連鎖モンテカルロ法とポ

72

Page 74: Title 生体分子ネットワークの数理モデリングとベイ …...したベイズの式の後分布の計算アルゴリズムとして、 マルコフ連鎖モンテカルロ法とポ

73

謝辞

本研究の遂行には、京都大学グローバル COEプログラム“生物の多様性と進化研究のた

めの拠点形成-ゲノムから生態系まで”と、卓越した大学院拠点形成プログラム“生物の多

様性と進化研究のための拠点形成”からご支援いただきました。厚く御礼申し上げます。

研究の遂行にあたり多くの方にお世話になりました。皆様に心から感謝申し上げます。

本研究を進めるにあたり、修士課程進学時よりご指導いただきました高田彰二教授に心

から感謝いたします。

高田研究室の研究員と学生の皆様には計算機の使い方をはじめ、研究に関する様々な助

言をいただきました。秘書の鈴木晃子さんには、学会の出席や出張をはじめ、様々な事務

手続きでお世話になりました。皆様に心から感謝いたします。

京都大学情報学研究科の太田絵一郎博士には、統計理論についてご指導いただきました。

南京大学のWei Wang教授、Feng Liu教授と研究室のメンバーの方々には様々な助言をい

ただき、学術交流を楽しませていただきました。皆様の有益なご指導とご助言に深く感謝

申し上げます。

正社員を辞職して進学した後もパート社員として働かせていただいた会社の皆様、勤務

先のスタッフにも、この場を借りて御礼申し上げます。

最後に、京都大学理学研究科への進学と研究生活を支えてくれた家族に心から感謝いた

します。ありがとうございました。

Page 75: Title 生体分子ネットワークの数理モデリングとベイ …...したベイズの式の後分布の計算アルゴリズムとして、 マルコフ連鎖モンテカルロ法とポ

74

Page 76: Title 生体分子ネットワークの数理モデリングとベイ …...したベイズの式の後分布の計算アルゴリズムとして、 マルコフ連鎖モンテカルロ法とポ

75

付録 1 カスパーゼカスケードモデルの微分

方程式・パラメータ・初期値

カスパーゼカスケードモデルの微分方程式

]//*9[9]][/*9[9

]//9[9]][/9[9]/*9[9

]*][9[9]/9[9]][9[9][][

XACxiapopkracAXCxiapopkfac

XACxiapopkrcAXCxiapopkfcACapopkrac

ACapopkfacACapopkrcACapopkfcAkdapopksapopdt

Ad

]/9[9]][9[9

*]3][9[39]/9[9]][9[9]9[99][

XCxikrcXCxikfc

CCackcACapopkrcACapopkfcCkdckscdt

C9d

]/*9][3[93

*]9][3[93]/9][3[93]9][3[93]3[33][

ACCapopackc

CCackcACCapopckcCCckcCkdckscdt

C3d

]/*9[9]*][9[9

]/*9[9]*][9[9*]3][9[39*]9[9][

XCxikracXCxikfac

ACapopkracACapopkfacCCackcCkdacdt

C9*d

]/*3[3]*][3[3]/*9][3[93

*]9][3[93]/9][3[93]9][3[93*]3[3][

XCxikracXCxikfacACCapopackc

CCackcACCapopckcCCckcCkdacdt

C3*d

]/*3[3

]*][3[3]//*9[9]][/*9[9

]/*9[9]*][9[9]//9[9

]][/9[9]/9[9]][9[9][][

XCxikrac

XCxikfacXACapopxikracXACapopxikfac

XCxikracXCxikfacXACapopxikrc

XACapoopxikfcXCxikrcXCxikfcXkdxiksxidt

Xd

]//9[9]][/9[9*]3][/9[39

]/9[9]][9[9]/9[9]/9[

XACapopxikrcXACxapopxikfcCACapopackc

ACapopkrcACapopkfcACapopkdcdt

ACd

Page 77: Title 生体分子ネットワークの数理モデリングとベイ …...したベイズの式の後分布の計算アルゴリズムとして、 マルコフ連鎖モンテカルロ法とポ

76

]//*9[9]][/*9[9]/*9[9

]*][9[9*]3][/9[39]/*9[9]/*9[

XACapopxikracXACapopxikfacACapopkrac

ACapopkfacCACapopackcACapopkdacdt

ACd

]//9[9

]][/9[9]/9[9]][9[9]/9[9]/9[

XACxiapopkrc

AXCxiapopkfcXCxikrcXCxikfcXCxikdcdt

XCd

]//*9[9]][/*9[9

]/*9[9]*][9[9]/*9[9]/*9[

XACxiapopkracAXCxiapopkfac

XCxikracXCxikfacXCxikdacdt

XCd

]/*3[3]*][3[3]/*3[3]/*3[

XCxikracXCxikfacXCxikdacdt

XCd

]//9[9]][/9[9

]//9[9]][/9[9]//9[9]//9[

XACxiapopkrcAXCxiapopkfc

XACapopxikrcXACapopxikfcXACapopxikdcdt

XACd

]

]//*9[9

]][/*9[9]//*9[9

]][/*9[9]//*9[9]//*9[

XACxiapopkrac

AXCxiapopkfacXACapopxikrac

XACapopxikfacXACapopxikdacdt

XACd

Page 78: Title 生体分子ネットワークの数理モデリングとベイ …...したベイズの式の後分布の計算アルゴリズムとして、 マルコフ連鎖モンテカルロ法とポ

77

カスパーゼカスケードモデルのパラメータ

パラメータ 値 単位

ksapop 1.2e + 0 nM min-1

ksc9 1.2e + 0 nM min-1

ksc3 1.2e + 1 nM min-1

ksxi 2.4e + 0 nM min-1

kdapop 6.0e-2 min-1

kdc9 6.0e-2 min-1

kdc3 6.0e-2 min-1

kdxi 6.0e-2 min-1

kdac9 6.0e-2 min-1

kdac3 6.0e-2 min-1

kdc9apop 6.0e-2 min-1

kdac9apop 6.0e-2 min-1

kdc9xip 6.0e-2 min-1

kdac9xi 6.0e-2 min-1

kdac3xi 6.0e-2 min-1

kdc9apopxi 6.0e-2 min-1

kdac9apopxi 6.0e-2 min-1

kfc9apop 1.2e-1 nM-1

min-1

krc9apop 6.0e + 0 min-1

kc3c9 3.0e-4 nM-1

min-1

kc3c9apop 2.1e-2 nM-1

min-1

kc9ac3 1.2e-2 nM-1

min-1

kfc9apopac3 1.2e-2 nM-1

min-1

kc3ac9 3.0e-3 nM-1

min-1

kc3ac9apop 2.1e-1 nM-1

min-1

kfac9apop 1.2e-1 nM-1

min-1

krac9apop 6.0e + 0 min-1

kfc9xi ( )9( CXkasso ) 6.0e-2 nM-1

min-1

krc9xi 6.0e-2 min-1

kfc9apopxi ( )9( ACXkasso ) 6.0e-2 nM-1

min-1

krc9apopxi 6.0e-2 min-1

kfac9xi ( *)9( CXkasso ) 6.0e-2 nM-1

min-1

krac9xi 6.0e-2 min-1

kfac9apopxi ( *)9( ACXkasso ) 6.0e-2 nM-1

min-1

Page 79: Title 生体分子ネットワークの数理モデリングとベイ …...したベイズの式の後分布の計算アルゴリズムとして、 マルコフ連鎖モンテカルロ法とポ

78

krac9apopxi 6.0e-2 min-1

kfc9xiapop 1.2e-1 nM-1

min-1

krc9xiapop 6.0e + 0 min-1

kfac9xiapop 1.2e-1 nM-1

min-1

krac9xiapop 6.0e + 0 min-1

kfac3xi ( *)3( CXkasso ) 1.8e-1 nM-1

min-1

krac3xi 6.0e-2 min-1

Page 80: Title 生体分子ネットワークの数理モデリングとベイ …...したベイズの式の後分布の計算アルゴリズムとして、 マルコフ連鎖モンテカルロ法とポ

79

カスパーゼカスケードモデルの各タンパク質の初期値

タンパク質 値 単位

A 20 nM

C9 20 nM

C9* 0 nM

AC9 0 nM

AC9* 0 nM

C3 200 nM

C3* 0 nM

X 40 nM

C9X 0 nM

C9*X 0 nM

AC9X 0 nM

AC9*X 0 nM

C3*X 0 nM

Page 81: Title 生体分子ネットワークの数理モデリングとベイ …...したベイズの式の後分布の計算アルゴリズムとして、 マルコフ連鎖モンテカルロ法とポ

80

Page 82: Title 生体分子ネットワークの数理モデリングとベイ …...したベイズの式の後分布の計算アルゴリズムとして、 マルコフ連鎖モンテカルロ法とポ

81

付録 2 Bax 活性化スイッチモデルの微分方

程式・パラメータ

Bax活性化スイッチモデルの微分方程式

]*][[*][]][[][][

BaxBaxkaxxBaxkaxActBaxkxaBaxkdxksxdt

Baxd

][2*][2]*][[

]][2/*[2]2/*][[2

*][]][2/*[2]2/*][[2

]2/*[2]2*][[2]][[*][*][

2 PorekraxaxBaxkfaxaxBaxBaxkaxx

PUMABclBaxkraxsbBclPUMABaxkfaxsb

BaxkaxActBclBaxkraxabBclActBaxkfaxab

BclBaxkraxbBclBaxkfaxbActBaxkxaBaxkdaxdt

Baxd

]2/[2

]2][[2]2/[2]2][[2

]2/*[2]2*][[2]2[22]2[

BclPUMAkrsb

BclPUMAkfsbBclActkrabBclActkfab

BclBaxkraxbBclBaxkfaxbBclkdbksbdt

Bcld

]][2/[2]2/][[2

]][2/*[2]2/*][[2

]2/[2]2][[2][][

PUMABclActkrasbBclPUMAActfkasb

ActBclBaxkraxabBclActBaxkfaxab

BclActkrabBclActkfabActkdaksadt

Actd

]][2/[2]2/][[2

]][2/*[2]2/*][[2

]2/[2]2][[2]2/[2]2/[

PUMABclActkrasbBclPUMAActkfasb

ActBclBaxkraxabBclActBaxkfaxab

BclActkrabBclActkfabBclActkdabdt

BclActd

]][2/*[2

]2/*][[2]][2/*[2

]2/*][[2]2/*[2

]2*][[2]2/*[2]2/*[

PUMABclBaxkraxsb

BclPUMABaxkfaxsbActBclBaxkraxab

BclActBaxkfaxabBclBaxkraxb

BclBaxkfaxbBclBaxkdaxbdt

BclBaxd

Page 83: Title 生体分子ネットワークの数理モデリングとベイ …...したベイズの式の後分布の計算アルゴリズムとして、 マルコフ連鎖モンテカルロ法とポ

82

nn

n

pKp

pkssp

PUMABclBaxkraxsbBclPUMABaxkfaxsb

PUMABclActkrasbBclPUMAActkfasb

BclPUMAkrsbBclPUMAkfsbPUMAkdskssdt

PUMAd

]53[)53(

]53[53

]][2/*[2]2/*][[2

]][2/[2]2/][[2

]2/[2]2][[2][][

]][2/*[2]2/*][[2

]][2/[2]2/][[2

]2/[2]2][[2]2/[2]2/[

PUMABclBaxkraxsbBclPUMABaxkfaxsb

PUMABclActkrasbBclPUMAActkfasb

BclPUMAkrsbBclPUMAkfsbBclPUMAkdsbdt

BclPUMAd

][*][]*][[][][ 2 PorekraxaxBaxkfaxaxBaxBaxkaxxPorekdpo

dt

Pored

Page 84: Title 生体分子ネットワークの数理モデリングとベイ …...したベイズの式の後分布の計算アルゴリズムとして、 マルコフ連鎖モンテカルロ法とポ

83

Bax活性化スイッチモデルのパラメータ

パラメータ 値 単位 文献

Kp53 5.0e + 2 nM (1)

kssp53 2.0e + 1 nM min-1

(2)

n 2.0e + 0 - (3)

ksx 2.0e + 1 nM min-1

(1)

ksa 2.0e + 0 nM min-1

(1)

ksb2 6.0e + 0 nM min-1

(1)

kss 2.0e + 0 nM min-1

(1)

kdx 3.0e-2 min-1

(1)

kdax 2.0e-3 min-1

(1)

kda 1.0e-2 min-1

(1)

kdb2 2.0e-3 min-1

(1)

kdab2 2.0e-3 min-1

(1)

kdaxb2 1.0e-2 min-1

(1)

kds 1.0e-3 min-1

(1)

kdsb2 5.0e-3 min-1

(1)

kdpo 1.0e-2 min-1

(1)

kxa 1.0e-4 nM-1

min-1

(1)

kfaxb2 1.0e-3 nM-1

min-1

(1)

kraxb2 1.0e-3 min-1

(1)

kfab2 1.0e-2 nM-1

min-1

(1)

krab2 6.0e-2 min-1

(1)

kfaxab2 5.0e-4 nM-1

min-1

(1)

kraxab2 1.0e-5 nM-1

min-1

(1)

kax 1.0e-3 min-1

(1)

kfsb2 1.0e-4 nM-1

min-1

(1)

krsb2 1.0e-3 min-1

(1)

kfasb2 5.0e-5 nM-1

min-1

(1)

krasb2 5.0e-4 nM-1

min-1

(1)

kfaxsb2 5.0e-4 nM-1

min-1

(1)

kraxsb2 1.0e-2 nM-1

min-1

(1)

kaxx 2.0e-4 nM-1

min-1

(1)

kfaxax 2.0e-4 nM-1

min-1

(1)

kraxax 1.0e-2 min-1

(1)

文献: (1) Sun et al. 2009, (2) Yu et al. 2001, (3) Weinberg et al. 2004.

Page 85: Title 生体分子ネットワークの数理モデリングとベイ …...したベイズの式の後分布の計算アルゴリズムとして、 マルコフ連鎖モンテカルロ法とポ

84

Page 86: Title 生体分子ネットワークの数理モデリングとベイ …...したベイズの式の後分布の計算アルゴリズムとして、 マルコフ連鎖モンテカルロ法とポ

85

付録 3 第 1章の周辺事後分布

3.1 時系列データを ABC の枠組みで評価した場合の周辺事

後分布(MCMC)

1転写因子モデルの各パラメータの周辺事後分布. (A) 時系列データを用いた場合. (B) 時系列デー

タと分岐情報を用いた場合.

Page 87: Title 生体分子ネットワークの数理モデリングとベイ …...したベイズの式の後分布の計算アルゴリズムとして、 マルコフ連鎖モンテカルロ法とポ

86

3.2分散の周辺事後分布(MCMC)

1転写因子モデルで時系列データを正規分布によって評価したときの分散の周辺事後分布. (A) 時系

列データを用いた場合. (B) 時系列データと分岐情報を用いた場合.

Page 88: Title 生体分子ネットワークの数理モデリングとベイ …...したベイズの式の後分布の計算アルゴリズムとして、 マルコフ連鎖モンテカルロ法とポ

87

3.3 時系列データを ABC の枠組みで評価した場合の周辺事

後分布(PA)

1 転写因子モデルの各パラメータの周辺事後分布. アニーリングスケジュール 3 で時系列データと

分岐情報を用いた場合.

Page 89: Title 生体分子ネットワークの数理モデリングとベイ …...したベイズの式の後分布の計算アルゴリズムとして、 マルコフ連鎖モンテカルロ法とポ

88

3.4 分散の周辺事後分布(PA)

1転写因子モデルで時系列データを正規分布によって評価したときの分散の周辺事後分布. (A) アニ

ーリングスケジュール 1で時系列データと分岐情報を用いた場合. (B) アニーリングスケジュール 2

で時系列データと分岐情報を用いた場合.

Page 90: Title 生体分子ネットワークの数理モデリングとベイ …...したベイズの式の後分布の計算アルゴリズムとして、 マルコフ連鎖モンテカルロ法とポ

89

3.5 カスパーゼカスケードモデルの周辺事後分布(PA)

アニーリングスケジュール 1 で計算した場合のカスパーゼモデルの各パラメータの周辺事後分布.

(A) *)3( CXkasso . (B) )9( CXkasso . (C) )9( ACXkasso . (D) *)9( CXkasso . (E) *)9( ACXkasso . (a)分

岐情報と Tsのヒストグラムデータを用いた場合. (b) 分岐情報と Teのヒストグラムデータを用いた

場合. (c) 分岐情報と両方のヒストグラムデータを用いた場合.

Page 91: Title 生体分子ネットワークの数理モデリングとベイ …...したベイズの式の後分布の計算アルゴリズムとして、 マルコフ連鎖モンテカルロ法とポ

90

アニーリングスケジュール 2 で計算した場合のカスパーゼモデルの各パラメータの周辺事後分布.

(A) *)3( CXkasso . (B) )9( CXkasso . (C) )9( ACXkasso . (D) *)9( CXkasso . (E) *)9( ACXkasso . (a)分

岐情報と Tsのヒストグラムデータを用いた場合. (b) 分岐情報と Teのヒストグラムデータを用いた

場合. (c) 分岐情報と両方のヒストグラムデータを用いた場合.

Page 92: Title 生体分子ネットワークの数理モデリングとベイ …...したベイズの式の後分布の計算アルゴリズムとして、 マルコフ連鎖モンテカルロ法とポ

91

参考文献

Akaike, H. (1974). A New Look at the Statistical Model Identification. IEEE Transactions on

Automatic Control 19, 716-723.

Albeck, J.G., Burke, J.M., Aldridge, B.B., Zhang, M., Lauffenburger, D.A., and Sorger, P.K.

(2008a). Quantitative analysis of pathways controlling extrinsic apoptosis in single cells.

Mol Cell 30, 11-25.

Albeck, J.G., Burke, J.M., Spencer, S.L., Lauffenburger, D.A., and Sorger, P.K. (2008b).

Modeling a snap-action, variable-delay switch controlling extrinsic cell death. PLoS biology

6, 2831-2852.

Alon, U. (2007). Network motifs: theory and experimental approaches. Nature reviews

Genetics 8, 450-461.

Aoki, K., Yamada, M., Kunida, K., Yasuda, S., and Matsuda, M. (2011). Processive

phosphorylation of ERK MAP kinase in mammalian cells. Proc Natl Acad Sci U S A 108,

12675-12680.

Ashyraliyev, M., Fomekong-Nanfack, Y., Kaandorp, J.A., and Blom, J.G. (2009). Systems

biology: parameter estimation for biochemical models. The FEBS journal 276, 886-902.

Aylon, Y., and Oren, M. (2007). Living with p53, dying of p53. Cell 130, 597-600.

Batchelor, E., Loewer, A., and Lahav, G. (2009). The ups and downs of p53: understanding

protein dynamics in single cells. Nat Rev Cancer 9, 371-377.

Batchelor, E., Mock, C.S., Bhan, I., Loewer, A., and Lahav, G. (2008). Recurrent initiation: a

mechanism for triggering p53 pulses in response to DNA damage. Mol Cell 30, 277-289.

Beaumont, M.A., Zhang, W., and Balding, D.J. (2002). Approximate Bayesian computation

in population genetics. Genetics 162, 2025-2035.

Brenner, D., and Mak, T.W. (2009). Mitochondrial cell death effectors. Curr Opin Cell Biol 21,

871-877.

Chen, C., Cui, J., Lu, H., Wang, R., Zhang, S., and Shen, P. (2007). Modeling of the role of a

Bax-activation switch in the mitochondrial apoptosis decision. Biophys J 92, 4304-4315.

Cory, S., and Adams, J.M. (2002). The Bcl2 family: regulators of the cellular life-or-death

switch. Nat Rev Cancer 2, 647-656.

Cui, J., Chen, C., Lu, H., Sun, T., and Shen, P. (2008). Two independent positive feedbacks

and bistability in the Bcl-2 apoptotic switch. PLoS One 3, e1469.

Del Moral, P. (2006). Sequential Monte Carlo samplers. Journal of the Royal Statistical

Society: Series B 68, 411-436.

Eissing, T., Waldherr, S., Allgower, F., Scheurich, P., and Bullinger, E. (2007). Steady state

Page 93: Title 生体分子ネットワークの数理モデリングとベイ …...したベイズの式の後分布の計算アルゴリズムとして、 マルコフ連鎖モンテカルロ法とポ

92

and (bi-) stability evaluation of simple protease signalling networks. Biosystems 90,

591-601.

Eskes, R., Desagher, S., Antonsson, B., and Martinou, J.C. (2000). Bid induces the

oligomerization and insertion of Bax into the outer mitochondrial membrane. Mol Cell Biol

20, 929-935.

Eydgahi, H., Chen, W.W., Muhlich, J.L., Vitkup, D., Tsitsiklis, J.N., and Sorger, P.K. (2013).

Properties of cell death models calibrated and compared using Bayesian approaches. Mol

Syst Biol 9, 644.

Geva-Zatorsky, N., Rosenfeld, N., Itzkovitz, S., Milo, R., Sigal, A., Dekel, E., Yarnitzky, T.,

Liron, Y., Polak, P., Lahav, G., et al. (2006). Oscillations and variability in the p53 system.

Mol Syst Biol 2, 2006 0033.

Gutenkunst, R.N., Waterfall, J., Casey, F., Brown, K., Myers, C.R., and Sethna, J.P. (2007).

Universally Sloppy Parameter Sensitivities in Systems Biology Models. PLoS

Computational Biology preprint, e189.

Hastings, W.K. (1970). Monte Carlo sampling methods using Markov chains and their

applications. Biometrika 57, 97-109.

Hukushima, K., and Iba, Y. (2003). Population Annealing and Its Application to a Spin Glass.

AIP Conference Proceedings 690, 200-206.

Iba, Y. (2001). Population Monte Carlo algorithms. Transactions of the Japanese Society for

Artificial Intelligence 16, 279-286.

Ingram, P.J., Stumpf, M.P., and Stark, J. (2006). Network motifs: structure does not

determine function. BMC genomics 7, 108.

Janicke, R.U., Sprengart, M.L., Wati, M.R., and Porter, A.G. (1998). Caspase-3 is required

for DNA fragmentation and morphological changes associated with apoptosis. J Biol Chem

273, 9357-9360.

Kirk, P., Thorne, T., and Stumpf, M.P. (2013). Model selection in systems and synthetic

biology. Current opinion in biotechnology 24, 767-774.

Kirkpatrick, S., Gelatt, C.D., Jr., and Vecchi, M.P. (1983). Optimization by simulated

annealing. Science 220, 671-680.

Lahav, G., Rosenfeld, N., Sigal, A., Geva-Zatorsky, N., Levine, A.J., Elowitz, M.B., and Alon,

U. (2004). Dynamics of the p53-Mdm2 feedback loop in individual cells. Nat Genet 36,

147-150.

Legewie, S., Bluthgen, N., and Herzel, H. (2006). Mathematical modeling identifies

inhibitors of apoptosis as mediators of positive feedback and bistability. PLoS Comput Biol 2,

e120.

Limpert, E., Stahel, W.A., and Abbt, M. (2001). Log-normal Distributions across the

Page 94: Title 生体分子ネットワークの数理モデリングとベイ …...したベイズの式の後分布の計算アルゴリズムとして、 マルコフ連鎖モンテカルロ法とポ

93

Sciences: Keys and Clues. BioScience 51, 341-352.

Loewer, A., Batchelor, E., Gaglia, G., and Lahav, G. (2010). Basal dynamics of p53 reveal

transcriptionally attenuated pulses in cycling cells. Cell 142, 89-100.

Machta, J. (2010). Population annealing with weighted averages: a Monte Carlo method for

rough free-energy landscapes. Phys Rev E Stat Nonlin Soft Matter Phys 82, 026704.

Mangan, S., and Alon, U. (2003). Structure and function of the feed-forward loop network

motif. Proc Natl Acad Sci U S A 100, 11980-11985.

Marjoram, P., Molitor, J., Plagnol, V., and Tavare, S. (2003). Markov chain Monte Carlo

without likelihoods. Proc Natl Acad Sci U S A 100, 15324-15328.

Mendes, P., and Kell, D. (1998). Non-linear optimization of biochemical pathways:

applications to metabolic engineering and parameter estimation. Bioinformatics 14,

869-883.

Metropolis, N., Rosenbluth, A.R., Rosenbluth, M.N., Teller, A.H., and Teller, E. (1953).

Equation of State Calculations by Fast Computing Machines. J Chem Phys 21, 1087-1092

Milo, R., Shen-Orr, S., Itzkovitz, S., Kashtan, N., Chklovskii, D., and Alon, U. (2002).

Network motifs: simple building blocks of complex networks. Science 298, 824-827.

Mirsky, H.P., Liu, A.C., Welsh, D.K., Kay, S.A., and Doyle, F.J., 3rd (2009). A model of the

cell-autonomous mammalian circadian clock. Proc Natl Acad Sci U S A 106, 11107-11112.

Moles, C.G., Mendes, P., and Banga, J.R. (2003). Parameter estimation in biochemical

pathways: a comparison of global optimization methods. Genome Res 13, 2467-2474.

Nakano, K., and Vousden, K.H. (2001). PUMA, a novel proapoptotic gene, is induced by p53.

Mol Cell 7, 683-694.

Neal, R. (2001). Annealied importance sampling. Physical review E, Statistical, nonlinear,

and soft matter physics 11, 125-139.

Novak, B., and Tyson, J.J. (2008). Design principles of biochemical oscillators. Nat Rev Mol

Cell Biol 9, 981-991.

Pomerening, J.R., Sontag, E.D., and Ferrell, J.E., Jr. (2003). Building a cell cycle oscillator:

hysteresis and bistability in the activation of Cdc2. Nat Cell Biol 5, 346-351.

Purvis, J.E., Karhohs, K.W., Mock, C., Batchelor, E., Loewer, A., and Lahav, G. (2012). p53

dynamics control cell fate. Science 336, 1440-1444.

Riedl, S.J., Renatus, M., Schwarzenbacher, R., Zhou, Q., Sun, C., Fesik, S.W., Liddington,

R.C., and Salvesen, G.S. (2001). Structural basis for the inhibition of caspase-3 by XIAP. Cell

104, 791-800.

Ruffolo, S.C., and Shore, G.C. (2003). BCL-2 selectively interacts with the BID-induced open

conformer of BAK, inhibiting BAK auto-oligomerization. J Biol Chem 278, 25039-25045.

Salvesen, G.S., and Duckett, C.S. (2002). IAP proteins: blocking the road to death's door. Nat

Page 95: Title 生体分子ネットワークの数理モデリングとベイ …...したベイズの式の後分布の計算アルゴリズムとして、 マルコフ連鎖モンテカルロ法とポ

94

Rev Mol Cell Biol 3, 401-410.

Schwarz, G. (1978). ESTIMATING THE DIMENSION OF A MODEL. The Annals of

Statistics 6, 461-464.

Secrier, M., Toni, T., and Stumpf, M.P. (2009). The ABC of reverse engineering biological

signalling systems. Molecular bioSystems 5, 1925-1935.

Sha, W., Moore, J., Chen, K., Lassaletta, A.D., Yi, C.S., Tyson, J.J., and Sible, J.C. (2003).

Hysteresis drives cell-cycle transitions in Xenopus laevis egg extracts. Proc Natl Acad Sci U

S A 100, 975-980.

Sisson, S.A., and Fan, Y. (2011). Likelihood-Free Markov chain Monte Carlo (Handbook of

Markov Chain Monte Carlo. Chapman & Hall/CRC Press).

Sisson, S.A., Fan, Y., and Tanaka, M.M. (2007). Sequential Monte Carlo without likelihoods.

Proc Natl Acad Sci U S A 104, 1760-1765.

Strogatz, S. (2001). Nonlinear Dynamics And Chaos: With Applications To Physics, Biology,

Chemistry, And Engineering (Westview Press).

Sun, T., Chen, C., Wu, Y., Zhang, S., Cui, J., and Shen, P. (2009). Modeling the role of p53

pulses in DNA damage- induced cell death decision. BMC Bioinformatics 10, 190.

Sun, T., Lin, X., Wei, Y., Xu, Y., and Shen, P. (2010). Evaluating bistability of Bax activation

switch. FEBS Lett 584, 954-960.

Sunnaker, M., Busetto, A.G., Numminen, E., Corander, J., Foll, M., and Dessimoz, C. (2013).

Approximate Bayesian computation. PLoS Comput Biol 9, e1002803.

Tan, C., Dlugosz, P.J., Peng, J., Zhang, Z., Lapolla, S.M., Plafker, S.M., Andrews, D.W., and

Lin, J. (2006). Auto-activation of the apoptosis protein Bax increases mitochondrial

membrane permeability and is inhibited by Bcl-2. J Biol Chem 281, 14764-14775.

Toni, T., Ozaki, Y., Kirk, P., Kuroda, S., and Stumpf, M.P. (2012). Elucidating the in vivo

phosphorylation dynamics of the ERK MAP kinase using quantitative proteomics data and

Bayesian model selection. Molecular bioSystems 8, 1921-1929.

Toni, T., and Stumpf, M.P. (2010a). Parameter inference and model selection in signaling

pathway models. Methods Mol Biol 673, 283-295.

Toni, T., and Stumpf, M.P. (2010b). Simulation-based model selection for dynamical systems

in systems and population biology. Bioinformatics 26, 104-110.

Toni, T., Welch, D., Strelkowa, N., Ipsen, A., and Stumpf, M.P. (2009). Approximate Bayesian

computation scheme for parameter inference and model selection in dynamical systems.

Journal of the Royal Society, Interface / the Royal Society 6, 187-202.

Tyson, J.J. (2004). Monitoring p53's pulse. Nat Genet 36, 113-114.

Tyson, J.J. (2006). Another turn for p53. Mol Syst Biol 2, 2006 0032.

Tyson, J.J., Albert, R., Goldbeter, A., Ruoff, P., and Sible, J. (2008). Biological switches and

Page 96: Title 生体分子ネットワークの数理モデリングとベイ …...したベイズの式の後分布の計算アルゴリズムとして、 マルコフ連鎖モンテカルロ法とポ

95

clocks. Journal of the Royal Society, Interface / the Royal Society 5 Suppl 1, S1-8.

Tyson, J.J., Chen, K.C., and Novak, B. (2003). Sniffers, buzzers, toggles and blinkers:

dynamics of regulatory and signaling pathways in the cell. Current Opinion in Cell Biology

15, 221-231.

Tyson, J.J., and Novak, B. (2010). Functional motifs in biochemical reaction networks.

Annual review of physical chemistry 61, 219-240.

Vaughan, A.T., Betti, C.J., and Villalobos, M.J. (2002). Surviving apoptosis. Apoptosis 7,

173-177.

Venkatraman, L., Li, H., Dewey, C.F., Jr., White, J.K., Bhowmick, S.S., Yu, H., and

Tucker-Kellogg, L. (2011). Steady states and dynamics of urokinase-mediated plasmin

activation in silico and in vitro. Biophys J 101, 1825-1834.

Villunger, A., Michalak, E.M., Coultas, L., Mullauer, F., Bock, G., Ausserlechner, M.J.,

Adams, J.M., and Strasser, A. (2003). p53- and drug-induced apoptotic responses mediated

by BH3-only proteins puma and noxa. Science 302, 1036-1038.

Vogelstein, B., Lane, D., and Levine, A.J. (2000). Surfing the p53 network. Nature 408,

307-310.

Vousden, K.H., and Lane, D.P. (2007). p53 in health and disease. Nat Rev Mol Cell Biol 8,

275-283.

Vyshemirsky, V., and Girolami, M.A. (2008). Bayesian ranking of biochemical system models.

Bioinformatics 24, 833-839.

Wee, K.B., Surana, U., and Aguda, B.D. (2009). Oscillations of the p53-Akt network:

implications on cell survival and death. PLoS One 4, e4407.

Weinberg, R.L., Veprintsev, D.B., and Fersht, A.R. (2004). Cooperative binding of tetrameric

p53 to DNA. J Mol Biol 341, 1145-1159.

Whitley, D. (2001). An overview of evolutionary algorithms: practical issues and common

pitfalls. Information and Software Technology 43, 817-831.

Wilkinson, D.J. (2007). Bayesian methods in bioinformatics and computational systems

biology. Briefings in bioinformatics 8, 109-116.

Wolf, B.B., Schuler, M., Echeverri, F., and Green, D.R. (1999). Caspase-3 is the primary

activator of apoptotic DNA fragmentation via DNA fragmentation factor-45/inhibitor of

caspase-activated DNase inactivation. J Biol Chem 274, 30651-30656.

Yao, G., Lee, T.J., Mori, S., Nevins, J.R., and You, L. (2008). A bistable Rb-E2F switch

underlies the restriction point. Nat Cell Biol 10, 476-482.

Youle, R.J., and Strasser, A. (2008). The BCL-2 protein family: opposing activities that

mediate cell death. Nat Rev Mol Cell Biol 9, 47-59.

Yu, J., Zhang, L., Hwang, P.M., Kinzler, K.W., and Vogelstein, B. (2001). PUMA induces the

Page 97: Title 生体分子ネットワークの数理モデリングとベイ …...したベイズの式の後分布の計算アルゴリズムとして、 マルコフ連鎖モンテカルロ法とポ

96

rapid apoptosis of colorectal cancer cells. Mol Cell 7, 673-682.

Zeilinger, M.N., Farre, E.M., Taylor, S.R., Kay, S.A., and Doyle, F.J., 3rd (2006). A novel

computational model of the circadian clock in Arabidopsis that incorporates PRR7 and PRR9.

Mol Syst Biol 2, 58.

Zhang, T., Brazhnik, P., and Tyson, J.J. (2007). Exploring mechanisms of the DNA-damage

response: p53 pulses and their possible relevance to apoptosis. Cell Cycle 6, 85-94.

Zhang, T., Brazhnik, P., and Tyson, J.J. (2009a). Computational analysis of dynamical

responses to the intrinsic pathway of programmed cell death. Biophys J 97, 415-434.

Zhang, X.P., Liu, F., Cheng, Z., and Wang, W. (2009b). Cell fate decision mediated by p53

pulses. Proc Natl Acad Sci U S A 106, 12245-12250.

Zhang, X.P., Liu, F., and Wang, W. (2010). Coordination between cell cycle progression and

cell fate decision by the p53 and E2F1 pathways in response to DNA damage. J Biol Chem

285, 31571-31580.

Zhang, X.P., Liu, F., and Wang, W. (2011). Two-phase dynamics of p53 in the DNA damage

response. Proc Natl Acad Sci U S A 108, 8990-8995.

Zi, Z., Cho, K.H., Sung, M.H., Xia, X., Zheng, J., and Sun, Z. (2005). In silico identification of

the key components and steps in IFN-gamma induced JAK-STAT signaling pathway. FEBS

Lett 579, 1101-1108.

Zi, Z., and Sun, Z. (2005). Robustness Analysis of the IFN-γ Induced JAK-STAT Signaling

Pathway. Journal of Computer Science and Technology 20, 491-495.

Zi, Z., Zheng, Y., Rundell, A.E., and Klipp, E. (2008). SBML-SAT: a systems biology markup

language (SBML) based sensitivity analysis tool. BMC Bioinformatics 9, 342.