· Web...

51
1

Transcript of   · Web...

Page 1:   · Web view今日は第一回目の授業ですので、最初に今年の授業予定を紹介します。この授業は、コンピューターを使った実習と講義で

1

Page 2:   · Web view今日は第一回目の授業ですので、最初に今年の授業予定を紹介します。この授業は、コンピューターを使った実習と講義で

H28バイオインフォマティックス概論授業予定(授業の進み具合によって変更の可能性があります)

黒字は、講義による解説。青字はウェブを使った実習を示します。

第 1回 10月 4日 授業概要説明

Bioinformatics とは?ゲノム-遺伝子-mRNA-タンパク質の関係の復習(DVD)

さまざまなデータベース・ゲノムデータベースに触れてみる

第 2回 10月 11日 配列データベースについての解説

データベースからの塩基配列とアミノ酸配列の取り出し方

配列エントリの見方

ヒト全ゲノム解読プロジェクトについての解説(1/3)ヒトゲノムプロジェクトの歴史・戦術

連鎖地図作製

宿題(1):配布

第 3回 10月 18日 ホモロジー検索(BLAST 検索)についての解説(1/2)BLAST 検索の実習(BLASTP)結果の見方

ヒト全ゲノム解読プロジェクトについての解説(2/3)BAC ライブラリーの作製、整列化

第 4回 10月 25日 ホモロジー検索(BLAST 検索)についての解説(2/2)BLAST 検索の実習(BLASTN, BLASTX, TBLASTX)

ヒト全ゲノム解読プロジェクトについての解説(3/3)BAC ライブラリーのショットガンシーケンス配列のアセンブリー、コード配列の予測

Whole genome shotgun sequence によるゲノム解読

宿題(2):配布

第 5回 11月 1日 MapViewerの利用(1):各生物のゲノムデータベースを使ったBLAST検索

配列解読から明らかになったヒトゲノムの特徴

2

Page 3:   · Web view今日は第一回目の授業ですので、最初に今年の授業予定を紹介します。この授業は、コンピューターを使った実習と講義で

論文の構成、総説の内容

研究計画立案、レポート・論文作成に必要な情報収集

文献検索(PubMed, 大学図書館On line journals)EndNoteについて

“宿題(1):提出”第 6回 11月 8日 配列アライメントについての解説

ペアワイズアライメント

多重配列アライメントの作成と見方(CLUSTALW)

分子系統樹について

第 7回 11月 15日 分子系統樹の作成

分子系統樹から分かること

ゲノム構造の変化と生物進化

ゲノムの重複と遺伝子レパートリーの増加

オルソログとパラログの発生

遺伝子の並行進化

宿題(3)配布

第 8回 11月 22日 タンパク質の構造についての解説(シグナルペプチド、疎水・親水性プロット、

ドメイン構造)

ウェブサイトを使ったタンパク質の構造解析

塩基配列からアミノ酸配列への変換

分子量と等電点の予測

シグナルペプチドの予測

ドメイン構造の予測

宿題(2)提出

第 9回 11月 29日 酒井義文先生(本学工学研究科情報科学出身)による解説

Blast検索、ClustalW、分子系統樹のアルゴリズムと原理

第 10回 12月 6日 代謝経路データベース(KEGG)の利用KEGG を使った演習 データベースを使って、dopamineの合成経路、合成部位、作用機序、薬剤等について情報収集する。

宿題(4)配布

3

Page 4:   · Web view今日は第一回目の授業ですので、最初に今年の授業予定を紹介します。この授業は、コンピューターを使った実習と講義で

第 11回 12月 13日 ゲノムブラウザ Ensembl Genome Browserの利用ゲノム塩基配列をゲノムデータベースから取り出す

バイオデータベースの利用(遺伝子の機能、発現、遺伝子疾患)

OMIM (Online Menderian Inheritance in Man)MGI (Mouse Genome Informatics)ZFIN (The Zebrafish Model Organism Database)

“宿題(3)提出”第 12回 12月 20日 比較ゲノム(Comparative Genomics)

進化に伴う染色体構造の変化(繰り返し配列の発生、シンテニー領域)

次世代シーケンス解析-シーケンシングの原理

次世代シーケンス解析によるゲノム解読

(参照ゲノムのある場合.de novo解析)ゲノム解読で分かったヒトゲノムの特徴、医療への利用

宿題(5)配布

第 13回 1月 10日次世代シーケンス解析-応用 (1)

発現量の比較:トランスクリプトーム解析の利用

“宿題(4)提出”第 14回最終回

1月 17日 次世代シーケンス解析-応用 (2)原因遺伝子の同定:SNPマーカーによる遺伝形質の原因遺伝子の同定

Genome Wide Association Study: GWASRAD解析:ゲノム全体にわたる SNPマーカーの収集と遺伝形質の原因遺伝

子の同定

Exome解析:エクソンのみに絞って遺伝形質の原因遺伝子の同定

“宿題(5)提出”

授業評価

推薦図書とおもだったウェブサイトはこのファイルの最後に掲示してあります。

4

Page 5:   · Web view今日は第一回目の授業ですので、最初に今年の授業予定を紹介します。この授業は、コンピューターを使った実習と講義で

10月4日(第1回)

講義

1) 授業の予定と進め方

2) 「バイオインフォマティックス」とは?

3) 遺伝子の構造についての復習:パワーポイントのファイルを参照

4) 遺伝子、転写、翻訳の復習(DVDを使って)5) ゲノムデータベース(動物、植物、菌類、バクテリア)をのぞいてみる

6) どのようなデータベースが利用できるか

使用するDVD:講談社ブルーバックス B1582「見てわかるDNAのしくみ」

今日は第一回目の授業ですので、最初に今年の授業予定を紹介します。この授業は、コンピューターを使った

実習と講義で進めます。実習では、ウェブ上で公開されているデータベースや配列解析プログラムを使います。

現在では、多様な生物のゲノム配列が解読され、配列は一般にも利用できるように整備されています。今日は、

どのような生物でゲノム解読が行われているのか、ウェブサイト(NCBI, Ensembl)を使って少しのぞいてみま

しょう。また生物学、分子生物学、農学研究に利用できるデータベースにどのようなものがあるかを紹介します。

なおこのテキストでは、その日の授業で行う講義内容とコンピューターを使った実習について、操作方法を含

めて簡単に説明してあります。必要に応じて、コピー、プリントアウトして下さい。講義で使うパワーポイント

の図はプリントしたものを資料として配布します。毎回、翌週のプリントを配ります。このテキストと配布資料

を使って、予習・復習して下さい。

————————————————————————————————

実習

2つのウェブサイトを開いて、どのような生物でゲノム情報が利用できるか調べてみよう

1. NCBI (National Center for Biotechnology): http://www.ncbi.nlm.nih.gov/2. Ensembl Genome Browser: http://asia.ensembl.org/index.html

5

Page 6:   · Web view今日は第一回目の授業ですので、最初に今年の授業予定を紹介します。この授業は、コンピューターを使った実習と講義で

10月11日(第2回)

今日の授業内容

1. 実習:データベースからのアミノ酸配列、塩基配列の取り出し方

2. 実習:配列エントリーに示されている情報について

3. 講義:ゲノム解読プロジェクト(1/2)

実習

塩基配列・アミノ酸配列の検索

配列データベースから必要なタンパク質のアミノ酸配列、遺伝子の塩基配列の取り出し方を実習します.

アミノ酸の取り出し方

使用するウェブサイト:NCBI.

先頭ページ右側にあるPopular Resourcesの中の「Protein」を使用する.

あるいは左上(All databases)から選ぶことも可能.

キーワードによる検索

例:cow, prion でキーワード検索してみよう

上のタンパク質名(青字)をクリックすると配列エントリーが表示される(見方は最下段と配

付資料を参照のこと)

FASTA をクリックすると配列が FASTA format で表示される

配列は、別のファイルにコピーできる.Graphics では、タンパクの構造が表示される

Related Sequences では、関連するタンパク質が表示される

Identical Proteins では、別の名前が付けられている同一タンパク質が表示される

FASTA format

塩基配列とアミノ酸配列のファイルフォーム。「>」で始まる1行がコメント(遺伝子名や任意の番

号やコメント)を記述するために用意されており、続く2行目から塩基配列あるいはアミノ酸配列

を記述する。最後に改行して「//」を記載し、1つの配列の記述が完了する(記号「//」はなくてもよ

い).ホモロジー検索、多重アライメント、分子系統樹作成等で使うフォーム.>zebrafish_PCNA_ProteinMFEARLVQGSILKKVLEALKDLITEACWDVSSSGISLQSMDSSHVSLVQLTLRSDGFDSYRCDRNLAMGVNLSSMSKILKCAGNEDIITLRAEDNADALALVFETLNQEKVSDYEMKLMDLDVEQLGIPEQEYSCVVKMPSGEFARICRDLSQIGDAVMISCAKDGVKFSASGELGTGNIKLSQTSNVDKEDEAVTIEMNEPVQLI

6

Page 7:   · Web view今日は第一回目の授業ですので、最初に今年の授業予定を紹介します。この授業は、コンピューターを使った実習と講義で

FALNYLNFFTKATPLSKTVTLSMSADIPLVVEYKIADMGHVKYYLAPKIDEESS//

塩基配列の取り出し方

使用するウェブサイト:NCBI. Popular Resourcesの中の「Nucleotide」を使用する

1. キーワードによる検索

例:cow, prion でキーワード検索してみよ

cow, prionの配列だけでなく、関連遺伝子も多数検索されてくるため、必要な配列を見つけ

る必要がある.Bos taurus prion (PRNP), mRNAが今回、欲しい配列である.上の遺伝子質名をクリックすると配列エントリーが表示される(データの見方は配付資料を参

照のこと)

FASTAをクリックすると配列が FASTA format で表示される

配列は、別のファイルにコピーできる.Graphic では、ゲノム上の位置が表示される

2.アクセッション番号による検索

accession number=DDBJ/EMBL/GenBank 国際塩基配列データベースにおいて各登録単位(エ

ントリー;各遺伝子)に発行されるエントリー識別子(entry identification, ID)を指す。

例:NM_181015(entry identification, ID)で検索してみよう

なお表示結果の詳細な説明は、次のサイトで閲覧できます。

http://hinv.ddbj.nig.ac.jp/manual_cdna-j.html

配列エントリーに示されているデータ

遺伝子名、生物名、学名、遺伝子座、遺伝子クローニングを行った論文リスト、翻訳開始・終了点、ド

メイン構造、塩基配列、アミノ酸配列(配付資料では、zebrafish, prion (NM_205586)を使って説明してあります)

講義

ヒトゲノム解読プロジェクト (1/3)

国際研究プロジェクトによるヒトゲノム計画 (Human Genome Project) は 1990 年に着手され、13 年後

の 2003 年に解読完了が宣言されました。ヒトゲノム計画は、階層的ショットガン法と呼ばれる手法で行われま

した。すなわち連鎖地図の作成から BACクローンの整列化の過程を経たのち、染色体上にマップされた BACクローンをショットガン法で解読し、染色体レベルにまで塩基配列を繋ぐという過程を経て、ゲノム塩基配列の完

全解読にまで到達しました。このプロジェクトの間に塩基配列の解析能力(DNAシークエンサー)は大幅にアッ

7

Page 8:   · Web view今日は第一回目の授業ですので、最初に今年の授業予定を紹介します。この授業は、コンピューターを使った実習と講義で

プし、同時に塩基配列をつなぎ合わせるコンピューターの処理能力も著しく進歩したことにより、連鎖地図作製

を省略して、全ゲノムをいきなりショットガン法で読むことが可能となりました。民間企業のシエラ社は、数年

のあいだに全ゲノムショットガン法によりヒトゲノムを解読することに成功しました。最終的には、国際研究プ

ロジェクトとシエラ社の間で協議の結果、解読成果が同時に公表されました。

ヒトゲノム計画の終了と前後して、多くの生物で全ゲノム解読プロジェクトが始められ、最近では、次世代

シーケンサーの登場により、数ヶ月でゲノム解読が可能となりました。そのため。既に数百種の動物で全ゲノム

配列の解読が終了し、現在も新しい生物のゲノム解読プロジェクトが次々に着手されています。

ゲノム情報は、遺伝子の機能解析の有力なツールになることは言うまでもありませんが、生物間でゲノム構造

を比較することにより、無脊椎動物から脊椎動物の進化の過程で起こったゲノム構造の変化等を知ることも可能

となりました。哺乳類の中でも単孔類(カモノハシ)、有袋類(オポッサム)から有胎盤類に至る進化の過程や

またチンパンジーとヒトでの知能の差をゲノム構造の進化の観点から議論されています。全ゲノム塩基配列が利

用できるという条件のもとで、進められる遺伝子やゲノム研究がポストゲノム研究です。既に家畜や野菜や穀物

植物のゲノムもほとんどの種で解読されています。農学でも新しい研究分野を開拓するためには、ゲノム情報を

有効に利用できるがどうかが、極めて重要な素養となります。

ゲノム解読には、階層的ショットガン法と全ゲノムショットガン法の 2 通りの方法があり、現在では全ゲノム

ショットガン法が主流となっています。またこの数年の間に、次世代シーケンサー (NGS)が実用化され、既にゲ

ノム解読は NGSを使うことが主流となっています。NGSによるシーケンスの超高速化により、様々な生物でゲ

ノム解読が行われることは間違いない状況です。

**********************************************************************ゲノム解読プロジェクトで解析されたゲノムDNA配列情報は、NCBIとEnsembl で一般に利用できるよう

整備されています。遺伝子の染色体上の位置や類似遺伝子の検索にはNCBIが便利です。ゲノムの塩基配列を

データベースから取り出す場合には、NCBIあるいは Ensemblを使います。NCBIとEnsemblの使い方

は、授業で実習します。ゲノム情報がいかに強力なツールになるかを体験し、実感してもらおうと考えてい

ます。

————————————————————————————————

ゲノム解読の歴史的な背景と、ゲノム解読の方法論を理解してもらうために、授業では階層的ショットガン法

で解読されたヒトゲノムプロジェクトを例にしてゲノム解読の道筋を解説します.もはや、歴史を振り返るよう

な感もありますが、ゲノムを理解するのにもよいので3回に分けて解説します。

ヒト全ゲノム塩基配列解読の行程(1/3)1) 連鎖地図

2) BACライブラリー作製3) BACライブラリー整列化(物理地図)4) ショットガンシークエンス

5) アセンブル

6) アノテーション

8

Page 9:   · Web view今日は第一回目の授業ですので、最初に今年の授業予定を紹介します。この授業は、コンピューターを使った実習と講義で

10月18日(第3回)

今日の授業内容

1.実習:ホモ路ジー検索BLASTP

2.実習:結果の見方

3.講義:ゲノム解読プロジェクト(2/3)

実習

ホモロジー検索(BLAST検索)1/2

 遺伝子やゲノムを扱う研究で使用する機会が最も多いプログラムが、塩基配列やアミノ酸配列のホモロジー

(相同性)検索プログラムです。実験で新しい塩基配列が得られた時に、最初に行う操作が相同性検索だからで

す.相同性検索により、クローニングした遺伝子が、データベースに登録されているどの遺伝子と類似している

かを調べることができます.

次世代シーケンサー解析で得られた配列をゲノム配列にマップする際にも BLAST検索が用いられます.ゲノ

ム解読されている生物であれば、100bpの短い配列(次世代シーケンサーの解析では、1リードは 100bp)で

もゲノムのどの位置にあるかを調べることもできます.

 授業では、BLAST (Basic Local Alignment Search Tool)プログラムを用います。今日は、塩基配列・

アミノ酸配列のデータベース、問い合わせ配列とデータベースの組合せ、各組合せで使う BLASTプログラムについて説明します.そのあとテスト配列(アミノ酸配列)を使って、実際にBLAST検索を行います.

ホモロジー(homology)検索、とは?

問い合わせ配列(query sequence)に対し、類似した配列をデータベースから探し出す操作.最も高頻度

に利用されるバイオインフォマティックスの手法のひとつ.

検索内容:

例)実験でクローニングした遺伝子の種類を特定する。それがコードするアミノ酸配列がデータベース

に登録されている遺伝子、蛋白質のどれと、またどの程度類似するか?

遺伝子配列データベース:GenBank, DDBJ, EMBL

最も広く利用されており、検索が高速なプログラムが BLAST(昔、FASTと言うプログラムも使われて

いたが、現在はほとんど見かけない)

--------------------------------------------------------――――――――――――――――――-------------検索の組合せ          問い合わせ配列 対 データベース

----------------------------------------------------――――――――――――――――――-----------------BLASTN           塩基配列 対 塩基配列データベース

9

Page 10:   · Web view今日は第一回目の授業ですので、最初に今年の授業予定を紹介します。この授業は、コンピューターを使った実習と講義で

BLASTP           アミノ酸配列 対 アミノ酸配列データベース

BLASTX  塩基配列(アミノ酸配列に置換) 対 アミノ酸配列データベース

TBLASTN           アミノ酸配列 対 塩基配列データベース(アミノ酸配列に置換)

TBLASTX 塩基配列(アミノ酸配列に置換) 対 塩基配列データベース塩基配列(アミノ酸配列に置換)

----------------------------------------------------――――――――――――――――――-----------------

配列の種間変異の激しい遺伝子の場合(サイトカイン等)、塩基配列を BLASTN検索してもヒットしないこ

とが多い.その場合でも、BLASTXなら相同遺伝子がヒットすることが多い.そのため、塩基配列で相

同遺伝子を検索する場合、一般にBLASTNよりも BLASTXが用いられる.**************************************************************************

BLAST 検索の原理 1. ホモロジーが観察される配列間の局所アライメントには、多くの場合、ギャップを含まない保存領域が存在

する。BLAST では、そのような局所保存領域(ワード)をまず高速に検索する。

2. 一致したワードからアライメントを配列に沿ってそれぞれの方向に拡張していき、スコアが増加するまで

続ける。拡張処理は、スコアの増加が止まり、伸ばす前のベストスコアより減少し始めた時に終了する。こ

の時点で、HSP (high-scoring segment pair)と呼ばれる、大きな配列領域が見つかる。この時点でギャッ

プがあるとそこから先には伸長していない。

3. 一般に、アミノ酸配列と塩基配列にはギャップが生じているため、HSPのみでは類似領域の検索として不

十分である。そこで、BLAST では、HSPにおいて対応する位置に存在する 1 組の記号のペアを適切に選び、

類似度の高い領域はこのペアを含むものと仮定して、動的計画法と呼ばれる方法を用いて類似領域を探索す

る。HSPから選んだペアを起点として探索範囲を狭く取ることによって、類似度の最適性は保証されない

ものの、従来の動的計画法と比較して高速な類似領域の探索を実現している。

(詳細は、11月29日に酒井先生が解説します。)

スコアアミノ酸配列の場合:BLOSUM62スコア(アミノ酸の組合せによって値が決められている)

塩基配列の場合:値は同じ塩基、異なる塩基の組合せでのみ決められている

     ————————————————————————————————

BLASTP実習

>test_DNA_sequence-1(私の研究グループで単離した遺伝子で、既にデータベースに登録済みである:由

来生物 zebrafish.遺伝子名 charon、機能=内臓・脳の非対称性制御)とアミノ酸配列を下に示しました。

試しにこのアミノ酸配列で BLASTP検索してみよう.

BLASTPの操作手順

1.NCBI先頭ページ右上 Popular Resourcesから BLASTを選択する。Basic BLASTに上記 5種類のBLASTプログラムのアイコンがある.

2. protein blast をクリックする。アミノ酸配列 (FASTA format)を枠内にコピーする。

10

Page 11:   · Web view今日は第一回目の授業ですので、最初に今年の授業予定を紹介します。この授業は、コンピューターを使った実習と講義で

Database (non-redundant protein sequences (nr) ), Algorithm (blastp; protein-protein BLAST)は、デフォルトのままでよい.

3.BLASTのボタンを押して、検索を開始する。

>test_DNA_sequence-1(zebrafish_charon)_protein-seqMTFQVGFFVLLSVTTIGAFPRNAFQREFHRHVAKDFESSGNGPDEPVRGSVRIVKLNPHFLRRAAVSHVPFRNSPSRGAFPAFLALGRPGPAILTHSKPAPQVSSSADRRKQGLEMWKKVVHKSERKKEAVALRINPKDMNKQSCAAVPFTQRITEEGCETVTVHNNLCYGQCSSMFVPSSGGSHGQQKAQCMRCGPSRARSVLLHLRRGSEVRERRVLIVEECKCETSSEEAKVQNTDMFNLデータベースに登録されている

PSI-BLASTP, PHI-BLAST: 比較的最近開発されたプログラムで、系統的に離れた生物あるいは関連遺

伝子を検索する場合に利用する.種間の保存性が低い遺伝子の場合に利用価値が高い.

検索結果の見方:

グラフィックの次に示されている数値の説明

E-value:検索結果は、Query配列と相同性を示す配列のアライメント結果が表示される。e-valueは、検索に使ったデータベースのなかで、Queryの局所配列と検索配列の組合わせが、偶

然にみつかる個数を示す。相同性が高いほど、値は 0に近づく(最も重要なデータ:蛋白質の場

合、e-5あたりが関連遺伝子か、そうでないかを判断する基準となる)。

Total score (bits): 検索されてきた局所配列の長さをビット形式で示したもの。値が大きいほど、

相同性を示す領域が長い。

Query cover: 問合せ配列の全長のうち、検索配列と配列が一致している領域の%

Identities:アミノ酸配列で、相同領域のなかで一致しているアミノ酸の比率

アライメントの添えられている数字

Identities:アミノ酸配列で、相同領域のなかで一致しているアミノ酸の比率

Positives: アミノ酸配列の場合に、一致しているアミノ酸+化学的に類似するアミノ酸の比率

Gaps:アライメントされた配列で、片一方で欠損している塩基あるいはアミノ酸の総計

講義

ヒト全ゲノム塩基配列解読の行程(2/3)1) 連鎖地図・物理地図(Radiation hybrid panel)2) BACライブラリー作製

11

Page 12:   · Web view今日は第一回目の授業ですので、最初に今年の授業予定を紹介します。この授業は、コンピューターを使った実習と講義で

3) BACライブラリーの整列化4) ショットガンシークエンス

5) アセンブル

6)アノテーション

完全長 cDNA配列解読プロジェクト、EST(expressed sequence tags)プロジェクトについての解説

12

Page 13:   · Web view今日は第一回目の授業ですので、最初に今年の授業予定を紹介します。この授業は、コンピューターを使った実習と講義で

10月25日(第4回)

今日の授業内容

1.講義:ゲノム解読プロジェクト(3/3)

2.実習: BLAST検索(BLASTX,, TBLASTX)

3.講義:Whole genome shotgun sequence

実習

ホモロジー検索(BLAST検索)2/2

BLASTN実習

blastn を使って、>test_DNA_sequence-1の相同遺伝子を検索してみよう

BLASTNの検索手順

1.NCBI、Popular Resourcesの中から BLASTを選択する。Basic BLASTに上記 5 種類の

BLASTプログラムのアイコンがある。

2.nucleotide blastをクリックする。

「Database」が、デフォルトでは nucleotide collection (nr/nt)で、このままでよい。

注意 : Program selection で somewhat similar sequences (blastn) を選択する 。

3.塩基配列(FASTA format)を枠内にコピーする。

4.BLASTのボタンを押して、検索を開始する。

>test_DNA_sequence-1(zebrafish_charon)AACGAAACCTTGAACCGCAAGATTTTTCAACAAATAATCGACTATATGTATTTTTAGAGAGAAATAAATTCCCTCTCTTTTCTTTTTTGTAAAATTCTATAATTTAGCTAAAATGACTTTTCAGGTCGGCTTTTTTGTGCTGTTGTCAGTCACAACAATTGGCGCTTTCCCGCGCAATGCATTTCAGCGGGAATTTCACCGACACGTGGCGAAAGACTTTGAATCCTCCGGGAATGGACCAGACGAACCTGTTCGGGGATCTGTCCGAATTGTCAAACTAAACCCTCATTTTCTGCGCCGGGCCGCCGTTAGTCATGTGCCGTTCAGAAATTCACCAAGTCGAGGCGCGTTTCCCGCGTTCTTGGCCCTCGGACGTCCGGGCCCCGCAATCCTGACCCATAGCAAACCTGCGCCTCAGGTGAGCAGCAGTGCAGACAGGAGGAAACAAGGGCTCGAGATGTGGAAGAAAGTGGTGCACAAAAGCGAGCGAAAAAAAGAGGCAGTGGCTCTGCGCATCAATCCCAAAGACATGAACAAACAGAGCTGTGCCGCAGTTCCCTTTACACAGCGCATAACGGAGGAGGGCTGTGAGACGGTGACCGTTCACAATAATCTCTGCTACGGTCAGTGCAGCTCCATGTTCGTGCCCTCCAGCGGAGGCTCTCACGGACAACAGAAAGCGCAGTGCATGCGCTGCGGCCCCTCTAGAGCGCGCTCCGTGCTCCTGCACCTGCGCCGCGGGTCTGAGGTGCGGGAGAGGCGCGTACTGATCGTTGAGGAGTGCAAGTGTGAAAC

13

Page 14:   · Web view今日は第一回目の授業ですので、最初に今年の授業予定を紹介します。この授業は、コンピューターを使った実習と講義で

CAGCAGCGAAGAGGCCAAAGTTCAGAACACAGATATGTTTAATTTATAACAGTCATTTTAAAGTTTATAAAAATCGTAA

>test_DNA_sequence-1(zebrafish_charon)_protein-seqMTFQVGFFVLLSVTTIGAFPRNAFQREFHRHVAKDFESSGNGPDEPVRGSVRIVKLNPHFLRRAAVSHVPFRNSPSRGAFPAFLALGRPGPAILTHSKPAPQVSSSADRRKQGLEMWKKVVHKSERKKEAVALRINPKDMNKQSCAAVPFTQRITEEGCETVTVHNNLCYGQCSSMFVPSSGGSHGQQKAQCMRCGPSRARSVLLHLRRGSEVRERRVLIVEECKCETSSEEAKVQNTDMFNL

Blastn の 利用例:

とりあえず調べたい遺伝子が、既知のどの遺伝子に類似するか?を調べる時等に使う。ただし、

生物間で変異の激しい遺伝子(実習で使う charonが一例)の場合には、Blastn では相同遺伝子

が十分に検索されてこないことがあるので、遺伝子を特定するためには、次の Blastxを使う方がよい。

次世代シーケンス解析で得られた断片(100bp)をゲノムにマップする時はBlastnを用いる。

同じ遺伝子の配列>test_DNA_sequence-1(zebrafish_charon)なのに、blastpとblastn で検索され

てくる遺伝子・蛋白質の数が違うことに注意!(その理由を理解して下さい)

BLASTX実習

blastXを使って、>test_DNA_sequence-1の相同遺伝子を検索してみよう

blastx の特性:このプログラムでは、遺伝子がコードするアミノ酸配列と相同性の高い蛋白質を探す。問い合わ

せ塩基配列は、一度 6フレームで翻訳され、翻訳された配列がアミノ酸配列データベースに対し

て検索にかけられている。

 アミノ酸置換の激しい遺伝子の相同性検索に非常に有効

 進化的に離れた生物から相同遺伝子を探す場合にも有効

次世代シーケンサーを使った de novoトランスクリプトーム解析で得られた配列を同定する

場合、BLASTXが使用される

ヒトのゲノムデータベースに対して、>test_DNA_sequence-1(zebrafish_charon)配列を問合せ配列にして、

blastn, blastx検索を行い、得られるデータの違いを理解しよう.

TBLASTNの検索手順

tblastx を使って、>test_DNA_sequence-1の相同性検索を試してみよう

14

Page 15:   · Web view今日は第一回目の授業ですので、最初に今年の授業予定を紹介します。この授業は、コンピューターを使った実習と講義で

tblastx の特性:問い合わせの塩基配列、データベースの塩基配列とも3フレームで翻訳され、検索にかけられて

いる。

Tblastx の利用例:

単離した遺伝子がコードするアミノ酸配列と相同性の高いアミノ酸配列をコードする塩基配列を

探す。配列の変異が激しい遺伝子種の場合に有効。

練習

PCNAはDNA複製で働くタンパク質で、バクテリアからヒトまで配列の保存性が非常に高い。この

配列で BLASTN検索して、>test_DNA_sequence-1の検索結果との違いを考えてみよう。

対象生物をイネに限定して、イネゲノムに相同遺伝子が存在するか調べてみよう。また、バクテリア

のゲノムで試してみよう。

>zebrafish_PCNA_cDNAACTTTAGTTCCTCCTACTCCAAACTAAGAAAGCAGCACAATGTTTGAGGCACGTCTGGTTCAGGGATCTATCCTTAAGAAGGTCCTGGAGGCTCTGAAAGACCTGATCACCGAGGCTTGCTGGGATGTGAGCTCGTCGGGCATTTCTCTGCAGAGTATGGACTCCTCTCATGTGTCTCTGGTGCAGCTGACGCTCCGGAGTGACGGGTTCGACTCCTACCGCTGCGACAGAAACCTAGCCATGGGGGTCAATCTGAGCAGCATGTCGAAGATTCTGAAGTGTGCTGGAAATGAAGACATCCAGACACTTAGAGCTGAAGACAATGCTGACACGCTGGCACTGGTCTTTGAAGCTCAAAATCAGGAGAAAGTGTCCGACTATGAGATGAAACTGATGGATCTGGATGTGGAGCAGCTTGGCATTCCAGAGCAGGAATACAGTTGTGTGGTGAAGATGCCGTCGGGTGAGTTTGCCCGCATCTGCAGGGATCTGTCACAGATTGGTGATGCTGTCATGATCTCGTGTGCCAAGGATGGCGTGAAGTTCTCTGCTAGCGGAGAGCTGGGCACAGGCAACATCAAGCTCTCACAGACCAGCAATGTCGACAAGGAGGATGAAGCGGTAACAATTGAGATGAATGAGCCAGTGCAGCTCATTTTTGCATTGAACTACCTGAACTTCTTCACCAAGCCAACTCCTCTGTCCAGAACGGTCACACTTAGAATGTCCGCACATATTCCACTAGTGGTTGAGGACAAAATTGCAGACCTTGAACACGTAAAATATTACCTGGCGCCCCAGATCGAGGATGAAGAGTCCTCCTAATCCAAGCAGAAGAGCGAAGCCTGTCATCTGTGGGATTTTCATTCTGCAACTCAGAAGTTATTGCATAGATGTTTTGGGAAAATGCATTTTATTACTCAGTGTCTGCTGTGGTTTCCAGTTCAATGGATTCCCGATTGTGACCCTCTAAAGCCATTACATATCATTGGCAGAATTGCGGGCGCACTTATTAAATGATGGTAGTTTGGGCCTTAGCTTTACCAGGCGCTCCGTGGGCTGAATCTAGAGTGCTCTCATGTACATACTCCACATTCAGTCTTGTTTTTCTCCCTTTTTGCCGTTGTCCTCTTGTGTCCATTTCAGGTTTTGTCCAACTGCTCATTCCAATGTGTAGATAATTGTCTGTAAATATGCTAATTGGACACCGTTCATCCAGTCAACCCGTAATAAAACTGTTGTATCGG

>zebrafish_PCNA_ProteinMFEARLVQGSILKKVLEALKDLITEACWDVSSSGISLQSMDSSHVSLVQLTLRSDGFDSYRCDRNLAMGVNLSSMSKILKCAGNEDIITLRAEDNADALALVFETLNQEKVSDYEMKLMDLDVEQLGIPEQEYSCVVKMPSGEFARICRDLS

15

Page 16:   · Web view今日は第一回目の授業ですので、最初に今年の授業予定を紹介します。この授業は、コンピューターを使った実習と講義で

QIGDAVMISCAKDGVKFSASGELGTGNIKLSQTSNVDKEDEAVTIEMNEPVQLIFALNYLNFFTKATPLSKTVTLSMSADIPLVVEYKIADMGHVKYYLAPKIDEESS

講義

ヒト全ゲノム塩基配列解読の行程(3/3)1) 連鎖地図・物理地図(Radiation hybrid panel)2) BACライブラリー作製3) BACライブラリーの整列化4) ショットガンシークエンス

5) アセンブル

6)アノテーション

完全長 cDNA配列解読プロジェクト、EST(expressed sequence tags)プロジェクトについての解説

Whole genome shotgun sequenceの原理について、配付資料を使って説明します.

16

Page 17:   · Web view今日は第一回目の授業ですので、最初に今年の授業予定を紹介します。この授業は、コンピューターを使った実習と講義で

11月1日(第5回)

今日の授業内容

1.実習: NCBIのゲノムデータベースでのBLAST検索

2.講義: 論文の構成、文献データベース

3.実習:文献検索(PubMed)

実習

—NCBI Map Viewerの利用—

NCBIの Map Viewer ではゲノム解読が行われた生物種ごとに、遺伝子の染色体上の位置を調べることや、

BLAST検索を行うことができます。授業では、Map Viewerを使って、4つの使用法を実習します。

NCBI Map Viewerの利用(1/4)

—遺伝子の染色体上の位置を調べるー

1.NCBI 先頭ページAll resourcesの中からMap Viewerを選択する

2.ゲノム塩基配列が公開されている分類に分けて生物種一覧が表示される: toolsに虫眼鏡マーク(遺伝子の染色体上の位置を調べる)とBマーク(BLAST検索)がある3.虫眼鏡マークをクリック

4.Search for の枠に遺伝子名を記入し、リターンキー(or Find)を押す5.遺伝子の位置が染色体上に赤く示される。下のMap elementを選択すれば、より詳細なゲノム情

報が表示される。

ヒト染色体における遺伝子の位置(遺伝子座)を検索してみよう

練習:sonic hedghog (shh)を検索してみよう1.NCBI で Map Viewerを開ける

2.Homo sapiens (human)の Toolsに虫眼鏡マークを選択

3.Search forに shhを記入して、Return4.Map elementのなかからSHH(NM_000193.2)を選んでクリック

5.shhの染色体上の位置、周辺の遺伝子が表示される

6.Zoom out、Zoom inしてみよう7.SHHをクリックすると、SHH遺伝子のイントロン・エクソン構造、変異による病状等

についての情報が得られる

8. OMIM (OMIM は KEGG にもリンク ), HGNC (HUGO nomenclature committee; HUG0=human genome organization) を開けると、変異による異常や分子構造の特性に

関する情報が得られる

17

Page 18:   · Web view今日は第一回目の授業ですので、最初に今年の授業予定を紹介します。この授業は、コンピューターを使った実習と講義で

ウシ、ニワトリ、ゼブラフィッシュでも shh でキーワード検索してみよう

 NCBI Map Viewerの利用(2/4)

—さまざまな生物のゲノムデータベースの利用—

 NCBI, Map Viewer では、バクテリアから植物、哺乳類に至るまで多様な生物のゲノム情報が利用できます。

ヒトが持っている遺伝子の相同遺伝子を進化的にたどって、どの生物にまで存在しているかと言う疑問について

も、BLAST検索によって調べることができます。

練習:ヒトの増殖細胞核抗原(PCNA: proliferating nuclear antigen)の相同遺伝子をイネゲノム(Oryza

sativa (japonica cultivar-group))、バクテリアから探してみよう。

 マウスビタミンD受容体の相同遺伝子が、ショウジョウバエ、原生動物(アメーバー)、イネに存在するかど

うかも試してみよう。

バクテリアのゲノム検索では、small genomeに入り、種を指定し、検索する。

>human_pcna

MFEGRLVQGSILKKVLEALKDLINEACWDISSSGVNLQSMDSSHVSLVQLTLRSEGFDTYRCDRNLAMGVNLTSMSKILKCAGNEDIITLRAEDNADTLALVFEAPNQEKVSDYEMKLMDLDVEQLGIPEQEYSCVVKMPSGEFARICRDLSHIGDAVVISCAKDGVKFSASGELGNGNIKLSQTSNVDKEEEAVTIEMNEPVQLTFALRYLNFFTKATPLSSTVTLSMSADVPLVVEYKIADMGHLKYNLAPKIEDEEGS

>mouse_vitamin_D_receptor

MEAMAASTSLPDPGDFDRNVPRICGVCGDRATGFHFNAMTCEGCKGFFRRSMKRKALFTCPFNGDCRITKDNRRHCQACRLKRCVDIGMMKEFILTDEEVQRKREMIMKRKEEEALKDSLRPKLSEEQQHIIAILLDAHHKTYDPTYADFRDFRPPIRADVSTGSYSPRPTLSFSGDSSSNSDLYTPSLDMMEPASFSTMDLNEEGSDDPSVTLDLSPLSMLPHLADLVSYSIQKVIGFAKMIPGFRDLTSDDQIVLLKSSAIEVIMLRSNQSFTLDDMSWDCGSQDYKYDITDVSRAGHTLELIEPLIKFQVGLKKLNLHEEEHVLLMAICIVSPDRPGVQDAKLVEAIQDRLSNTLQTYIRCRHPPPGSHQLYAKMIQKLADLRSLNEEHSKQYRSLSFQPENSMKLTPLVLEVFGNEIS

NCBI Map Viewerの利用(3/4)

—特定の生物のゲノムに存在する遺伝子ファミリーのメンバーの検索—

 多くの遺伝子には、生物進化の過程で共通の遺伝子から派生した兄弟遺伝子が存在します。またそのメンバー

は進化に伴って増える傾向にあります。マウスならマウスのゲノムに対して、あるメンバーでゲノムを検索する

ことにより、進化的に関連して部分的にでも共通の配列を持つメンバーを全て検索することができます。今回は

マウスゲノムに存在する核レセプターファミリーのメンバー、及び Gタンパク共役受容体のメンバーを探す操作

を実習します。

18

Page 19:   · Web view今日は第一回目の授業ですので、最初に今年の授業予定を紹介します。この授業は、コンピューターを使った実習と講義で

練習:マウスゲノムに核受容体ファミリーのメンバーが幾つ存在するか?

1.NCBI の Map Viewer(ページ下、POPULAR)を開ける

2.Mus musculusの ToolsからB ( BLAST ) を選択

3.mouse_vitamin_D_receptorの配列を枠にコピーし、Programから BLASTPを選択

し、Begin Searchをクリック4.マウスゲノムに存在する核レセプターファミリーの全てのメンバーが検索されてくる。

60 種類あまり存在することが分かる

5.上の方にある Genome Viewをクリックしてみよう:検索されてきた遺伝子の染色体

上の位置が表示される

>mouse_vitamin_D_receptor

MEAMAASTSLPDPGDFDRNVPRICGVCGDRATGFHFNAMTCEGCKGFFRRSMKRKALFTCPFNGDCRITKDNRRHCQACRLKRCVDIGMMKEFILTDEEVQRKREMIMKRKEEEALKDSLRPKLSEEQQHIIAILLDAHHKTYDPTYADFRDFRPPIRADVSTGSYSPRPTLSFSGDSSSNSDLYTPSLDMMEPASFSTMDLNEEGSDDPSVTLDLSPLSMLPHLADLVSYSIQKVIGFAKMIPGFRDLTSDDQIVLLKSSAIEVIMLRSNQSFTLDDMSWDCGSQDYKYDITDVSRAGHTLELIEPLIKFQVGLKKLNLHEEEHVLLMAICIVSPDRPGVQDAKLVEAIQDRLSNTLQTYIRCRHPPPGSHQLYAKMIQKLADLRSLNEEHSKQYRSLSFQPENSMKLTPLVLEVFGNEIS

G-protein coupled receptorのメンバーで試してみよう。

>human_MC4R

MVNSTHRGMHTSLHLWNRSSYRLHSNASESLGKGYSDGGCYEQLFVSPEVFVTLGVISLLENILVIVAIAKNKNLHSPMYFFICSLAVADMLVSVSNGSETIVITLLNSTDTDAQSFTVNIDNVIDSVICSSLLASICSLLSIAVDRYFTIFYALQYHNIMTVKRVGIIISCIWAACTVSGILFIIYSDSSAVIICLITMFFTMLALMASLYVHMFLMARLHIKRIAVLPGTGAIRQGANMKGAITLTILIGVFVVCWAPFFLHLIFYISCPQNPYCVCFMSHFNLYLILIMCNSIIDPLIYALRSQELRKTFKEIICCYPLGGLCDLSSRY

練習:ショウジョウバエのゲノムには、核受容体ファミリーのメンバーが幾つ存在するでしょうか?

ホヤ(Ciona intestinalis)でも検索してみよう

  NCBI Map Viewerの利用(4/4)

—次世代シーケンス解析で得られた配列の染色体へのマッピング—

 最も汎用されている次世代シーケンサーである Illumina2000 では、一度の解析で 100bの断片配列が約4000万個得られます。ゲノム解析が行われている生物では、このような短い断片でも染色体にマッピングで

きます。さらに参照ゲノムと塩基配列の違いがあるかどうか、遺伝子疾患の原因が解析された個人のゲノム

に存在しているかどうかも判定可能です。

19

Page 20:   · Web view今日は第一回目の授業ですので、最初に今年の授業予定を紹介します。この授業は、コンピューターを使った実習と講義で

練習:

BLAST検索で humanを選択して、次の配列をゲノムにマッピングしてみよう。

>human_100bp_fragmentCCAAATTTAATTGATAATGGAAGCTGGCCAGCCACCACCATACAGAATTCTGTAGCTTTGAAGAATGCAGGTTTAATATCCACTTTGAAAAAGAAAACAA

講義

配列情報と文献の検索

 研究計画を立てる場合、その研究に関連した過去の論文をリストアップして、既に報告されている成果を調べ

ておくことが大変重要です。この操作により、これから進める研究テーマについて、研究がどこまで進んでいる

のか、何が分かっていないのかを調べる訳です。そして未知の生物現象を解明するのに、最も有効な計画を立案

します。もちろん研究で遺伝子を扱う場合、その遺伝子の配列、これまでに分かっている性質を調べておくこと

も重要です。この検索操作をちゃんとしておかないと、「せっかく得られた実験成果が既に報告されていた」と

言うような悲惨なことも起きかねません。

 また卒業論文や投稿用論文の作成時には、緒言に研究の歴史と背景、研究内容の意義を述べ、考察では実験結果

と既知の成果を比較検討し、研究で得られた新しい知見について議論します。論文を仕上げる時にも、関連論文

を収集して精査する必要があります。文献以外にも、クローニングした遺伝子と関連遺伝子とのアライメントを

行うことや、分子系統樹を作成するのに関連遺伝子をデータベースから引き出してくることが必要となることが

あります。

 例えば、自分の研究でウシやブタなどの家畜、あるいは作物で遺伝子をクローニングしたとします。遺伝子機

能に関する研究が進んだ現在では、モデル生物(マウス、ニワトリ、ゼブラフィシュ、ショウジョウバエ、線虫

酵母、シロイズナズナ等)のどれかで相同遺伝子の機能が解析され、論文の形で出版されていることが多いと言

えます。その論文を読めば、クローニングした遺伝子の持つ機能の概要を知ることができます。データベースを

利用すれば、この様な情報も簡単に収集できます。遺伝子を BLAST検索し、モデル生物の相同性の高い遺伝子配

列を探し、そこから文献情報を探すことが可能です。

 今日は、研究計画を立てる時や論文を書く際、クローニングされた遺伝子に関連する論文の検索、研究や論文

作成で必要な論文の検索方法を実習します。

文献 の検 索に は 、( 1 ) NCBI の PuBMed 、( 2 )大 学の 図書 館の オ ンラ イン ジ ャ ー ナル 、

(3)Scopus(Elsevier 社の有料検索システム)が利用できます。PuBMedの使い勝手が最近非常によくなった

ので、ほとんどのことは PuBMed ですみます。従って、PuBMedの使い方を中心に演習し、大学の図書館のオン

ラインジャーナルについて少し解説を加えます。

20

Page 21:   · Web view今日は第一回目の授業ですので、最初に今年の授業予定を紹介します。この授業は、コンピューターを使った実習と講義で

文献検索を使う目的には、下記のように幾つかのシチュエーションに分かれます。いずれも PuBMed で可能です。

1. 特定の論文をダウンロードしたい。

2. ある研究者がどのような論文を出版しているか知りたい

3. ある生物現象に関する論文をもれなく調べたい。

4. 作成中の論文の考察に必要な論文を探したい

5. 扱う遺伝子に関連する論文を調べたい。

実習

文献の検索

使用するウェブサイト:NCBI

使用するアイテム: PubMed

上の枠の下にあるAdvancedボタンを使う。

左の All Fieldsボタンをクリックすると、著者名、出版年度、タイトル中のワード、Abstract 中の

ワード、Journal(雑誌)名で検索できるシステムになっている。これらをうまく使うと必要な文献を

うまく検索することが可能である。それぞれについて授業では実習します。東北大学図書館が購読契約

している雑誌、あるは Plos Oneのような on-line journal であれば、検索結果のページから論文の pdfファイルをとりだして、プリントやダウンロードができます。

1. 特定の論文をダウンロードしたい。

例えば、山中先生がノーベル賞をもらうことになった iPS 細胞の論文を探してみよう。

Author: Yamanaka ShinyaJournal: Cell

2. ある研究者がどのような論文を出版しているか知りたい

例えば、私と研究室の助教の横井さんの共著論文を探してみよう。

Author: Suzuki TohruAuthor: Yokoi Hayato

3. ある生物現象に関する論文をもれなく調べたい。論文の考察に関連する論文を探したい。

例えば、魚類の iPS 細胞に関する論文が出版されているか?

Title/Abstract: FishTitle/Abstract: iPS cell

成長ホルモンの日周リズムに関する論文を知りたい

21

Page 22:   · Web view今日は第一回目の授業ですので、最初に今年の授業予定を紹介します。この授業は、コンピューターを使った実習と講義で

Title/Abstract: growth hormoneTitle/Abstract: circadian rhythm

4. 扱う遺伝子に関連する論文を調べたい。

例えば、癌遺伝子Brca2に関する論文を調べたい。

Title/Abstract: Brca2Title/Abstract: human or mouse or zebrafish

BLAST検索結果から、検索した遺伝子に関する文献情報を収集することもできます。リストアップされてきた遺

伝子の名称がアクティブで、それをクリックすると配列情報に加えて、PUBMEDの番号を添えた形で関連の論文

もリストアップされています。PUBMED 番号をクリックすると文献情報に入ることができます。

test_sequence-1 で試してみよう。

>test_sequence-1(zebrafish_charon)_peptideMTFQVGFFVLLSVTTIGAFPRNAFQREFHRHVAKDFESSGNGPDEPVRGSVRIVKLNPHFLRRAAVSHVPFRNSPSRGAFPAFLALGRPGPAILTHSKPAPQVSSSADRRKQGLEMWKKVVHKSERKKEAVALRINPKDMNKQSCAAVPFTQRITEEGCETVTVHNNLCYGQCSSMFVPSSGGSHGQQKAQCMRCGPSRARSVLLHLRRGSEVRERRVLI

「電子ジャーナル」へのアクセスの方法

東北大学ホームページ→東北大学付属図書館→電子ジャーナルリスト(学内者限定)→雑誌名のキーワード

検索 OR アルファベット順で検索→volume, page入力・検索

22

Page 23:   · Web view今日は第一回目の授業ですので、最初に今年の授業予定を紹介します。この授業は、コンピューターを使った実習と講義で

11月8日(第6回)

講義

 2つ以上の塩基配列あるいはアミノ酸配列の一致度を調べる場合、アライメントプログラムを使います。タン

パク質の場合、異なる生物間でアミノ酸配列をアライメントすることにより、保存性の高い領域を特定すること

ができます。系統的に隔たった生物間(例えば、マウスとゼブラフィッシュ、あるいはマウスと酵母の関係等)

で保存性が高い領域は、タンパク質の機能で重要な役割を持った領域であると考えられます。またシステイン残

基は、タンパク質の高次構造に深く関わるジスルフィド(S-S)結合を作る場合が多いため、保存されていること

が多く、異なる生物のタンパク質をアライメントすることで重要で保存されたジスルフィド結合の位置を予測で

きます。

 ClustalWプログラムを使うと、多重(マルチプル)アライメントの結果から分子系統樹を作成できます。分子

系統樹では、遺伝子の種間あるいは同種間における進化的関係を予測することができます。種間の進化的関係で

は、異なる生物間における相同遺伝子(オーソログ)を同定することが可能です。同種間で関連遺伝子の系統樹

を作成すると、遺伝子ファミリーのメンバーの進化的関係が分かります。またモデル生物(マウス、ゼブラ

フィッシュ)の配列を分子系統樹に加えることで、研究対象の遺伝子に対するモデル生物のオーソログを検索し

モデル生物の情報からから、研究対象の遺伝子の機能についておおよその情報を得ることができます。

 授業では、ペアワイズアライメント(2つの配列を比較)、マルチプルアライメント(3つ以上の配列を比

較)および分子系統樹の作成(来週)を実習します。

配列アラインメント

配列アラインメントとは、配列中で同じ並び方をしている文字列を探すことである。同一もしくは似た文字

は同じ列に置き、同一でない文字は同じ列に不一致として置くか、ギャップを入れる。

ペアワイズアラインメント (pairwise alignment):2つの配列の比較大域的アラインメント (global pairwise alignment)局所的アラインメント (local pairwise alignment)

多重配列アラインメント (multiple alignment):3つ以上の配列の比較

************************************************************************

実習

Alignment

Pairwise alignment

1 ) 使 用 す る ウ ェ ブ サ イ ト : The European Bioinformatics Institute

23

Page 24:   · Web view今日は第一回目の授業ですので、最初に今年の授業予定を紹介します。この授業は、コンピューターを使った実習と講義で

(EBI )http://www.ebi.ac.uk/Information/(Internet explorerを使ってEBI で検索)

2)Servicesの中からProteinsを選択。→左下の See all toolsを開け、リストの中からEMBOSS を選

Local alignment → Matcher (protein)

2つの枠内に配列をペーストしてSubmit

練習:

下の gnrh(gonadotropin-releasing hormone; 生腺腺刺激ホルモン)からヒトとゼブラフィシュを選ん

でアラインメントを実行してみよう。

次に、ヒトとホヤ(Ciona)で実行してみよう

Global alignment → Needle (protein)

Needle, Proteinを選択し2つの枠内に配列をペーストしてSubmit

練習:上と同じ入力を行い、結果の違いを理解しよう

>human_GNRH1

MKPIQKLLAGLILLTSCVEGCSSQHWSYGLRPGGKRDAENLIDSFQEIVKEVGQLAETQRFECTTHQPRSPLRDLKGALESLIEEETGQKKI>mouse_Gnrh

MILKLMAGILLLTVCLEGCSSQHWSYGLRPGGKRNTEHLVESFQEMGKEVDQMAEPQHFECTVHWPRSPLRDLRGALESLIEEEARQKKM>chicken_Gnrh1

MEKSRKILVGVLLFTASVAICLAQHWSYGLQPGGKRNAENLVESFQEIANEMESLGEGQKAECPGSYQHPRLSDLKETMASLIEGEARRKEI>xenopus_GnRH1

MKAFPTFALLFLVLLFSAHVSDAQHWSYGLRPGGKRDTESLQDMYHETPNEVALFPELERLECSVPQSRLNVLRGALMNWLEGENRKKI>zebrafish_gnrh2

MVLVCRLLLVVGLMLCLSAQLSSAQHWSHGWYPGGKREIDLYDTSEVSEEVKLCEAGKCSYLRPQGRNILKTILLDALIRDFQKRK>ciona_gnrh1

MLDIEKDELAALLQRENSAFRDLLYHKNAGNFEKSDSGKFGSLKPQNNFPHLDLGLGVDLDAVDQWNRYKQANAQRMQDLGVPVNARQHWSYEFMPGGRRAAWENANVGVPVSRQHWSYEYMPGGRRSAGRHAMTKRQHWSKGYSPGGKRSVDLSEFDDQGRRITKHEGMPEEPFKVEQPRPRNGIHGPAGLDQNEPDWKNWMNEQPAVSSDDKGSDVE

GNRH: 生腺刺激ホルモン放出ホルモン.視床下部で合成され、下垂体門脈経路を介して下垂体前葉に運ばれ、生腺

刺激ホルモンである黄体形成ホルモン(LH)と濾法刺激ホルモン(FSH)の産生と放出を促進する神経性ペ

プチドホルモン. ホルモン前駆体として合成されたあと酵素により切断され、ヒトでは HWSYGLRPGペプチドがホルモンとして機能する。

24

Page 25:   · Web view今日は第一回目の授業ですので、最初に今年の授業予定を紹介します。この授業は、コンピューターを使った実習と講義で

Ciona: カタユレイボヤ(ホヤの仲間で日本の研究グループによってゲノムシークエンスが解読された)

講義分子系統樹:Phylogenetic tree, Evolutionary tree

分子系統樹(進化系統樹)(molecular phylogenetic tree, evolutionary tree)塩基配列やアミノ酸配列を基に分岐位置と分岐時間を推定し、構築された系統樹

近接接合法 (neighbor-joining method): 距離行列法で作成する分子系統樹の作成方法で、生物分

野で最も一般的に利用される。

キーワード

節、枝、クラスター (cluster)あるいはクレード(clade)Outgroup、Bootstrap value(ブーツストラップ値)、Evolutionary distance

分子系統樹の利用

(1) 遺伝子の同種間、異種間での系統関係の解析

(2) 遺伝子ファミリーに属するメンバーの系統関係の解析

(3) 重複遺伝子の重複時期と進化的関係の解析

(4) 種や系統の進化的関係の推定

 分子系統樹から、様々な情報を読み取ることができます。異なる生物達の関連(ホモログ)遺伝子で分子系統

樹を作製すると、遺伝子の進化的関係を予測することができます。またミトコンドリア DNAの配列を使うと、人種の類縁関係や進化的関係を解析することが可能です。授業では、分子系統樹の作製方法とデータの見方を講義

します。

実習

分子系統樹の作製

ClustalW を使った Multiple alignmen と分子系統の作成

1) 使用するウェブサイトClustalW   http://clustalw.genome.jp/

2) Fasta format で並べた配列を枠内にペーストし、execute multiple alignment を押す(各種ボタ

ンはデフォルトでよい)

練習:下の gnrh (gonadotropin-releasing hormone)のうち、>ciona_gnrh1(ホヤ)を除く

配列でアラインメントを実行してみよう。次に、>ciona_gnrh1を入れてアラインメントを実行し、結果を比べてみよう。

25

Page 26:   · Web view今日は第一回目の授業ですので、最初に今年の授業予定を紹介します。この授業は、コンピューターを使った実習と講義で

上にMultiple sequence alignmentsの結果が表示される。

その下にある select tree menu で表示形式を選択して、Execをクリックする

表示形式、N-J tree branch lengthとUnrooted dendrogramの結果を比較してみ

よう

>human_GNRH1

MKPIQKLLAGLILLTSCVEGCSSQHWSYGLRPGGKRDAENLIDSFQEIVKEVGQLAETQRFECTTHQPRSPLRDLKGALESLIEEETGQKKI>mouse_Gnrh

MILKLMAGILLLTVCLEGCSSQHWSYGLRPGGKRNTEHLVESFQEMGKEVDQMAEPQHFECTVHWPRSPLRDLRGALESLIEEEARQKKM>chicken_Gnrh1

MEKSRKILVGVLLFTASVAICLAQHWSYGLQPGGKRNAENLVESFQEIANEMESLGEGQKAECPGSYQHPRLSDLKETMASLIEGEARRKEI>xenopus_GnRH1

MKAFPTFALLFLVLLFSAHVSDAQHWSYGLRPGGKRDTESLQDMYHETPNEVALFPELERLECSVPQSRLNVLRGALMNWLEGENRKKI>zebrafish_gnrh2

MVLVCRLLLVVGLMLCLSAQLSSAQHWSHGWYPGGKREIDLYDTSEVSEEVKLCEAGKCSYLRPQGRNILKTILLDALIRDFQKRK>ciona_gnrh1

MLDIEKDELAALLQRENSAFRDLLYHKNAGNFEKSDSGKFGSLKPQNNFPHLDLGLGVDLDAVDQWNRYKQANAQRMQDLGVPVNARQHWSYEFMPGGRRAAWENANVGVPVSRQHWSYEYMPGGRRSAGRHAMTKRQHWSKGYSPGGKRSVDLSEFDDQGRRITKHEGMPEEPFKVEQPRPRNGIHGPAGLDQNEPDWKNWMNEQPAVSSDDKGSDVE

このサイトでの検索結果では、Bootstrap value, evolutionary distanceの値は表示されない。DDBJのClustalWを使えば、これらの値が求められる。ただし、また結果の図形を表示するために、 Tree Viewと言

う無料ソフトをダウンロードする必要がある。教室のコンピューターでは、ソフトウェアのダウンロードは

ためらわれるので、各自のパソコンで DDBJを試して下さい。

26

Page 27:   · Web view今日は第一回目の授業ですので、最初に今年の授業予定を紹介します。この授業は、コンピューターを使った実習と講義で

11月15日(第7回)

実習

分子系統樹の作成

ショウジョウバエ(Drosophila)の hedgehogタンパク質に対する、マウス(Mus musculus)とツメガエ

ル(Xenopus tropicalis)の類似遺伝子を検索して分子系統樹を作成する。

配列はメモ帳(Textファイル)にコピーする。

手順は以下のように行う

1.ショウジョウバエ(Drosophila)の hedgehog タンパク質のアミノ酸配列を、proteinデータベースからキーワード検索する(Accession number: AAF56102)。FASTAボタンを押すと、FASTAフォームの配列が表示される。アミノ酸配列をWordにコピーする。>名前を付けて、Fasta formatとする(スペースと数字は、検索時に排除されて計算されるので、そのままにしてもかまわない)。

2.マウスの hedgehogホモログを検索して、配列を取り出すNCBI先頭ページ下側 FeaturesにあるMap viewer でマウスMus musculusの B (blast)ボタンをクリック。マウスゲノムに対する BLASTが開くので、Bastpを選択して検索する(マウスゲノムにコードされる

全てのタンパク質アミノ酸情報に対して検索)。

 検索により表示された3種類の hedgehogの配列を取り出す。取り出し方は、Accession 番号をクリッ

クし、表示された配列情報ページの上にある FASTAボタンを押す。FASTAフォームの配列が表示されるで、

コピーする。

3.Xenopusの hedgehogホモログを検索して、配列を取り出すMap viewer で Xenopus tropicalisを選ぶ。以下、2の操作と同じ。

4.ClustalW(http://clustalw.genome.jp/)を使って、枠内に7つの遺伝子の全配列をコピーし、マル

チプルアライメントを実施する。マウスと Xenopus の間で配列の保存性を注意深くみて、保存性の特徴を

理解する。

5.分子系統樹を作成する。N-J tree branch lengthとUnrooted dendrogramの結果を比較

4の結果とあわせて、Outgroup, Paralog, Orthologの関係を理解する。ヒト遺伝子間のパラログよりも 、

ヒトと Xenopus のオルソログ間の方が保存性の高いことに注意 。これは祖先遺伝子が重複して2つの遺伝

子(パラログとなる)を形成し、そのあとに種分化が起こったためである。

Hedgehogの配列(ショウジョウバエ、マウス、カエル)

>drosophila_hhMDNHSSVPWASAASVTCLSLDAKCHSSSSSSSSKSAASSISAIPQEETQTMRHIAHTQRCLSRLTSLVALLLIVLPMVFSPAHSCGPGRGLGRHRARNLYPLVLKQTIPNLSEYTNSASGPLEGVIRRDSPKFKDLVPNYNRDILFRDEEGTGADRL

27

Page 28:   · Web view今日は第一回目の授業ですので、最初に今年の授業予定を紹介します。この授業は、コンピューターを使った実習と講義で

MSKRCKEKLNVLAYSVMNEWPGIRLLVTESWDEDYHHGQESLHYEGRAVTIATSDRDQSKYGMLARLAVEAGFDWVSYVSRRHIYCSVKSDSSISSHVHGCFTPESTALLESGVRKPLGELSIGDRVLSMTANGQAVYSEVILFMDRNLEQMQNFVQLHTDGGAVLTVTPAHLVSVWQPESQKLTFVFADRIEEKNQVLVRDVETGELRPQRVVKVGSVRSKGVVAPLTREGTIVVNSVAASCYAVINSQSLAHWGLAPMRLLSTLEAWLPAKEQLHSSPKVVSSAQQQNGIHWYANALYKVKDYVLPQSWRHD>mouse_dhhMALPASLLPLCCLALLALSAQSCGPGRGPVGRRRYVRKQLVPLLYKQFVPSMPERTLGASGPAEGRVTRGSERFRDLVPNYNPDIIFKDEENSGADRLMTERCKERVNALAIAVMNMWPGVRLRVTEGWDEDGHHAQDSLHYEGRALDITTSDRDRNKYGLLARLAVEAGFDWVYYESRNHIHVSVKADNSLAVRAGGCFPGNATVRLRSGERKGLRELHRGDWVLAADAAGRVVPTPVLLFLDRDLQRRASFVAVETERPPRKLLLTPWHLVFAARGPAPAPGDFAPVFARRLRAGDSVLAPGGDALQPARVARVAREEAVGVFAPLTAHGTLLVNDVLASCYAVLESHQWAHRAFAPLRLLHALGALLPGGAVQPTGMHWYSRLLYRLAEELMG>mouse_ishhMSPAWLRPRLRFCLFLLLLLLVPAARGCGPGRVVGSRRRPPRKLVPLAYKQFSPNVPEKTLGASGRYEGKIARSSERFKELTPNYNPDIIFKDEENTGADRLMTQRCKDRLNSLAISVMNQWPGVKLRVTEGWDEDGHHSEESLHYEGRAVDITTSDRDRNKYGLLARLAVEAGFDWVYYESKAHVHCSVKSEHSAAAKTGGCFPAGAQVRLENGERVALSAVKPGDRVLAMGEDGTPTFSDVLIFLDREPNRLRAFQVIETQDPPRRLALTPAHLLFIADNHTEPAAHFRATFASHVQPGQYVLVSGVPGLQPARVAAVSTHVALGSYAPLTRHGTLVVEDVVASCFAAVADHHLAQLAFWPLRLFPSLAWGSWTPSEGVHWYPQMLYRLGRLLLEESTFHPLGMSGAGS>mouse_shhMLLLLARCFLVILASSLLVCPGLACGPGRGFGKRRHPKKLTPLAYKQFIPNVAEKTLGASGRYEGKITRNSERFKELTPNYNPDIIFKDEENTGADRLMTQRCKDKLNALAISVMNQWPGVKLRVTEGWDEDGHHSEESLHYEGRAVDITTSDRDRSKYGMLARLAVEAGFDWVYYESKAHIHCSVKAENSVAAKSGGCFPGSATVHLEQGGTKLVKDLRPGDRVLAADDQGRLLYSDFLTFLDRDEGAKKVFYVIETLEPRERLLLTAAHLLFVAPHNDSGPTPGPSALFASRVRPGQRVYVVAERGGDRRLLPAAVHSVTLREEEAGAYAPLTAHGTILINRVLASCYAVIEEHSWAHRAFAPFRLAHALLAALAPARTDGGGGGSIPAAQSATEARGAEPTAGIHWYSQLLYHIGTWLLDSETMHPLGMAVKSS>xenopus_shhMLVATQSLLLLSFICTLVTPPGLACGPGRGIGKRRHPKKLTPLAYKQFIPNVAEKTLGASGRYEGKITRNSDCFKELTPNYNPDIMFKDEESTGADRLMTQRCKDKLNALAISVMNQWPGVKLRVTEGWDEDGHHLEESLHYEGRAVDITTSDRDRSKYGMLGRLAVEAGFDWVYYESKAHIHCSVKAENSVAAKSGGCFPAGARVMVEFGGTKAVKDLRPGDRVLSSDPQGNLLYSDFLMFIDQERDVKKLFYVIETSQRKIRLTAAHLLFVAQTKVNGTRSFKSVFASNIQPGDLIYTADPKTMTLKAVKVEKVDLEEDTGAYAPLTAHGTVVIDQVLASCYAVIEEHTWAHLAFAPLRFGMSLSSYIYPRDSSPPSGLQPHHQVDLQSHHQVDLQSHHQVDLQSHHQLEGIHWYSQLLYQIGTWLLDSNSLHPLGMATKSS>xenopus_dhhMPAVRIVILAICCGLLLVPVRCCGPGRGPVGRRRYMRKLVPLHYKQFVPNVPEKTLGASGKSEGKIHRGSERFIELVPNYNPDIIFKDEEKTGADRLMTERCKDRVNALAISVMNMWPGVKLRVTEGWDEDGHHAHDSLHYEGRALDITTSDRDRNKYGMLARLAVEAGFDWVYYESKAHIHVSVKADNSLGVRSGGCFPGTAMVMMGTGERKPLSELKIGDTVYTTDETGQLITSVVLLFLHRNPYKTATFVLIEAEGHPSKLLVTPNHLLFIQSSSSAGFLPFAYRVQIGDLVQIYVNGTQVQSSKVV

28

Page 29:   · Web view今日は第一回目の授業ですので、最初に今年の授業予定を紹介します。この授業は、コンピューターを使った実習と講義で

RVSLEEQTGVYAPMTEHGTLLVDGVLTSCYATVESHTLAHVSLAPLRLFQGIASMLPDLDMSDGVHWYCHILYVLAKYVLWWDMP>xenopus_ihhMQLPKVVLLLCAAALLLSGAVRGCGPGRVVGRRRRPTKLSPLSYKQFSPNVPEKTLGASGRYEGKISRNSERFKELTPNYNPDIIFKDEEITGADRLMTQRCKDRLNSLAISVMNQWPGVKLRVTEGWDEDGHHFEESLHYEGRAVDITTSDRDRNKYGMLARLAVEAGFDWVYYESKAHIHCSVKSEHSAAAKTGGCFPGEALATLESGEKIPVSQLSPGLRVLAMDNSGRPTYSDFLSFLDHSPKEEHMFQVIKTQDPHRRLFLTPAHLIFVSDNYSTPASEFQAVFASSVRPGQYILVSNVVGLIPAKVRSVNTQTNYGAYAPLTQHGTLVVDDVVVSCFALVQKQRLAQIVYWPLRVLYNLGIIAGTQPSQQMGIHWYSKALYHLGRLILHGNEFHPLGIVQLES

講義

オルソログとパラログ、ホモログの関係について

 無脊椎動物から脊椎動物への進化の過程では、比較的短期間のうちに全ゲノム(全ての染色体)の重複

(whole genome duplication: WGD)が 2回起こっています。そのため原索動物(ナメクジウオ等が含まれ、

無脊椎動物のなかで脊椎動物に最も近い)で 1 種類であった遺伝子は、一度 4つに数が増えています(遺伝子に

よっては 4つに増えたあと、3つが消失して 1 種類だけ残っているもの、4つとも残っているもの、1つ消失して 3つが残っているもの、2つ消失して 2つが残っているものもあります)。このようにゲノム重複により、一

つの遺伝子から派生した重複産物はパラログ(Paralog)と呼ばれます。現存の脊椎動物(円口類を除く)は 2回のゲノムの重複が起こってから、多様な種が分岐しています。そのため、脊椎動物の生物種間で、共通する重複

遺伝子が存在しており、それらは(Ortholog)と呼ばれ、パラログと区別されます。オルソログとパラログとの

関係は、分子系統樹を作製することにより理解できます。ホモログ(関連遺伝子)は、共通祖先から発生した遺

伝子の総称で、オルソログとパラログもホモログに含まれます。

 オルソログとパラログの関係を理解するために、生物の進化の歴史、遺伝子重複の歴史について解説します。

また hedgehog遺伝子をモデルとして、分子系統樹を作製し、ホモログとパラログの関係を説明します。 無脊椎動物から脊椎動物に進化する過程で発生したゲノム重複について少し詳しく説明します。hox遺伝子、核内受容体遺伝子を例にして、ゲノムに刻まれた遺伝子重複の歴史を解説します(ここでは、配付資料を参考に

して説明します)。

29

Page 30:   · Web view今日は第一回目の授業ですので、最初に今年の授業予定を紹介します。この授業は、コンピューターを使った実習と講義で

11月22日(第8回)

 

30

Page 31:   · Web view今日は第一回目の授業ですので、最初に今年の授業予定を紹介します。この授業は、コンピューターを使った実習と講義で

11月29日(第9回)

鈴木不在(分子生物学会に出席)のため酒井先生が代わりに下記の内容で授業を行います。

配列のアラインメント手法とBLAST検索の原理

・配列のアラインメントとは

・全域アラインメントと局所アラインメント

・アミノ酸置換行列

・動的計画法に基づく局所アラインメントの求め方

・BLASTはどのように検索を行っているのか

(動的計画法との違いと、それにともなう利点、問題点)

進化系統樹とCLASTAL Wで用いられている近隣結合法の原理

・種の進化モデル

・分子時計仮説

・ウルトラメトリック木と加法木

・UPGMA法

・近隣結合法

以上について概説する。

同内容の詳細については3年前期「生物生産情報処理概論」にて講義する。

12月6日(第10回)

講義

タンパク質の構造についての解説各種プログラムを使うことにより、タンパク質の構造的特徴を予測することができます。今日の授業では、シグ

ナルペプチド、ドメイン構造について解説したあと、テスト配列を使って実際にこれら構造の検索(分子量、等

電点、シグナルペプチド、疎水性・親水性領域、ドメイン構造)を行います。

 代表的なドメイン構造(モチーフ)検索サイトには、イギリスのサンガー研究所が公開している Pfamがあります。

31

Page 32:   · Web view今日は第一回目の授業ですので、最初に今年の授業予定を紹介します。この授業は、コンピューターを使った実習と講義で

シグナルペプチド

分泌性の蛋白質のN末端に存在する、15-30残基の疎水性アミノ酸から構成されたシグナル配列。分泌前に、シ

グナルペプチダーゼによって切断される。

タンパク質のドメイン(モチーフ)構造

ドメイン構造(=モチーフ):タンパク質のアミノ酸配列のなかで、特有な性質を持った領域。分子の構造上あ

るいは機能上一つのまとまりを持つ領域。

ドメイン構造の例

細胞膜レセプター:リガンド結合ドメイン、細胞膜貫通ドメイン、チロシンキナーゼドメイン、リン

酸化ドメイン

核レセプター:リガンド結合ドメイン、DNA結合ドメイン

実習

塩基配列のアミノ酸配列への変換

してみます。コンピューター操作に慣れるようにして下さい。今回は、魚類の cDNAライブラリーからクローニングされた cDNAクローンの全長配列(5’UTR, CDS, 3’UTRを含んでいる)を使って実習します。

5’UTR(5’非翻訳領域), CDS(コード配列), 3’UTR(3’非翻訳領域)

塩基配列(>test_DNA_sequence-1)をアミノ酸配列に変換してみよう

1 ) 利 用 す る ウ ェ ブ サ イ ト : NCBI (National Center for Biotechnology Center) http://www.ncbi.nlm.nih.gov/

2)使用するアイコン:Open Reading Frame Finder (ORF finder )open reading frame = 蛋白質をコードする塩基配列の読み取り枠

検索手順1. NCBIのウェブサイトを開き、左上 Resource List (A-Z)をクリック

2. Open reading frame finder(ORF finder)を開ける

3.アミノ酸配列に変換する

配列(FASTA format)を枠内に配列をコピーする

OrfFindボタンを押す

青で示された部分が、予想されるアミノ酸配列

(センス、アンチセンス鎖の3フレームでの翻訳結果が示される)

通常、一番長いフレームがタンパク質のコード配列である

32

Page 33:   · Web view今日は第一回目の授業ですので、最初に今年の授業予定を紹介します。この授業は、コンピューターを使った実習と講義で

青のバーをクリックする=塩基配列とアミノ酸配列が表示される

4.推定されたアミノ酸配列を取り出すには

Acceptボタンを押すViewボタンを押す:アミノ酸配列データと諸情報が示されているアミノ酸配列をテキストファイル等にコピーする

>test_DNA_sequence-1(zebrafish_charon)AACGAAACCTTGAACCGCAAGATTTTTCAACAAATAATCGACTATATGTATTTTTAGAGAGAAATAAATTCCCTCTCTTTTCTTTTTTGTAAAATTCTATAATTTAGCTAAAATGACTTTTCAGGTCGGCTTTTTTGTGCTGTTGTCAGTCACAACAATTGGCGCTTTCCCGCGCAATGCATTTCAGCGGGAATTTCACCGACACGTGGCGAAAGACTTTGAATCCTCCGGGAATGGACCAGACGAACCTGTTCGGGGATCTGTCCGAATTGTCAAACTAAACCCTCATTTTCTGCGCCGGGCCGCCGTTAGTCATGTGCCGTTCAGAAATTCACCAAGTCGAGGCGCGTTTCCCGCGTTCTTGGCCCTCGGACGTCCGGGCCCCGCAATCCTGACCCATAGCAAACCTGCGCCTCAGGTGAGCAGCAGTGCAGACAGGAGGAAACAAGGGCTCGAGATGTGGAAGAAAGTGGTGCACAAAAGCGAGCGAAAAAAAGAGGCAGTGGCTCTGCGCATCAATCCCAAAGACATGAACAAACAGAGCTGTGCCGCAGTTCCCTTTACACAGCGCATAACGGAGGAGGGCTGTGAGACGGTGACCGTTCACAATAATCTCTGCTACGGTCAGTGCAGCTCCATGTTCGTGCCCTCCAGCGGAGGCTCTCACGGACAACAGAAAGCGCAGTGCATGCGCTGCGGCCCCTCTAGAGCGCGCTCCGTGCTCCTGCACCTGCGCCGCGGGTCTGAGGTGCGGGAGAGGCGCGTACTGATCGTTGAGGAGTGCAAGTGTGAAACCAGCAGCGAAGAGGCCAAAGTTCAGAACACAGATATGTTTAATTTATAACAGTCATTTTAAAGTTTATAAAAATCGTAA//

タンパク質の構造解析では、ヨーロッパの研究機関のウェブサイトが充実している。特に Swiss Institute of Bioinformatics、Sanger研究所(イギリス)のサイトは、利用価値が高い。前者は、ExPASy (Bioinformatics Resource Portal)、後者は Pfam(ドメイン解析)を公開している。また European Bioinformatics Institute (EBI)でも、タンパク質の構造解析プログラムを公開している。

基本構造の解析

タンパク質の分子量・等電点の予測:1) ExPASy (http://ca.expasy.org/)を開ける。

2) CategoryのなかのProteomicsを開ける

3) ToolsからCompute PI/Mwを選択

4) 下記の> zebrafish_Charon で検索してみよう。アミノ酸配列を枠内にコピーする(配列のみ:この

プログラムでは>で始まる行はコピーしない)。Click here to computepI/Mwボタンをクリックする。

33

Page 34:   · Web view今日は第一回目の授業ですので、最初に今年の授業予定を紹介します。この授業は、コンピューターを使った実習と講義で

5) 検索結果:Theoretical pI/Mw: 10.00 (等電点)/ 27073.04(分子量)>zebrafish_CharonMTFQVGFFVLLSVTTIGAFPRNAFQREFHRHVAKDFESSGNGPDEPVRGSVRIVKLNPHFLRRAAVSHVPFRNSPSRGAFPAFLALGRPGPAILTHSKPAPQVSSSADRRKQGLEMWKKVVHKSERKKEAVALRINPKDMNKQSCAAVPFTQRITEEGCETVTVHNNLCYGQCSSMFVPSSGGSHGQQKAQCMRCGPSRARSVLLHLRRGSEVRERRVLIVEECKCETSSEEAKVQNTDMFNL//(ゼブラフィッシュ Charon:分泌型のシグナルタンパク質)

疎水性・親水性領域の解析:1)ExPASy Proteomics tools (http://ca.expasy.org/) を開ける 2)CategoryのProteomicsを開ける

3)ToolsからProt Scaleを選択

4)アミノ酸配列を枠内にコピーする。Hphob. / Kyte &Doolittle(デフォルト状態:疎水性/親水性

解析で最も利用されているプログラム)を選択する。

5)>zebrafish_fgfr1 で試してみよう

6)Submitボタンを押す

7)結果:グラフのプラスが疎水性、マイナスが親水性を示す. fgfr1 では、アミノ末端側の疎水領域はシ

グナルペプチドの部分。中央の疎水領域は、細胞膜貫通ドメインである。

>zebrafish_fgfr1

MIMKTTLLLISVLLTQALQSQGRPAIQDEAPAEPTSYTLDSGEKLELSCKAKEDTQKVTWTKDLVPLVDGEHTRLRNDQMEIEKVEPADSGLYACFAQGLNSNHTEYFNISVTDEEDEVDSSSEEAKLSNDQNLPMAPVWAQPDKMEKKLHAVPASKTVKFRCQANGNPTPTLKWLKNGKEFKRDQRIGGFKVREHMWTIIMESVVPSDRGNYTCLVENRHGSINHTYQLDVVERSPHRPILQAGLPANRTAVVGSDVEFECKVFSDPQPHIQWLKHIEVNGSRYGPDGLPYVRALKTAGVNTTDKEMEVLQIRNVSLEDAGEYTCLAGNSIGHSHHSAWLTVYKAVPPTQLPNQTYLEVLIYCVGFFLICVMVGTAVLAKMHSSAKKSDFNSQLAVHKLAKSIPLRRQVTVSVDSSSSMHSGGMLVRPSRLSSSGSPMLSGVSEYELPQDPRWEVQRDRLVLGKPLGEGCFGQVMMAEAMGMDKEKPNRITKVAVKMLKSDATEKDLSDLISEMEMMKIIGKHKNIINLLGACTQDGPLYVIVEFAAKGNLREYLRVRRPPGMEYCYNPDQVPVENMSIKDLVSCAYQVARGMEYLASKKCIHRDLAARNVLVTEDNVMKIADFGLARDIHHIDYYKKTTNGRLPVKWMAPEALFDRIYTHQSDVWSFGVLLWEIFTLGGSPYPGVPVEELFKLLKEGHRMDRPSTCTHELYMMMRDCWHAVPSQRPTFKQLVEDLDRTLSMTSNQEYLDLSVSLDQFSPNFPDTRSSTCSSGEDSVFSHDAGADEPCLPKFPPHPNRGVAFKKR(FGF受容体:細胞内にチロシンキナーゼドメインを持った膜貫通型細胞膜受容体・FGF=fibroblast growth factor/繊維芽細胞増殖因子:創傷治癒、培養条件下で繊維芽細胞の分裂を促進する。胚発生では

中胚葉誘導に関与する)

シグナルペプチドの検索34

Page 35:   · Web view今日は第一回目の授業ですので、最初に今年の授業予定を紹介します。この授業は、コンピューターを使った実習と講義で

タンパク質のシグナルペプチドの予測:1)SignalP 3.0 Server(http://www.cbs.dtu.dk/services/SignalP/)を開ける(デンマークの

Technical Universityが公開)

2)>zebrafish_Charon で検索してみよう。アミノ酸配列を枠内にコピーする。Submitボタンをクリックする。

練習:下のアミノ酸配列でも検索してみよう

>mouse_vitamin_D_receptor

MEAMAASTSLPDPGDFDRNVPRICGVCGDRATGFHFNAMTCEGCKGFFRRSMKRKALFTCPFNGDCRITKDNRRHCQACRLKRCVDIGMMKEFILTDEEVQRKREMIMKRKEEEALKDSLRPKLSEEQQHIIAILLDAHHKTYDPTYADFRDFRPPIRADVSTGSYSPRPTLSFSGDSSSNSDLYTPSLDMMEPASFSTMDLNEEGSDDPSVTLDLSPLSMLPHLADLVSYSIQKVIGFAKMIPGFRDLTSDDQIVLLKSSAIEVIMLRSNQSFTLDDMSWDCGSQDYKYDITDVSRAGHTLELIEPLIKFQVGLKKLNLHEEEHVLLMAICIVSPDRPGVQDAKLVEAIQDRLSNTLQTYIRCRHPPPGSHQLYAKMIQKLADLRSLNEEHSKQYRSLSFQPENSMKLTPLVLEVFGNEIS(ビタミンD受容体は、核に移行する蛋白質なのでシグナルペプチドはない)

ドメイン構造の検索

タンパク質のドメイン構造の予測-1:Pfamを使う(ドメイン検索で最も利用されている:機能ドメインを探

すのに便利)

今日は、下のマウスのビタミンD受容体で検索します。

1) Pfam (http://pfam.sanger.ac.uk/)(イギリスのサンガー研究所)を開ける

2) SEQUENCE SEARCH ボタンを押す

3) 枠内にアミノ酸配列(試しに>mouse_vitamin_D_receptor)をコピーし、submit を押す

4) みつかったドメイン構造がグラフィックで上に図示される。

5) 下には各ドメインの説明が表示される。

6) 一番右の Show/hide alignment を押すと、データベースに納められているドメイン配列と問い合

わせ配列のアライメントが表示される

7) ドメインネーム(上のグラフィックも同様)がアクティブで、それを押すと、ドメインの説明、立体

構図が表示される

8) 右上のグラフィックツールのうち、crystallographic structuresを押すと、みつかったタンパク質の高次構造がグラフィックで示され、詳細な構造の説明も表示される。PBD IDを押すと、タンパク質の高次構造(アルファへリックス構造等)が表示される。

>mouse_vitamin_D_receptor

35

Page 36:   · Web view今日は第一回目の授業ですので、最初に今年の授業予定を紹介します。この授業は、コンピューターを使った実習と講義で

MEAMAASTSLPDPGDFDRNVPRICGVCGDRATGFHFNAMTCEGCKGFFRRSMKRKALFTCPFNGDCRITKDNRRHCQACRLKRCVDIGMMKEFILTDEEVQRKREMIMKRKEEEALKDSLRPKLSEEQQHIIAILLDAHHKTYDPTYADFRDFRPPIRADVSTGSYSPRPTLSFSGDSSSNSDLYTPSLDMMEPASFSTMDLNEEGSDDPSVTLDLSPLSMLPHLADLVSYSIQKVIGFAKMIPGFRDLTSDDQIVLLKSSAIEVIMLRSNQSFTLDDMSWDCGSQDYKYDITDVSRAGHTLELIEPLIKFQVGLKKLNLHEEEHVLLMAICIVSPDRPGVQDAKLVEAIQDRLSNTLQTYIRCRHPPPGSHQLYAKMIQKLADLRSLNEEHSKQYRSLSFQPENSMKLTPLVLEVFGNEIS(ビタミンD受容体;核タンパク質受容体ファミリーのメンバーで、骨形成等に関与する)

終わった人は、次のタンパク質で検索してみよう:

ゼブラフィッシュ・FGFレセプター

3D構造データベースの閲覧

NCBIの利用

NCBIの Resource Listの中にある Structure (Molecular Modelling Database)を使うと、タンパク質構造データベースに納められている 3D構造を閲覧することができます。

↓NCBI homepage↓Resource Listから Structure (Molecular Modelling Database)を選択

↓左カラムの Searchを選択

↓Searchの枠にタンパク質明を入力して検索(試しに prion, VDR で検索してみよう)

PDB (Protein Data Bank) の利用www.pdb.org上のアイコンからmacromoleculeを指定してキーワード検索(試しに prion, VDR で検索してみよう)

3D構造だけでなく、遺伝子の機能の解説も添えられている

NCBI blastpによる検索

Blastp でデータベースを Protein Data Bankを選択して検索する(上のProtein Data Bankに登録され

ている高次構造の分かっているタンパク質に対してblastp検索が行われる)

配列類似遺伝子で高次構造の解析されているタンパク質が表示される。右の Accessionボタンを押すと、データが表示される。右に 3D構造が図示される。

36

Page 37:   · Web view今日は第一回目の授業ですので、最初に今年の授業予定を紹介します。この授業は、コンピューターを使った実習と講義で

12月13(第11)

実習

代謝経路データベースの利用

 無料で公開されている代謝経路のデータベースとして最も充実しているのが、京都大学化学研究所が統括して

いる KEGG (Kyoto Encyclopedia of Genes and Genomics)である。代謝経路のマップを調べることが

できるだけでなく、遺伝子の機能、配列、タンパク質の立体構造も検索できる。クローニングした遺伝子がどの

ような代謝経路で機能しているか、あるいは代謝異常のメカニズムなども調べることができる。

 またさまざまな化合物(抗生物質等)や市販の医薬品の構造、薬理作用、副作用を検索することもできる。遺

伝子や化合物の機能や相互作用を調べる場合、またレポート作成等にも役立つと思う。日本語表記のサイトも利

用できる。授業では、KEGGの使い方を実習します。 最近、KEGG MEDICUSと名付けられた、医薬品・疾患・パスウェーの統合データベースが公開されている。

疾患・医薬品・環境物質など社会的ニーズの高いデータを、ゲノム情報を基盤とした生体システム情報といて統

合したリソースで、研究者だけでなく、医療従事者や一般の人にも情報を提供している。

KEGGブラウザ:http://www.genome.jp/kegg/pathway.html

KEGG Pathwayを開けてみよう。パスウェーの項目は、以下ように分類されている。

1. Metabolism;代謝経路(ビタミン A, retinol metabolism, の代謝経路を調べてみよう。代謝産物を

示す がアクティブで構造等が表示される。また代謝を司る酵素名もアクティブで、配列情報等が表示◯される)

2. Genetic Information Processing;遺伝子から蛋白質合成経路・蛋白の修飾と分解・ゲノムの修復

等(homologous recombinationと non-homologous end-joiningの経路を比較してみよう)3. Environmental Information Processing;細胞内シグナル伝達経路・分泌性シグナル因子を介し

た細胞間相互作用(TGF-betaの細胞内伝達系を調べてみよう。発現の促進と抑制(アゴニスト)の関

係が分かる)

4. Cellular Processes:細胞の活動、細胞分裂サイクル等(Oocyte meiosis(卵母細胞減数分裂)を調

べてみよう)

5. Organismal system;免疫系・内分泌制御経路等(GnRH、生殖腺刺激ホルモン放出ホルモン、の内

分泌経路を調べてみよう)

6. Human Deseases:発ガン経路・代謝異常等(Melanoma, プリオン病, diabetes(1型糖尿病、2型糖尿病)の発症経路を調べてみよう)

7. Drug Development:抗生物質・薬剤の化学構造(penicillin, antidepressantsを調べてみよう。合

成経路、薬剤の分解酵素等も表示される)

遺伝子のキーワードでパスウェーを検索する時の操作は下記の通り(遺伝子名からパスウェーに入る)

37

Page 38:   · Web view今日は第一回目の授業ですので、最初に今年の授業予定を紹介します。この授業は、コンピューターを使った実習と講義で

練習に shh; sonic hedgehogのシグナルパスウェーを見よう

1. 先頭ページで KEGG PATHWATをクリック2. 枠に shhを入力してGO3. shh遺伝子が関与するパスウェー(Entry)が複数表示される

4. 試しにmap04340 を選択してみよう。

5. パスウェーが拡大される。各遺伝子がアクティブで、配列・機能情報にリンクしている。

6. 上の HEDGEHOG SIGNALLING PATHWAYを選択すると、このシグナルの説明を見ることができ

る。

練習にestradiolの合成経路を調べてみよう

1. 先頭ページで KEGG PATHWATをクリック2. 枠に estradiolを入力してGO3. estradiolが関与するパスウェー(Entry)が複数表示される

4. Steroid hormone biosynthesisをあけると cholesterolからの合成経路を見られる

遺伝子の化合物の構造を検索する時の操作は下記の通り

練習にampicillinの構造を調べてみよう

1. 先頭ページで KEGG DRUGをクリック2. 枠に ampicillinを入力してGO3. Entryを選択すると構造等が見られる

KEGGのBLAST検索を使って、調べたい遺伝子・タンパク質が乗っているパスウェーを検索することもでき

る.1. KEGG2 先頭ページのGENESをクリック。BLASTを開ける。

2. 例として、下の塩基配列(私達の研究グループがウナギからクローニングした遺伝子でまだ

データベースには登録していない)で BLASTX検索してみよう>test_DNA_sequence-2

ATCACTGCGTCTTGTGTCCTATCGGTCTAGCCTAGCCACTGTCTANAAGCTATAGGAAGGTTTCAGTATTGGGAGCCATGTTTGGGAGCCTGCTGTTCACTGTGCTGTGTGAGGCAGCAGTGGCCCTCATCAACCCAAATCTAAGCCTCCATTGGGAGATGTGGAAGGAGGGACATGACAAGACCTACCTGTTTAAGGCTGAAGAGTTTGCACGCCGCCAGATCTGGGAGAAGAACCTGAAGCTGATAACTCTGCATAATTTGGAGGCGTCCATGGGAATGCACACCTATGATCTGGGCATGAACCACCTAGGAGACTTGACTACCGAGGAGATTCTTGACGTGCTAGCTGTAACTCGTGTGCCTCCAAACTTCAGCAGGGGTCCTTCTCCCTTTGTGGGGGTATCCAGGGCCCCTGTGCCTCACAATGTTGATTGGCGAAGAAAGGGCTATGTCACAGAAGTCAAGAGTCAGGGGCGTTGTGGCTCCTGCTGGGCCTTCAGTGCTGCAGGTGCCCTGGAGGGCCAGCTGATGAAGACTCAGGGAACACTTGTATCCCTCAGCCCT

38

Page 39:   · Web view今日は第一回目の授業ですので、最初に今年の授業予定を紹介します。この授業は、コンピューターを使った実習と講義で

CAGAACCTGGTTGACTGCTCCTACAAATATGGCAACGAGGGCTGTCATGGAGGGTTCATGACTCAAGCCTTCCAGTATGTCATTGAGAACGGGGGCATTGAGTCTGACTTTTCATACCCTTACACTGGCATGGAAGAACAATGCAGATATGATTCAGAACTCCGTGTTGCCAACTGTTCCAGCTACAGGTTTCTTCCTGAAGGTGATGAGGTTGCATTAAAATGGGCTCTGGCCACTGTTGGACCAATCTCTGTGGCTATTGATGCTGCTCGACCTAATTTCCACTTCTACCGGAGTGGTGTGTACCATGACCCTACCTGTACCCAAGAAGTAAACCATGGTGTTCTAGCAGTTGGCTATGGTACGCTCAATGGTGAGGACTACTGGCTTGTGAAGAACAGCTGGGGACAGCCTTTTGGGGAACAGGGCTACATTCGCATGGCACGAAACAAGAACAACCAGTGTGGCGTTGCCTTGTATGCCTGCTACCCCATTATGTGACGACCTGAAGCAAAGGATTGATTTCTAACTTGAAACATTTTAAAATTTTTATTTTGATTTGCACCTGTGCATGTTACTGATTTGTAAAGAATACTGTTAAAATGATTTGTATTAAAAAAATATATATTTTTAGATGTGGAATTTTAGTTGAACCTAAATAAATAAATGTAAAAAAAAA

1. ゼブラフィッシュ Dreのエントリーを開けてみよう

2. Pathwayを開けてみよう。検索した遺伝子のパスウェー上の位置が分かる

KEGG MEDICUS

利用できるサービス

・ KEGG MEDICUS 医薬品情報

・ KEGG MEDICUS 疾患情報

・ KEGG MEDICUS 医薬品相互作用

・ KEGG BRITE 医薬品分類

・ KEGG お薬情報

KEGG MEDICUSを開けて、Imatinibと言う医薬品でキーワード検索してみよう

39

Page 40:   · Web view今日は第一回目の授業ですので、最初に今年の授業予定を紹介します。この授業は、コンピューターを使った実習と講義で

バイオデータベースの利用

 遺伝子の機能を知りたい場合には、ポストゲノムのモデル生物(マウス、ゼブラフィッシュ、シロイズナズナ

等)の検索サイトが重宝します。これらは、バイオデータベースと呼ばれます。モデル生物のなかでも、特にマ

ウスとゼブラフィッシュのデータベースが充実しており、遺伝子の機能だけでなく発現パターン(遺伝子が何時

どの組織で、どれだけの量が発現するか)、遺伝子ノックアウトやノックダウンの表現型もデータベース化され

ており、遺伝子名のキーワード検索でデータを入手することが可能です。

 ヒトの遺伝子機能と遺伝子疾患のデータベースとして NCBIにOMIM(Online Menderian Inheritance in Man)が公開されています。遺伝子名でキーワード検索すると、遺伝子の機能、遺伝子疾患が存在する場合には、

配列変異と疾患の表現型を知ることが可能です。

 マウスのデータベース(MGI: mouse genome informatics)の特徴として、遺伝子ごとにノックアウトマウスの表現型がデータベース化されており、表現型から遺伝子の機能を調べることができます。マウスのデータ

ベースでは、遺伝子の正確なマップポジション(連鎖地図、ゲノム配列上)等も示されています。

 ゼブラフィッシュのデータベース(ZFIN:zebrafish Organism Data Base)には、in situ ハイブリダイゼーションによる発現解析のデータが写真で掲載されており、遺伝子発現に関する組織レベルの情報を得ること

ができる特徴があります。脊椎動物中であればオルソログ遺伝子(異なる生物の同一遺伝子)の発現パターンは

類似していることが多いので、マウス、ウシやニワトリを研究対象にする場合でも参考となります。

論文や単行書を読んで機能が分からない遺伝子(タンパク質)がでてきた時には、それらの遺伝子の機能を調

べる必要があります。このようなときにはNCBIのOMIM (Online Mendelian Inheritance in Man) とマウス・ゼブラフィッシュのウェブサイトを使うと情報を得ることができます。授業では、これらのサイトの使い

方と特徴について説明します。

OMIMの使い方

ヒトで分かっている遺伝子の機能を詳細に記述している。関連文献もリスとされている。

1. NCBIを開け、左上のAll List (A-Z)からOnline Menderian Inheritance in Man (OMIM)を選択する。

2. 枠内に遺伝子名を入力して検索

練習に growth hormone(成長ホルモン)を検索してみよう

growth hormone遺伝子および関連遺伝子の配列変異によって起こる症候群のリストが表記される。遺

伝子の機能、変異に伴う疾患、タンパク質の構造、関連論文を調べることができる。

MGI, ZFINの使い方

ポストゲノム研究のモデル生物のウェブサイトを利用してみよう。これまでの研究によって明らかにされている

遺伝子の機能が検索できる。

1.マウス(MGI)40

Page 41:   · Web view今日は第一回目の授業ですので、最初に今年の授業予定を紹介します。この授業は、コンピューターを使った実習と講義で

mouse genome informatics:  http://www.informatics.jax.org/1. 先頭ページのQuickSearchの枠内に遺伝子名を入力する

2. 入力した遺伝子の情報、遺伝子改変マウスがリストされる

試しにPax6(眼の発生の上流にある転写因子)を入力してみよう

Pax6と言うワードを含む遺伝子リストが表示される。Pax6を選択する

得られる情報

Symbol/Name/ID:遺伝子の正式名称、略記

Synonyms:同義語(別名)

Genetic map:遺伝子の連鎖地図上の位置

Sequence Map:遺伝子の物理地図上の位置

Mammalian Homology:哺乳類の相同・類似遺伝子

Sequences:ゲノム塩基配列・cDNA塩基配列・アミノ酸配列情報Phenotypes; ノックアウトマウスの表現型。遺伝子の生物機能が分かる

Polymorphism: 系統間で見られる配列多型。SNPs(1塩基多型)等Gene Ontology (GO):遺伝子の機能、構造

Expression:発現する組織のリスト

Protein Domains:転写産物が持つドメイン構造のリスト

References:関連文献

2.ゼブラフィッシュ(ZFIN)The Zebrafish Model Organism Database:http://zfin.org/

1. Genes/Makers/Clonesを開ける

2. Name/Symbol に遺伝子名を入力して検索

試しにpax6 と入力して検索してみよう。

魚類で単独に起こったゲノム重複のため pax6aと pax6bがあるSymbol-name では遺伝子の各種情報が表記される

Expression では、遺伝子発現のデータが表記される

Phenotype では、ノックダウンとノックアウトの表現型が表記される

Location では、染色体上の位置が表記される

41

Page 42:   · Web view今日は第一回目の授業ですので、最初に今年の授業予定を紹介します。この授業は、コンピューターを使った実習と講義で

12月20日(第12回)

実習

—ゲノム塩基配列をデータベースから取り出す—

Ensembl Genome Brower

Ensembl Genome Brower(ゲノムデータの統括サイト)は、Sanger研究所・EBIが管理するゲノムデータベースです。最大の特徴は、必要な遺伝子、あるいは染色体領域のゲノム塩基配列を取り出すことができること

にあります。ノックアウトマウスの相同組換えに用いる配列、GFPを使ったレポーター遺伝子作製用のプロモーター配列等が必要な場合などで、Ensembl を使ってゲノム配列を取り出す必要があります。実習では、

Ensemblの説明と実際の配列の取り出し方を教えます。

また、ゲノム配列、全遺伝子のコード配列、全蛋白質のアミノ酸配列もダウンロードすることが可能で、それ

らを使って自前でバイオインフォマティックス解析を行うことができます。

「使用法-1」

Ensemblを使って、試しにマウスの sonic hedgehog(shh)のゲノム配列を取り出してみます。

1.下記のウェブサイトを開ける

http://www.ensembl.org/index.html (ensembl でキーワード検索)2.生物種を指定する

マウスを選択

3.検索項目から geneを選び、遺伝子名(shh)をボックスに入れて検索4.リストアップされてきた複数の遺伝子から、shhをクリック(ESMSUSG000000002633)する

染色体上の地図が表示される

5.左側のツールボックスの中から Sequenceを選択してクリック

6.配列が表示される(エクソンは赤字で肌色の背景、エクソン間の黒字の部分はイントロン、第一エクソンよ

り上流はプロモーター領域の一部である)

7.戻って、Locationからもゲノム構造を検索することができる

8.左側にある Export data で、範囲を選択して配列を取り出すことができる(範囲を指定して、より長いプロ

モーター配列を取りですことができる)

「使用法-2」

ゲノム配列、全遺伝子のコード配列、全蛋白質のアミノ酸配列をダウンロードする

Gene annotation --- Download genes, cDNAs, ncRNA, proteins (FASTA)からダウンロード可能

42

Page 43:   · Web view今日は第一回目の授業ですので、最初に今年の授業予定を紹介します。この授業は、コンピューターを使った実習と講義で

転写調節領域のコンセンサス結合配列の予測-

講義遺伝子の発現調節機構

 遺伝子は、特定の細胞また時期に必要量だけ発現するように調節されています。例えば、ペプシノーゲンの発

現は胃に限定されており、筋肉や脳では決して発現しないように制御されています。発生に関係する遺伝子のな

かには、魚類の孵化酵素のように一生のうち孵化時に一度だけ発現する遺伝子もあります。このような発現調節

に関する情報は、ゲノムのコード領域ではなく、その近辺に存在する転写調節領域(エンハンサー領域)にコー

ドされています(5’上流にある場合が多いが、3’下流にあるものやイントロンにある遺伝子も存在する)。具体

的には、転写因子が結合するコンセンサス結合配列がその情報と言うことになります。転写因子は、ゲノムの決

まった配列を認識して結合します。その配列がコンセンサス結合配列です。コンセンサス結合配列は、 6-20塩基ほどの短い配列です。転写調節領域には、複数個のコンセンサス配列が存在し、複数の転写因子が結合・解離す

ることにより、遺伝子の転写を精密に調節しています。講義では転写調節のメカニズムについて解説し、実習で

転写調節領域のコンセンサス配列を検索します。

実習マウスの sonic hedghog遺伝子の 5’上流域の転写調節領域の配列をゲノムデベースから取り出し、コンセンサ

ス結合配列を予測してみます。

コンセンサス結合配列の検索には幾つかのプログラムがありますが、実習では TFSearchを用います。

http://www.cbrc.jp/research/db/TFSEARCHJ.html

問題:マウスの sonic hedghog(shh)遺伝子の転写調節領域の配列をゲノムデータベースから取り出し、コ

ンセンサス結合配列を予測する。

(1)最初にゼブラフィッシュの sonic hedghog遺伝子の 5’上流域の転写調節領域の配列をゲノムデベース

から取り出します。

1) Emsembl (http://www.ensembl.org/index.html)を開けます

2) 対象性物からmouseを選択

3) 検索項目から geneを選び、shh で検索

4) 検索結果のページにある shhのアクセッションをクリック5) 左側ボタンの Sequenceをクリックすると、ゲノム配列が表示される

6) 第1エクソン(赤字)から上流の配列(転写調節領域)をメモ帳にコピーする( -40 bあたりに TATA box (TATA(A/T)A(A/T))が存在することが分かる。その約 40b 上流には CAAT Box (GCCAATCT)が配置す

る)

(2)次に、MOTIF Searchを開ける

(http://www.cbrc.jp/research/db/TFSEARCHJ.html)

43

Page 44:   · Web view今日は第一回目の授業ですので、最初に今年の授業予定を紹介します。この授業は、コンピューターを使った実習と講義で

7) 上の枠に任意の名前を入力する

8) 下の枠に塩基配列をコピー、分類を脊椎動物とし、Execをクリック

注意:コンセンサス配列は、ほとんどの場合 6-10b 程の短い配列であり、加えてある程度の配列のバリエーショ

ンを許容します。そのため予想された配列には、実際には転写因子と相互作用しない配列が高い比率で含まれま

す。検索結果は、目安程度に考えて下さい。実際のコンセンサス配列を同定するためには、分子生物学の技術

(ゲルシフトアッセイ、ルシフェラーゼをレポーターにしたプロモーター解析等)を使って実験的に検証する必

要があります。

講義ポストゲノム研究

様々な生物のゲノム配列が解読されるようになり、ゲノム配列を使った新しい研究がスタートしています。ゲ

ノム配列が利用できると言う前提のもとに始まる研究がポストゲノム研究です。その内容は、遺伝子の機能解析

生物進化、遺伝子疾患の原因遺伝子の探索など多岐にわたります。この授業では、3つのトピックスについて紹

介します。

ポストゲノム研究-1

比較ゲノム学:進化に伴うゲノム構造の変化

 進化的に隔たった多様な生物でゲノム解読が行われたことにより、種内のパラログの検索、また異なる生

物間でオルソログを比較すること、遺伝子ファミリーのメンバーを比較することが可能になりました。また

染色体上の遺伝子の配列を系統的に離れた生物間で比較することにより、それらの共通祖先生物の染色体構造

を推定することが可能となっています。比較ゲノムは、このように生物間でゲノムを比較して、進化を論じ

る研究分野です。授業では、哺乳類と魚類の比較ゲノムを紹介します。

 フグとヒトは、進化的観点から見ると脊椎動物系統樹の両端に位置します。脊椎動物は、大部分の魚類を含

む条鰭類、それとシーラカンス・肺魚および四肢動物を含む総鰭類の2つのグループに大別されます。条鰭類

と総鰭類は4億5千年前に分岐しました。フグとヒトのゲノム構造を比較することにより、4億 5千年前に

生きていた総鰭類と条鰭類の共通祖先(もちろん現存しない)のゲノム構造が明らかとなり、その後のゲノ

ム構造の変化が解明されました。解析の結果、脊椎動物のゲノムの進化について、次のような予想もされて

いなかった結果が得られました。

(1) 4億 5千年前に生きていた総鰭類と条鰭類の共通祖先は12組の染色体を持っていた。

(2) 総鰭類では条鰭類と分かれた直後に、ゲノムに大量のレトロウィルスが挿入され、ゲノムサイズが

大きくなった。その後染色体間の転移と融合(ミキシング)が頻繁に起こった。

(3) 条鰭類では総鰭類と分かれた直後に、ゲノムの倍化(脊椎動物の誕生から数えると3度目)が起こっ

た。重複した遺伝子の大部分は片方がゲノムから脱落したが、約 20%の遺伝子は倍加したまま現在

でも機能遺伝子として働いている。そのため、ゲノム上の遺伝子数は条鰭類の方が総鰭類よりも

20%程多い。このような遺伝子数の増加が、魚類に形態や環境適応の多様性をもたらしたのではな

44

Page 45:   · Web view今日は第一回目の授業ですので、最初に今年の授業予定を紹介します。この授業は、コンピューターを使った実習と講義で

いかと考えられている。また条鰭類では染色体へのレトロウィルスの挿入はわずかであり、染色体

のミキシングもわずかである。

 また、無脊椎動物でも進化的に重要な位置にあるホヤやナメクジウオのゲノム解読が行われ、哺乳類でも

多数の生物のゲノムが解読されています。生物間でゲノムを比較することにより、臭覚受容遺伝子が無脊椎動

物から脊椎動物の進化の過程で遺伝子数を増加してきたことが、明らかになっています。また胎盤の進化で

は、レトロトランスポゾン由来の遺伝子が重要な役割を果たしているという、意外な事実も示唆されていま

す。またヒトとチンパンジーでは、塩基の置換率はたった 1.23%ですが、反復配列の挿入がヒトの方がかな

り多いことが分かりました。このように挿入配列は、以前考えられていたようなたんなるガラクタではない

ことが分かってきました。

シンテニー

 異なる脊椎動物(例えば、ヒト-マウス、ヒト-フグ)を過去に遡ると、共通祖先が存在します。共通祖先から分

岐したあと、それぞれの系で転座と融合が起こっているが、小さなブロック単位で見ると遺伝子の並びが一致す

る領域があります。染色体上で遺伝子の並びが一致している状態は、シンテニーと呼ばれます。全ゲノムが解読

されるとゲノム全体を生物間で比較することが可能となり、シンテニーの様子が明らかとなります。

 ヒトとマウスを比べると、哺乳類同士のため、明瞭にシンテニーの保存状態が見て取れます。

 一方、魚類では四肢動物と分かれてから直後に全ゲノムの重複が起こっているため、魚類の染色体はヒトやマ

ウスの染色体に対して2重のシンテニーを示す特徴があります。

45

Page 46:   · Web view今日は第一回目の授業ですので、最初に今年の授業予定を紹介します。この授業は、コンピューターを使った実習と講義で

1月10日(13回)

講義

1.講義:次世代シーケンス解析の原理

2.

3. 講義

4.

5.次世代シーケンス解析について

6.  次世代シーケンス解析は、この数年で実用化されたDNAシークエンス解析技術で、その原理は従来の

サンガー法を基礎とした蛍光シークエンサー(ゲルを使った電気泳動で1塩基の差で分離された DNAバンドにレーザー光を照射して蛍光検出する)とは全く異なり、ガラス基盤に固着した DNAを鋳型にして、基板上で1塩基の伸長反応ごとに結合した塩基を蛍光検出します。ナノ技術により、1mm四方で万単位

のシークエンス解析が可能です。最も汎用されている Illumina 社の HiSeq2000 では、1リードのリード長は 100bpと短いですが、シーケンサーを一度動かすと(1ラン)で 20億リードが読まれます。つまり 1ランで、100-200Gbp(ギガ=10億)の配列が得られることになります(1ランで 8サンプル解析されるので、1サンプルあたりの解読数は、100bp x 2.5億リード=25Gb です。)。なんと最新の

llumina2500 だと、1回ランすると 1テラ bpの配列が解読されます。7.従来の蛍光シーケンサーでは、1ランで 700bpのリードが 96、総計約 67kbの塩基配列が得られるのに

比べると、オーダーが千万単位違います。つまり次世代シーケンサーが 1台で、蛍光シーケンサーの千万

台分の解析能力があるわけです。HiSeq2000 では、ペアエンドのシークエンス解析(約 300bpの断片を両側から 100bp読む)が可能で、シングルエンドのシーケンス解析に比べ、ペア情報は配列をコン

ティグに繋 ぐ 時に非常に有用になります。従って、 de novo genome sequencing, de novo transcriptome解析にはペアエンドのシークエンス解析が必須である。

8.

9.  ヒトゲノムは約 30億 bpなので、1ランでほぼ解読可能なレベルで、現在では、個人のゲノム解読も

可能なわけです。次世代シーケンサーは 1台が 1億円以上するため、研究室で購入することは非現実的で

すが、依頼解析が随分廉価となり、すでに農学研究でも汎用されています。農学が対象とする生物も、ほ

ぼ全ての種のゲノム解読が終わっています。今後は系統間の塩基配列の違いを調べ、遺伝形質と配列との

関係を解析することが重要になると思われます。

10.  ここで注意しなければならないことは、1サンプルあたり 100bpの配列断片が 2.5億個得られる

と言うことで、その解析はとうてい人の手に負えるはずはなく、コンピューター解析の技術が必須です。

ゲノムにしても cDNAの配列を読むにしても、最初に 100bpの配列断片から重なり合う部分を探して、

配列をコンティグにつなげる必要があります。配列解析のバイオインフォマティックスは現在非常に重

要になっており、まだ人材不足の状況です。とりあえずは、遺伝研のパイプライン等を使えば、普通に

必要な解析は誰にでもできますが。

11.  授業では、(1)次世代シーケンサーの塩基配列解読原理、(2)次世代シーケンス解析の利用方

46

Page 47:   · Web view今日は第一回目の授業ですので、最初に今年の授業予定を紹介します。この授業は、コンピューターを使った実習と講義で

法について講義します。

12.

13. ゲノム解読で明らかになったヒトゲノムの特徴、医療への利用についても簡単に紹介します

ポストゲノム研究-2

次世代シーケンスを使ったゲノムシークエンスにより、これまでの連鎖解析では同定困難であった疾患や形質

の原因遺伝子を見つけ出すことも可能となっています。この技術は、whole genome association study (WGAS)と呼ばれます。最近の報告例を使って、WGASについて紹介します。

また、ゲノムの多様性(多型性)をもたらす配列変化についても説明し、配列の多様性が動物の形質とリンク

している例を紹介します。

実習発現データベースを使ったシミュレーション実験(1)

- digital differential display -  ゲノム解読プロジェクトの進められている生物では、EST (expressed sequence tags) の塩基配列解読プロジェクトも並行して進められています。ESTプロジェクトでは、組織あるいは細胞種ごとに、cDNAライブラリーから無作為にクローンを選んで配列(5’, 3’末端のワンパスシークエンス)を解析しています。ESTデータベースでは、同定された遺伝子種とその数値(何個検出されたか)が組織あるいは細胞種ごとに整理されていま

す。従ってデータには、各組織に発現している遺伝子種と遺伝子ごとの相対的な発現強度が反映されていること

になります。これらのデータは、トランスクリプトーム (Transcriptome) と呼ばれます。このデータを利用する

ことにより、調べたい組織に発現している遺伝子の種類と発現強度、組織間で発現強度の異なる遺伝子を調べる

ことができます。コンピューターで遺伝子発現を調べる操作は、digital differential displayと呼ばれます。授

業では次の例題を使って、digital differential displayの操作を実習します。

例題1.生物の各器官で発現する遺伝子の種類と発現強度を調べる

ウシの乳腺で発現する遺伝子種とその強度は?

例題2.2つの細胞種で発現量が異なる遺伝子を調べる

マウスの ES 細胞 (Embryonic stem cells) と胚細胞 (Blastocytes) で発現量の異なる遺伝子は?

例題3.ある生物の2つの器官で発現量が異なる遺伝子を調べる

マウスの小脳 (Cerebellum) と大脳皮質 (Cortex) で発現量の異なる遺伝子は?

Digital differential display (DDD)のページの開け方

NCBIのTranscriptome情報を使う - Digital differential display

47

Page 48:   · Web view今日は第一回目の授業ですので、最初に今年の授業予定を紹介します。この授業は、コンピューターを使った実習と講義で

1. NCBIの先頭ページにある All Resourcesから、Digital differential display (DDD) を選択

例題1.生物の各器官で発現する遺伝子の種類と発現強度を調べる

ウシの乳腺(mammary gland)で発現する遺伝子種とその強度は?

手順

1. SpeciesをBos taurusに選択、continueをクリック2. 組織名(Mammary gland)の ID 番号をクリック。発現強度の強い遺伝子から順に表記される。TMP

は、100万個のmRNA当たりに出現する個数を示す。

例題2.ある生物の2つの器官・細胞で発現量が異なる遺伝子を調べる

マウスの ES 細胞 (Embryonic stem cells) と胚細胞 (Blastocytes) で発現量の異なる遺伝子は?

1.SpeciesをMus musculusに選択、continueをクリック2.まず A(ここでは Embryonic stem cells)の ID 番号(15703, 15704, 15705)を選択、上の枠内に名

前(ES cells)と記入し、continueを押す

3.B の組織(ここでは Blastocytes)の ID(850, 875, 1021, 10026)をチェックし、枠内に名 前

(Blastocytes)と記入し、continueを押す

4. AとB で発現強度が有意に異なる遺伝子が、表示される

1月17日(第14回:最終回)

講義次世代シーケンサーの応用について 2 例紹介します。

1. RANA-seq: Transcriptome解析(mRNAの発現プロファイルの解析、サンプル間比較)

2. Rad –seq: ゲノム全体をカバーする簡便な SNPマーカーの収集

2つの方法とも農学分野の研究に非常に有効です。

RANA-seq:組織に発現している遺伝子をほぼ全て網羅的に同定することができます。また各遺伝子の発現量

(組織にm RNAが何コピー発現しているか)も数値化されます。従って、組織の遺伝子発現プロファイルが明ら

かになるだけでなく、2つのサンプル(例えば、対照区と実験区)で発現している全遺伝子の発現量を比較する

ことができます。

Rad –seq:通常のゲノムシーケンスでは、精製したゲノム DNAを物理的に 300bp 程度に切断して、断片の両側

から 100bpをシーケンスします。物理的に切断するので断片は完全にランダムなゲノム断片となります。Rad –seq では、決まった 4塩基あるいは 6塩基の配列を認識して切断する制限酵素でゲノムを断片化し、断片の両側

から 100bpをシーケンスします。異なる系統でも、同じ部位でゲノムが切断されるので、断片の配列を 2系統で

直接比較(アライメント)することが可能となります。100bpの中に存在する SNPを同定でき、ゲノム全体に

わたって SNPをまんべんなく収集することが可能です。高密度な SNPマーカーが短時間で一挙に得られるため、

品種間の遺伝的差異や形質の連鎖解析に有効に利用できます。

48

Page 49:   · Web view今日は第一回目の授業ですので、最初に今年の授業予定を紹介します。この授業は、コンピューターを使った実習と講義で

実習今日は、これまでの実習の復習を行います。

leftyと言う名前の遺伝子を材料にして復習をしましょう:

leftyの機能の検索メンバーの同定

遺伝子の発現パターン

ヒトとゼブラで分子系統樹を作製

メンバーの進化的関係を推定しよう

49

Page 50:   · Web view今日は第一回目の授業ですので、最初に今年の授業予定を紹介します。この授業は、コンピューターを使った実習と講義で

ポストゲノム研究(1)

—ゲノムに存在する全ての遺伝子の機能を調べる

 全ゲノム塩基配列の解読のあとにくる最も重要な研究課題として、ゲノムに存在する全ての遺伝子の機能解

明があげられます。遺伝子の機能を解析するストラテジーは、大きく分けるとフォワードジェティクス

(Forward Genetics: 順遺伝学)とリバースジェネティクス(Reverse Genetics: 逆遺伝学)に分けること

ができます。マウス、ゼブラフィッシュ、ショウジョウバエ、線虫はこれらポストゲノム研究のモデル生物

として用いられています。

 リバースジェネティクスは、遺伝子の生体内での機能を解明するための最も直接的な方法で、遺伝子の機能

を破壊し、発生や器官形成、代謝、行動に表れる表現型を解析し、表現型から遺伝子の機能を解明します。遺

伝子の機能破壊の方法には、遺伝子ノックダウンあるいは遺伝子ノックアウトの2つがあります。上のモデ

ル生物ではいずれも、遺伝子破壊による全遺伝子の機能解明プロジェクトが進められています。線虫と魚類

は、アンチセンス技術を個体レベルで適応できる点で、遺伝子機能解析に圧倒的に有利です。特に線虫は、

RNAi 法で簡単に遺伝子機能を破壊できることから、ゴール(全遺伝子の機能解明)に最も近いと言えます。

線虫では機能破壊により寿命が延びると言うような興味深い遺伝子も見つかっています。

 遺伝子機能を解明するうえで、ノックアウトマウスは重要な役割を果たしていますが、 ES 細胞で相同組み

換えにより遺伝子破壊を行い、その ES 細胞を胚移植してノックアウト個体を作製するには、1 年あまり必要

です。最近、TALEN 法、CRISPR/Cas9 法とよばれる新しいノックアウトとノックイン技術が開発されてい

ます。卵生の魚類やカエルでは、受精卵にコンストラクとの RNAを顕微注入するだけで遺伝子のノックアウ

トが可能です。また TALEN 法は原理的には、遺伝子疾患の原因である変異遺伝子の配列を正常に治癒させる

ことも可能です。iPS技術と組み合わせると遺伝子治療への発展が期待できます。授業では簡単に TALEN 法

とCRISPR/Cas9 法の原理を解説します。

 

ポストゲノム研究(3)

—機能ゲノム学—

- ゲノムを比較して遺伝子の発現調節機構を探る -

 ポストゲノム研究の重要なテーマとして、全ての遺伝子の機能を調べることに加えて、遺伝子の転写調節に重

要な配列領域を見つけることがあります。転写調節領域は遺伝子が何時、何処で、どれだけ発現されるかと言う

情報をコードしていることから、生物の形態や環境適応の多様性の背景にあるゲノム情報は、タンパク質コード

領域よりもむしろ転写調節領域に存在する場合が多いものと予想できます。

 特に胚発生など生物の基本的な生命現象に関係する遺伝子(例えば sonic hedghog や Pax遺伝子)の転写調節

領域は、生物間で強く保存される傾向にあります。ゲノム情報を利用することにより、遺伝子発現に必須の領域

を検索したり、生物間で変異が起こっている領域を見つけだし、それらの機能や生物学的意味を解析する研究分

野は、機能ゲノム学と呼ばれます。授業では、ヒトとフグの非コード領域の比較から、遺伝子の転写調節に重要

な領域(CNE; conserved non-coding elements)を見つけだした研究事例を紹介します。

50

Page 51:   · Web view今日は第一回目の授業ですので、最初に今年の授業予定を紹介します。この授業は、コンピューターを使った実習と講義で

51

Page 52:   · Web view今日は第一回目の授業ですので、最初に今年の授業予定を紹介します。この授業は、コンピューターを使った実習と講義で

以下工事中

以下、今年使用しなかった過去の資料

講義

 脊椎動物の中ではゼブラフィッシュが、モルフォリノオリゴを使ったアンチセンス技術で遺伝子機能を破

壊できる点で、遺伝子機能の解析が容易だと言えます。具体的には、顕微注入によりアンチセンスモルフォ

リノオリゴを受精卵に注入し、発生で現れる表現型(体に表れる異常)を調べることで、遺伝子機能を解析す

ることが可能です。ただしこの方法で解析できるのは、受精後 2日以内に働く遺伝子に限られ、成人病に関連

するような遺伝子等の機能は解析不能です。ゼブラフィッシュのウェブサイト(ZFIN)では、誰にでも機能

破壊実験を行うことができるように、各遺伝子の機能破壊に必要なモルフォリノオリゴの塩基配列が掲載さ

れています。

 一方、フォワードジェティクスでは、点変異を誘導する化学変異源(ENU. Ethyl nitrosourea)により突然変異体のライブラリーをまず作製します。様々な表現型の突然変異体が得られますが、この時点では突然変

異体でどの遺伝子に変異が起こっているのか(原因遺伝子、責任遺伝子)は明らかでありません。フォワード

ジェティクスでは、遺伝マーカー(主にマイクロサテライト)との連鎖解析により、原因遺伝子を連鎖地図

にマップし、組換え率が 0.1%程度のマーカーが見つかるまで連鎖解析を進めます。見つかった近隣マーカー

近くの変異体ゲ

ノムを解読し、突然変異により塩基置換が起こっている場所を探し出します。この方法は、ポジショナルク

ローニングと呼ばれます。

データベースを使った遺伝子機能の検索

ENTREZ

NCBIの全データベース(配列、文献、遺伝子発現、SNP等々)に納められている情報から、キーワード検

索により関連情報を網羅的に検索できるサイト

ENTREZの利用NCBI (http://www.ncbi.nlm.nih.gov/)には、キーワードで全てのデータベースを一挙に検索するツール

ENTREZがあります。ENTREZ でキーワード検索すると、配列情報、文献情報、OMIM、OMIA、立体構造等々の

データがもれなく検索されてきます。ENTREZを利用すれば、タンパク質の構造や遺伝病等に関する情報を一挙

に入手することができ、非常に便利な検索システムといえます。

ENTREZの使い方

・ 開け方:NCBIの先頭ページ All databeses で、枠内空欄のまま Searchをクリック・ 枠内に遺伝子名(略字等)を入力して検索

・ 調べた遺伝子について NCBIのデータベースにある情報が全て表示される(数字はデータベースに納められて

いる情報の数を示す)

52

Page 53:   · Web view今日は第一回目の授業ですので、最初に今年の授業予定を紹介します。この授業は、コンピューターを使った実習と講義で

53

Page 54:   · Web view今日は第一回目の授業ですので、最初に今年の授業予定を紹介します。この授業は、コンピューターを使った実習と講義で

講義

推薦図書

ゲノム関連

「ゲノム」岡崎康司/坊農秀雅監訳・メディカル・サイエンス・インターナショナル社(9,500円)「ゲノム研究実験ハンドブック」辻本豪三、田中利男・羊土社(6,500円)「大規模ゲノム解析とポストシークエンス時代の遺伝子機能解析」林崎良英監修・中山書店(3,600円)「比較ゲノムから読み解く生命システム」藤山秋佐夫監修・秀潤社(4,000円)

バイオインフォマティックス関連

「バイオインフォマティックス基礎講義-一歩進んだ発想をみがくために」岡崎康司/坊農秀雅 監訳・メディ

カル・サイエンス・インターナショナル社(3,900円)「バイオインフォマティックスがわかる」菅原秀明・羊土社(4,200円)「ゲノム情報はこう活かせ」岡崎康司/坊農秀雅・羊土社(4,410円)「即活用のためのバイオインフォマティックス入門」広川貴次/美宅成樹著・中山書店(3,500円)「バイオデータベースとウェブツールの手とり足とり活用法」中村保一ら編集・羊土社(3,800円)「できるバイオインフォマティックス」広川貴次/美宅成樹著・中山書店(3,500円)

  「バイオインフォマティックス」メディカル・サイエンス・インターナショナル社(9,500円)  「バイオリソース&データベース活用術」秀潤社(4,600円)  「バイオインフォマティクス事典」日本バイオインフォマティクス学会編集・共立出版(14,000円)

ウェブサイト

研究室home page      http://www.agri.tohoku.ac.jp/bioinfor/index-j.html=========================================================================

文献検索、塩基配列、ホモロジー検索、ORF finder、Map viewer等NCBI http://www.ncbi.nlm.nih.gov/(National Center for Biotechnology Information)

塩基配列、ホモロジー検索、分子系統樹作成、シークエンス登録等

DDBJ http://www.ddbj.nig.ac.jp/Welcome-j.html(DNA Data Bank of Japan)

塩基配列、ホモロジー検索、タンパク質の構造(ドメイン・モチーフ検索等)解析

EBI http://www.ebi.ac.uk/Information/ (European Bioinformatics Institute)

ゲノム配列のデータベース

54

Page 55:   · Web view今日は第一回目の授業ですので、最初に今年の授業予定を紹介します。この授業は、コンピューターを使った実習と講義で

Ensembl           http://www.ensembl.org/index.html=======================================================================

分子系統樹作成

ClustalW http://clustalw.genome.jp/=======================================================================

タンパク質・遺伝子の機能検索

オントロジー http://www.geneontology.org/ http://www.pir.uniprot.org/ドメイン・モチーフ検索 http://www.ebi.ac.uk/Information/シグナルペプチドの予測 http://www.cbs.dtu.dk/services/SignalP/3D立体構造の予測、DNAの翻訳 http://ca.expasy.org/ノックアウトマウスの表現型 http://www.informatics.jax.org/=======================================================================

転写調節領域のモチーフ検索

転写因子の結合部位予測        http://www.cbrc.jp/research/db/TFSEARCHJ.html======================================================================

代謝経路

KEGG http://www.genome.jp/kegg/pathway.html=======================================================================

ゲノム研究のモデル生物

マウス http://www.informatics.jax.org/ツメガエル http://genome.jgi-psf.org/cgi-bin/runAlignment?db=frog4x1ミドリフグフグゲノムデータベース http://www.genoscope.cns.fr/externe/tetranew/トラフグフグゲノムデータベース http://fugu.biology.qmul.ac.uk/トラフグフグゲノムデータベース

http://genome.jgi-psf.org/cgi-bin/runAlignment?db=fugu6&advanced=1ゼブラフィッシュ http://zfin.org/

http://www.ensembl.org/Danio_rerio/index.htmlメダカ http://shigen.lab.nig.ac.jp/medaka/

http://medakagb.lab.nig.ac.jp/Oryzias_latipes/index.htmlショウジョウバエ http://www.ncbi.nlm.nih.gov/BLAST/Genome/Insects.html http://genome.med.yale.edu/lab/index.htm線虫 http://omicspace.riken.jp/Ce/rnai/jsp/index.jsp

55

Page 56:   · Web view今日は第一回目の授業ですので、最初に今年の授業予定を紹介します。この授業は、コンピューターを使った実習と講義で

酵母 http://www.ncbi.nlm.nih.gov/mapview/map_search.cgi?taxid=4932 http://www.fhcrc.org/science/labs/kruglyak/Data/

=======================================================================

cDNA, EST情報マウス cDNA http://fantom3.gsc.riken.jp/index.htmlアフリカツメガエル EST http://xenopus.nibb.ac.jp/メダカ EST http://medaka.lab.nig.ac.jp/est_index.htmlカタユウレイボヤ EST http://ghost.zool.kyoto-u.ac.jp/indexr1.html

=========================================================================

microarrayに関する情報ヒト繊維芽細胞 http://genome-www.stanford.edu/serum/data.htmlショウジョウバエ http://genome.med.yale.edu/Lifecycle/

=========================================================================

その他

http://genes.mit.edu/GENSCAN.htmlhttp://www.tigr.org/software/microarray.shtmlhttp://motif.genome.jp/http://www.rcsb.org/pdb/

=============================================================

56