[DDBJing29]BioProject と BioSample の紹介(第29回 DDBJing 講習会 in 三島)

Post on 30-Jul-2015

589 views 2 download

Transcript of [DDBJing29]BioProject と BioSample の紹介(第29回 DDBJing 講習会 in 三島)

2014年6月12日

BioProject と BioSample の紹介

児玉 悠一 Kodama Yuichi, Ph.D

DDBJ センター、アノテータ DDBJ center, annotator

第29回 DDBJing 講習会 (DDBJ)

2014年6月12日

背景

第29回 DDBJing 講習会 (DDBJ)

2014年6月12日

増え続ける一次データベース

第29回 DDBJing 講習会 (DDBJ)

http://trace.ddbj.nig.ac.jp/index.html

2014年6月12日

二つの塩基配列データベース

第29回 DDBJing 講習会 (DDBJ)

DDBJ/EMBL-Bank/GenBank

Sequence Read Archive シークエンシング

Quality value

アライメント

アセンブリ

アノテーション

2014年6月12日

データベースを横断してまとめる

第29回 DDBJing 講習会 (DDBJ)

DDBJ

DRA シークエンシング

Quality value

アライメント

アセンブリ

アノテーション

BioProject BioSample

2014年6月12日

多様なデータを組織化

第29回 DDBJing 講習会 (DDBJ)

BioSample 1 BioSample 2

data

Umbrella BioProject

Genome BioProject

Transcriptome BioProject

Epigenome BioProject

data data data data data

「プロジェクト」と「サンプル」という切り口でデータを組織化

2014年6月12日

SRA データモデルの移行

第29回 DDBJing 講習会 (DDBJ)

SRA Study → BioProject、SRA Sample → BioSample へ移行 DDBJ SRA (DRA) は2014年5月12日に移行完了

2014年6月12日

INSDC: BioProject/BioSample/SRA

第29回 DDBJing 講習会 (DDBJ)

BioProject の形式は DDBJ/NCBI/EBI でほぼ同じ BioSample の形式は DDBJ と NCBI は同じ、EBI は異なる

http://www.insdc.org/

INSDC: International Nucleotide Sequence Database Collaboration

2014年6月12日

BioProject

第29回 DDBJing 講習会 (DDBJ)

2014年6月12日

プロジェクト番号でデータを関連付ける

第29回 DDBJing 講習会 (DDBJ)

同じプロジェクト番号を引用しデータを関連付ける

DDBJ

DRA

シークエンシングと サンプリング

アノテーション

BioProject

2014年6月12日 第29回 DDBJing 講習会 (DDBJ)

http://www.ncbi.nlm.nih.gov/bioproject/PRJDA38027

ゲノム配列 SRA データ

Pubmed 論文情報

プロジェクト概要

プロジェクトに由来するデータを一覧

NCBI BioProject:

2014年6月12日

プロジェクトの登録が必要な場合

第29回 DDBJing 講習会 (DDBJ)

DRA 登録では BioProject と BioSample の登録が必須

微生物や真核生物のゲノム配列を登録する場合

http://trace.ddbj.nig.ac.jp/bioproject/submission.html#プロジェクトの登録が必要な場合

2014年6月12日

アンブレラプロジェクトの活用

第29回 DDBJing 講習会 (DDBJ)

アンブレラプロジェクト (非公開にできない) でプロジェクトをまとめる 大規模プロジェクトからの成果を整理して提示することができる 初期段階でアンブレラを取得し、関係者に周知することを推奨

DDBJ 側では申告されないとアンブレラとの関係が分からない

http://trace.ddbj.nig.ac.jp/bioproject/submission.html#アンブレラプロジェクトの活用

アンブレラ

プライマリー

2014年6月12日

大規模プロジェクトを一覧

第29回 DDBJing 講習会 (DDBJ)

SRA データ サンプル

サブプロジェクト

http://www.ncbi.nlm.nih.gov/bioproject/?term=PRJNA59771 NCBI BioProject:

1000 Genomes プロジェクト

2014年6月12日

プロジェクトの登録

第29回 DDBJing 講習会 (DDBJ)

プロジェクト (目的・研究費・生物・データの種類など) をアカウントから登録 プレフィックス PRJD の BioProject ID を発行

ポップアップでの説明

2014年6月12日

BioSample

第29回 DDBJing 講習会 (DDBJ)

2014年6月12日

BioSample でサンプル情報を集中管理

第29回 DDBJing 講習会 (DDBJ)

データベースに散在していたサンプル情報を集中管理 サンプル記述を標準化 2014年2月に DDBJ は BioSample を開始

http://trace.ddbj.nig.ac.jp/biosample/index.html

2014年6月12日

属性 (attributes) でサンプルを記述

第29回 DDBJing 講習会 (DDBJ)

「属性名:値」のペアでサンプルを記述 (例: tissue:liver)

http://www.ncbi.nlm.nih.gov/biosample/1990977

チェックリスト

サンプル属性

関連データ

タイトル

NCBI BioSample:

2014年6月12日

サンプル記述の標準化

第29回 DDBJing 講習会 (DDBJ)

ゲノム・メタゲノム・マーカー遺伝子に対する MIxS チェックリストを採用 Yilmaz P et al. Nat Biotechnol (2011) 29:415-20

Minimum information about any (x) sequence (MIxS)

2014年6月12日

サンプル記述の標準化

第29回 DDBJing 講習会 (DDBJ)

サンプルの種類に応じたチェックリスト チェックリストは最低限必要な属性を定めている

http://trace.ddbj.nig.ac.jp/biosample/attribute.html サンプル属性一覧:

ゲノム・メタゲノム・マーカー遺伝子に対する MIxS チェックリスト

さらに Environmental package を選択

2014年6月12日

サンプルの登録

第29回 DDBJing 講習会 (DDBJ)

Sample type を選択し、タブ区切りのサンプル属性ファイルをダウンロード 表計算ソフトなどで1行に1サンプルの情報を入力し、アップロード プレフィックス SAMD の BioSample ID を発行

2014年6月12日

BioProject と BioSample の利用

第29回 DDBJing 講習会 (DDBJ)

2014年6月12日

BioProject/BioSample ID の引用

第29回 DDBJing 講習会 (DDBJ)

DRA 登録を構成する BioProject と BioSample ID を選択

塩基配列登録の DBLINK に関連する BioProject/BioSample ID を記入

2014年6月12日

微生物ゲノム配列の登録

第29回 DDBJing 講習会 (DDBJ)

Strain-level taxonomy ID にかわり BioSample 微生物ゲノムを識別

BioProject BioSample Strain: 1 Locus tag prefix: AAAA1

BioSample Strain: 2 Locus tag prefix: AAAA2

BioSample Strain: 3 Locus tag prefix: AAAA3

BioProject Strain: 1 Locus tag prefix: AAAA1 Strain-level taxonomy ID: 10

BioProject Strain: 2 Locus tag prefix: AAAA2 Strain-level taxonomy ID: 11

BioProject Strain: 3 Locus tag prefix: AAAA3 Strain-level taxonomy ID: 12

Species-level taxonomy ID: 100

Federhen S et al. Stand Genomic Sci (2014) doi: 10.4056/sigs.4851102

2014年2月以前

2014年2月以降

Genome

Genome

Genome

Bacteria: A Strain: 1

Bacteria: A Strain: 2

Bacteria: A Strain: 3

Genome

Genome

Genome

Bacteria: A Strain: 1

Bacteria: A Strain: 2

Bacteria: A Strain: 3

2014年6月12日

拡大する一次データベースの役割

第29回 DDBJing 講習会 (DDBJ)

http://trace.ddbj.nig.ac.jp/index.html

ご登録は計画的に!

2014年6月12日

お問い合わせ先

第29回 DDBJing 講習会 (DDBJ)

http://trace.ddbj.nig.ac.jp/contact.html

登録について問い合わせる場合には ID をお知らせください