bonohu's presentation in Osaka.R#6

19
© ライフサイエンス統合データベースセンター/大学共同利用機関法人 情報・システム研究機構 Rによる 大規模ゲノムデータ解析 の企て 大学共同利用機関法人 情報・システム研究機構(ROIS) ライフサイエンス統合データベースセンター(DBCLS) 坊農 秀雅 @bonohu

description

「Rによる大規模ゲノムデータ解析の企て」とはタイトルが付いているものの、DBCLS(ライフサイエンス統合データベースセンター)とそこにおける統合牧場の活動紹介がメインにorz

Transcript of bonohu's presentation in Osaka.R#6

Page 1: bonohu's presentation in Osaka.R#6

© ライフサイエンス統合データベースセンター/大学共同利用機関法人 情報・システム研究機構

Rによる大規模ゲノムデータ解析

の企て大学共同利用機関法人 情報・システム研究機構(ROIS)ライフサイエンス統合データベースセンター(DBCLS)

坊農 秀雅@bonohu

Page 2: bonohu's presentation in Osaka.R#6

DBCLS: Database Center for Life Science•ライフサイエンス統合データベースセンター ‒ライフサイエンス分野のデータベース統合化の拠点‒Since 2007‒@東京大学本郷キャンパス内•が、東大の機関ではありません

2

http://dbcls.rois.ac.jp/

Page 3: bonohu's presentation in Osaka.R#6

DBCLS構成員(2011/05現在)•センター長: 1人•教授(兼任): 1人•研究員(PhD): 11人•技術専門員: 5人•事務: 3人•外来研究員: 3人•SE: 2人

•常勤合計: 26人

•RA(アルバイト): 24人•客員: 2人

→ 総計: 52人

3

Page 4: bonohu's presentation in Osaka.R#6

DBCLSの三本柱•戦略立案•研究開発•広報宣伝普及活動

4(2011年3月まで)

Page 5: bonohu's presentation in Osaka.R#6

DBCLSの三本柱•戦略立案•研究開発•広報宣伝普及活動

5(2011年4月から)

Page 6: bonohu's presentation in Osaka.R#6

バイオサイエンスデータベースセンター(NBDC)

•National Bioscience Database Center‒http://biosciencedbc.jp/ •独立行政法人 科学技術振興機構(JST)の傘下

6http://biosciencedbc.jp/nbdc.cgi?lng=ja&gg=org_membersより引用

Page 7: bonohu's presentation in Osaka.R#6

NBDC体制図

7http://biosciencedbc.jp/nbdc.cgi?lng=ja&gg=about_usより引用

Page 8: bonohu's presentation in Osaka.R#6

8

http://biosciencedbc.jp/

Page 9: bonohu's presentation in Osaka.R#6

研究開発項目1.データベースのRDF による統合化2.解析プラットフォームによる統合利用環境の整備3.インターネットを活用した高度検索技術の開発4.RDF化に資するオントロジー、辞書、コーパスの整備、標準化5.大規模データの利用技術開発6.情報統合化・知識発見のためのキュレーション支援7.統合データベースに関わるコンテンツの作成、整備

9

Page 10: bonohu's presentation in Osaka.R#6

統合牧場 #togofarm•統合TV制作部•美術制作部•技術開発部‒主に自然言語処理技術(日本語,英語)

10

Page 11: bonohu's presentation in Osaka.R#6

統合TV司令部(trac)

11

Page 12: bonohu's presentation in Osaka.R#6

RA・アルバイトさんの内訳

•アルバイト‒B3: 11人, B4: 3人‒他: 1人•Research Assistant‒M1: 2人, M2: 4人‒D1: 1人, D2: 2人

•所属大学別‒東大生物情報8, 東大生化3‒東工大生命理工3‒東大院5(新領域情報生命3)‒お茶の水女子大院2‒中央大院1‒東京農工大院1

12

合計 24人 (2011年7月1日現在)

Page 13: bonohu's presentation in Osaka.R#6

5. 大規模データの利用技術開発•メタ情報による大規模データの整理・再利用促進技術開発‒ダイジェスト版の構築・開発・維持‒RNA配列を中心としたDB利用技術開発•遺伝子発現リファレンスデータセット整備‒RefExの構築維持管理‒SRAからのデータ抽出技術開発

•医療用画像データの利用技術開発13

Page 14: bonohu's presentation in Osaka.R#6

遺伝子発現バンク(GEO)目次•http://lifesciencedb.jp/geo/

14

Page 15: bonohu's presentation in Osaka.R#6

新たなデータ評価尺度: quality•ヒント:樋口千洋著「Rによるバイオインフォマティクスデータ解析」 第2版 p208‒8.4.2プローブレベルの発現解析-品質管理

•すべて先に計算しておいて(並列化)、 データ取捨選択の尺度として使えないか?

15

> library(affydata)> data(Dilution)> hist(Dilution)> boxplot(Dilution)> plotAffyRNAdeg(AffyRNAdeg(Dilution))

Page 17: bonohu's presentation in Osaka.R#6

17

Page 18: bonohu's presentation in Osaka.R#6

Message to home•使われないモノを作成してもしょうがない‒独りよがりではいけない‒必要とされている利用技術の開発を!‒対象に興味を持ち続けること

•フィードバックが必要不可欠‒twitter‒*.R‒学会発表

18

© 2011 DBCLS Licensed under CC 表示 2.1 日本

Page 19: bonohu's presentation in Osaka.R#6

★テキストの在処✴http://bit.ly/bono110702★質問、意見等✴[email protected] ★twitterで情報共有!

✴http://twitter.com/bonohu19