Hadoop によるゲノム解読
-
Upload
mapr-technologies-japan -
Category
Data & Analytics
-
view
765 -
download
0
Transcript of Hadoop によるゲノム解読
®© 2015 MapR Technologies 2
なぜ Hadoop はゲノム研究に最適な基盤といわれるのか?
ゲノム解読マーケットは指数関数的な成長を遂
げており、臨床ゲノム研究の分野で働く人々に
とっては素晴らしい状況だ。しかし、成長は新た
な課題を突きつける。特に、解読された巨大なヒ
トゲノムデータをどうやって適切に管理するかと
いう観点において。
®© 2015 MapR Technologies 4
Hadoop 以前の DNA シーケンシングアーキテクチャ
Storage
write-only
read/write
High-Performance Compute ClusterCoordinator / Edge Node
Sequencer
®© 2015 MapR Technologies 5
Hadoop 後の DNA シーケンシングアーキテクチャ
Storage
write-only
read/write
High-Performance Compute ClusterCoordinator / Edge Node
DNA Sequencer Cluster (e.g. Illumina X-Ten)
HPC ボトルネック
シーケンサからの データ流入圧力
®© 2015 MapR Technologies 7
Hadoop の利点
• コスト効率の高い基盤上に構築されたストレージと計算資源
• 大規模なデータ処理を行う際に問題となる、既存の HPC (High Performance Computing) や NAS (Network Attached Storage) アーキテクチャに伴うボトルネックを克服
• DNA 解析の現実の業務運用における遅延を最小化
®© 2015 MapR Technologies 8
MapR の優位点 • 企業全体の信頼性向上
– 高度なマルチテナント運用 – 事業継続性 – 高可用性、災害復旧
• 性能 – 他の Hadoop ディストリビューションよりも2〜7倍高速 – 超高速データ投入 (毎秒1億データ項目) – NFS および リード/ライトファイルシステム
• リアルタイムおよびセルフサービスデータ探索 – 事前のスキーマ定義不要の On-the-fly SQL – 高速検索・クエリ
ゲノム解析に最適な Hadoop プラットフォーム
Security
Streaming NoSQL & Search
Provisioning &
coordination
ML, Graph
Workflow & Data Governance
Batch
SQL
商用エンジン との連携
ツール 処理エンジン
バッチ
インタラクティブ
リアルタイム
オンライン
その他
管理
運用
ガバナンス
監査
セキュリティ
MapR-FS MapR-DB
MapR Data Platform
®© 2015 MapR Technologies 9
ホワイトペーパーをご覧ください Next Generation Genome Sequencing Using MapR ホワイトペー
パーをダウンロードして、インターネットのスケールアウトアーキテクチャ
がどのように臨床ゲノム研究に適用できるかをお確かめください。
次のことを学ぶことができます:
• なぜ Hadoop がゲノム研究のワークフロー処理に理想的な基盤
なのか
• 規模と経済性を得るために、学術的なプロジェクトからより商業的
な基盤へと移行する利点
• なぜ MapR 特有の機能がゲノム研究におけるデータ処理と解析
の最適なソリューションとなるのか
今すぐダウンロード!