H28 院試研究紹介資料-喜連川研 r1 · 教員名 喜連川優教授 研究場所 生研...

1
教員名 喜連川優教授 研究場所 生研 研究分野 データ工学 Fig.3 地球環境20ペタバイト超ストレージ Fig.2 ディスプレイウォール上の大規模時空間可視化システム Fig.1 超高性能データベースエンジン実験システム 超大規模データを利活用する最先端技術群:新原理による超高性能データベースエンジン,サイバー空 間・実世界データ融合活用基盤,地球環境情報融合システム,クラウドサービス連携技術 的に有用な情報に変換できるシステム の実現を目指している.(Fig.3). 東京大学地球観測データ統融合連携研究 http://www.editoria.u-tokyo.ac.jp/クラウド時代の大規模計算技術の構築: 大規模な計算機群から,必要な計算資 源を必要に応じて即座に利用することが できる「クラウドコンピューティング」を利 用し,負荷変動や障害に頑健なアプリケ ーションを構築するための研究を進めて いる.特に,大規模探索などこれまでは適 用が難しかった問題においても,オンデ マンドな分散計算が容易に行えるような 基盤技術の確立を目指している. ■ 研究環境 計算機環境はとても充実しており,ハ イエンドサーバ・大規模クラスタによる演 算処理能力や,巨大ディスプレイ,ペタバ イトのアーカイブ装置などを利用した先 進的な研究が可能である.研究室の構成 は教授,特任准教授に加え,ポスドクなど 学位保持者が多く,やる気のある学生へ の支援を惜しまない.海外での発表機会 も多数ある. ■ 研究の概要 インターネット時代の主役はネットワ ーク上のコンテンツにある.ウェブには約 1兆以上ものページが存在し,更に驚異 的な速度で増加し続けており,情報の宝 庫である一方で,効率的な管理・解析の 技術に対する要求はますます高まってい る.また,高度なセンサ技術の進展によ り,膨大な数のセンサが「しゃべる」時代 にはいり,従来とは比べものにならない 細密な観測が可能となってきいる.すな わち,超可観測の世界が構築されると想 定され,これら膨大なデータを格納する 高性能なデータベースエンジンと多様 な分析ソフトウェアから構成されるシス テムが不可欠となる.本研究室では,デ ータベース技術を基盤とし,最先端デー タベース,超大規模ウェブマイニング,地 球環境デジタルライブラリを始めとする データ工学の課題に対し,システムソフ トウェア,先進アプリケーション,ハードウ ェア,アルゴリズムに亘る,あらゆる観点 から研究を進めている. ■主な研究テーマ 超巨大データベース時代に向けた最先端 データベースエンジンの開発とサイバー フィジカルシステム(CPS)の研究: 実行順序を実行時に動的に決定する 「非順序型データベース実行原理」に基 づくマルチコアプロセッサ並びに大規模 ディスクアレイを想定した超高性能デー タベースエンジンを開発する (Fig.1) .同 時に当該データベースエンジンを核とし, 巨大データ活用により可能となる次世代 戦略的社会サービス(サイバーフィジカル サービス)の実証システムを構築し,当該 エンジンの有効性を明らかにする. 超大規模ウェブアーカイブ: 喜連川研では約14年以上にわたり継 続的に日本語ウェブページを大規模収 集し,およそ300億URL,20億ブログ記 事,Twitterの200億つぶやき等を含む ウェブアーカイブを構築しており,その構 造,内容,時間変化を解析するシステム を開発中である.これら膨大なウェブ情 報を,リンク解析,自然言語処理,画像処 理等を用いて解析し,様々な切り口で探 索可能な可視化システムを構築し大規 模ディスプレイウォール上に実装してい る(Fig.2).また,豊田研究室との連携の もと,話題の伝播,言語の変化,スパム活 動などといった多様な社会活動の分析 実現に取り組んできた.Web情報は,画 像・映像等への多メディア化が急速に進 むと同時に,放送映像等の実世界情報と 相互に及ぼし合う影響も拡大し続けてお り,多様な解析を可能とする多メディア Web情報解析基盤の構築と社会分析ソ フトウェアの研究も進めている.さらに, 交通情報等の実世界データとウェブデー タ等の異種データを融合した実社会分 析システムの研究開発を進めていいる (文科省・実社会ビッグデータ利活用のため のデータ統合・解析技術の研究開発) 20ペタバイト超地球環境情報融合シス テム: 地球観測データを利用して,地球環境 の理解を深め,予測能力を高め,危機管 理や資源管理等における健全な政策決 定に資する情報を提供することが国際 的に求められている.このようなニーズ に応えるため,地球環境研究者と共同 で,20ペタバイト超ストレージ層からア プリケーション層まで構成される地球観 測データ統合・情報融合システムの構築 を行っている.様々な地球観測データを 統合・解析することにより,科学的・社会

Transcript of H28 院試研究紹介資料-喜連川研 r1 · 教員名 喜連川優教授 研究場所 生研...

Page 1: H28 院試研究紹介資料-喜連川研 r1 · 教員名 喜連川優教授 研究場所 生研 研究分野 データ工学 Fig.3 地球環境20ペタバイト超ストレージ

教員名 喜連川優教授 研究場所 生研 研究分野 データ工学

Fig.3 地球環境20ペタバイト超ストレージ

Fig.2 ディスプレイウォール上の大規模時空間可視化システムFig.1 超高性能データベースエンジン実験システム

超大規模データを利活用する最先端技術群:新原理による超高性能データベースエンジン,サイバー空間・実世界データ融合活用基盤,地球環境情報融合システム,クラウドサービス連携技術

的に有用な情報に変換できるシステムの実現を目指している.(Fig.3).

東京大学地球観測データ統融合連携研究(http://www.editoria.u-tokyo.ac.jp/)

クラウド時代の大規模計算技術の構築: 大規模な計算機群から,必要な計算資源を必要に応じて即座に利用することができる「クラウドコンピューティング」を利用し,負荷変動や障害に頑健なアプリケーションを構築するための研究を進めている.特に,大規模探索などこれまでは適用が難しかった問題においても,オンデマンドな分散計算が容易に行えるような基盤技術の確立を目指している.

■ 研究環境 計算機環境はとても充実しており,ハイエンドサーバ・大規模クラスタによる演算処理能力や,巨大ディスプレイ,ペタバイトのアーカイブ装置などを利用した先進的な研究が可能である.研究室の構成は教授,特任准教授に加え,ポスドクなど学位保持者が多く,やる気のある学生への支援を惜しまない.海外での発表機会も多数ある.

■ 研究の概要 インターネット時代の主役はネットワーク上のコンテンツにある.ウェブには約1兆以上ものページが存在し,更に驚異的な速度で増加し続けており,情報の宝庫である一方で,効率的な管理・解析の技術に対する要求はますます高まっている.また,高度なセンサ技術の進展により,膨大な数のセンサが「しゃべる」時代にはいり,従来とは比べものにならない細密な観測が可能となってきいる.すなわち,超可観測の世界が構築されると想定され,これら膨大なデータを格納する高性能なデータベースエンジンと多様な分析ソフトウェアから構成されるシステムが不可欠となる.本研究室では,データベース技術を基盤とし,最先端データベース,超大規模ウェブマイニング,地球環境デジタルライブラリを始めとするデータ工学の課題に対し,システムソフトウェア,先進アプリケーション,ハードウェア,アルゴリズムに亘る,あらゆる観点から研究を進めている.

■主な研究テーマ

超巨大データベース時代に向けた最先端データベースエンジンの開発とサイバーフィジカルシステム(CPS)の研究: 実行順序を実行時に動的に決定する「非順序型データベース実行原理」に基づくマルチコアプロセッサ並びに大規模ディスクアレイを想定した超高性能データベースエンジンを開発する(Fig.1).同時に当該データベースエンジンを核とし,巨大データ活用により可能となる次世代戦略的社会サービス(サイバーフィジカルサービス)の実証システムを構築し,当該エンジンの有効性を明らかにする.

超大規模ウェブアーカイブ: 喜連川研では約14年以上にわたり継続的に日本語ウェブページを大規模収集し,およそ300億URL,20億ブログ記事,Twitterの200億つぶやき等を含むウェブアーカイブを構築しており,その構造,内容,時間変化を解析するシステムを開発中である.これら膨大なウェブ情報を,リンク解析,自然言語処理,画像処理等を用いて解析し,様々な切り口で探索可能な可視化システムを構築し大規模ディスプレイウォール上に実装している(Fig.2).また,豊田研究室との連携のもと,話題の伝播,言語の変化,スパム活動などといった多様な社会活動の分析実現に取り組んできた.Web情報は,画像・映像等への多メディア化が急速に進むと同時に,放送映像等の実世界情報と相互に及ぼし合う影響も拡大し続けており,多様な解析を可能とする多メディアWeb情報解析基盤の構築と社会分析ソフトウェアの研究も進めている.さらに,交通情報等の実世界データとウェブデータ等の異種データを融合した実社会分析システムの研究開発を進めていいる(文科省・実社会ビッグデータ利活用のためのデータ統合・解析技術の研究開発).

20ペタバイト超地球環境情報融合システム: 地球観測データを利用して,地球環境の理解を深め,予測能力を高め,危機管理や資源管理等における健全な政策決定に資する情報を提供することが国際的に求められている.このようなニーズに応えるため,地球環境研究者と共同で,20ペタバイト超ストレージ層からアプリケーション層まで構成される地球観測データ統合・情報融合システムの構築を行っている.様々な地球観測データを統合・解析することにより,科学的・社会