データ同化研究開発センター

Research and Development Center for Data Assimilation

  • フォントサイズを大きくする
  • デフォルトフォントサイズ
  • フォントサイズを小さく
Home 研究紹介 クラウドコンピューティングサービス

クラウドコンピューティングサービス

当センターでは、最近注目を浴びつつあるクラウドコンピューティングシステムを利用した統計計算システムの構築に関する研究開発を実施しています。

本システムを利用することにより、ユーザは

  1. 当センターが開発したベイズ統計計算プログラムを利用することにより、非常に手間のかかるプログラミングから解放される
  2. 当センターが所有するCPUとGPUを組み合わせたヘテロな計算機環境を利用することにより、ベイズ統計計算に必要な大規模計算機システムを自前で用意する必要が無くなる
  3. 小さな端末から利用可能であるため、節電にもつながる

といった効果を期待することができます。

 

具体的には、以下の3つのプロジェクトが進行中です。

 

A. クラウドコンピューティングによる統計計算サービス

ベイズ統計を利用したデータ解析は、非常に長い計算時間を必要とすることがある上、プログラム開発にも大きな手間がかかります。当センターでは、ベイズフィルタを利用した時系列解析のためのソフトウェアを、インターネットを通じて誰でも手軽に利用できるように、クラウドコンピューティングサービスとして公開しています。10 年以上にわたって実績のあるカルマンフィルターベースのWebDecompや、分散型並列計算機上で動作する粒子フィルタベースのCloCK-TiMEは、国内外の多くのユーザに利用されています。

CloCK-TiME

B. クラウド環境での第一原理量子モンテカルロ法による物質の電子状態計算

B-1. 第一原理電子状態計算

現在,電子レベルの物資設計の分野では,第一原理電子状態計算による物質設計研究が,日本のみならず世界中で大きな関心を集めています.第一原理計算とは,量子力学の基礎方程式をシミュレーションによって解き,電子レベルの現象を理論的に理解しようとするものです.その最も注目すべき特徴は,原理的には,異なる原子種を含む物質であっても,同じプログラムを用いて系統的に計算できるという汎用性を持つ点にあります.この汎用性から,第一原理計算には,実験に先立ち,電子物性を理論予測し,所望の機能を有する物質を探索・設計するという可能性が期待されますが,これまではコンピュータ性能の制約から,専ら「実験結果の理論的解釈の道具」として利用されてきました.ところが,近年のコンピュータ性能の飛躍的向上によって,10年前には最先端のスーパーコンピュータを使って数日かけて漸く結果が得られた物質であっても,現在では,PC上でほんの数時間で計算結果が得られてしまいます.現状では,従来の原子・分子,単純な金属・半導体に加えて,分子結晶,生体分子,遷移金属酸化物などの複雑な物質まで,多岐にわたって扱うことが可能です.このような背景から,現在,第一原理計算は「イン・シリコ物質設計ツール」として積極的に活用されるようになり,国内外の高等研究機関はもちろんのこと,電子デバイス,バイオ,製薬といった,もの作りの現場からも大きく注目されています.

第一原理計算は,量子力学の誕生以来,80年以上の長きにわたって,コンピュータ科学とともに発展してきました.当該分野は単にコンピュータの性能向上に依存しているだけではなく,逆に,広い意味での科学計算として最先端コンピュータに対して性能評価・検証の良いベンチマークを与えており,この意味で,両者は密接に関係しています.現在でも,次世代コンピュータ性能を見据えて,新しい理論的手法・計算手法の開発が絶えず行われています.焦眉の課題であるエネルギー・環境問題に取り組む上で,今後,物質設計が重要な役割を果たすことを考えれば,コンピュータ科学同様,今後益々発展して行く分野と言えます.特に,イン・シリコ物質設計ツールとして第一原理計算を活用するには,十分な理論予測精度を実現する必要があり,そのためには非常に大規模な計算機資源が必要となります.本研究では,コンピュータ科学の最先端のトピックであるクラウドコンピューティングによる大規模計算の実例として,第一原理計算を適用することを計画しています.

B-2. クラウドコンピューティングによる分子結晶の大規模QMC計算

本研究では,近年クリーンエネルギーの観点から広く注目されている分子結晶を対象として,第一原理量子モンテカルロ (QMC) 法による大規模並列計算を行っています.QMC法は,電子間相互作用に起因して複雑になった基礎方程式を,多電子系の量子理論と乱数を用いる統計的手法を組み合わせた新しい手法で,従来法と比較して,高精度で電子状態を算出できます.特に,本研究で研究対象とする分子結晶では,非常に弱く,かつ複雑な相互作用によって結晶が形成されているために,従来法では十分な理論予測精度を実現できず,代替高精度手法が必要となります.この点で,QMC法の高精度特性が役立つと期待されます.QMC法のアルゴリズムは本質的に並列計算に適していますが,従来法に比べて,高精度を実現している分だけ計算コストが必要となるので,QMC法を分子結晶に適用するには,十分な計算機資源の確保が課題となります.このような観点から,本研究では,分子結晶のQMC計算をクラウドコンピューティングシステム上で運用する事を計画しています.図1は,本研究で対象としてるpara-diiodobenzene (p-DIB) 分子結晶の結晶構造です.単純な金属や半導体の結晶では単位格子内に数個の原子が存在しますが,分子結晶では,12個の原子を含むDIB分子が単位格子内に4個存在し,大規模な計算が必要となります.

B-3. CPU/GPUへテロ環境におけるQMC計算

クラウドコンピューティングの利用に加えて,本研究では,QMC計算の計算速度を向上させるための一案として,CPU/GPUヘテロ環境を活用して,計算のホットスポットをGPUによって高速化することで,計算効率を向上させることを計画しています.最終的には,分子結晶のような大規模な物質系を対象としますが,ベンチマークとして行ったシリコン結晶の計算では,GPUの利用によって,10~14倍の高速化を実現することが分かりました.図2は,QMC計算で使用したシミュレーション粒子 (walker) 数に対して,CPUに対するGPUによるスピードアップを示しています.

B-4. QMC計算における乱数生成法の性能評価

本研究のQMC法を含め,統計的手法に基づくシミュレーションは全て,何らかの (擬似) 乱数生成法を利用しています.通常,ユーザーは,擬似乱数生成法について特に意識することは余りありませんが,アプリケーションによっては,使用する乱数列の品質にも注意を払う必要があります.これまでに,物理系のモンテカルロシミュレーションでは,適用した乱数生成法の拙さに起因して,系統誤差を含む結果が得られてしまうという事例がいくつか報告されています.そこで,本研究では,本研究所の乱数ポータルサイトで提供している物理乱数を利用して,各種擬似乱数生成法のQMC計算における性能評価を行うとともに,大規模並列QMC計算で使用するための並列化乱数生成法の開発を行っています.

SpeedUp_GPU DIB Molecule

C. 統計解析システム言語RをGPGPU上で利用するためのソフトウェア開発

統計解析システム言語Rは、充実したライブラリ群やプログラミングの簡便性から、基礎研究から応用研究まで幅広く利用されてきました。当センターでは、RをGPGPU上で動作させるためのインターフェースソフトウェア「ROpenCL」を開発しています。本ソフトウェアにより、Rにおける計算の一部を超高速GPUによる超高並列計算によって処理ができるようになることが期待されます。

実際の応用列として、ニューラルネットワークを用いた株価予測システムを構築しました。

NeuroIsing Model

図1: GPUバッファ上のN個のising行列

 

Home 研究紹介 クラウドコンピューティングサービス