Research and Development Center for Data Assimilation
データ同化の問題は非線型状態空間モデルとして定式化できますが、その特徴はシステムや観測の次元が数千から数万以上と巨大であることです。そのため、モデルの近似や計算アルゴリズムの工夫が計算の遂行のために必須となります。また、観測の不足による状態推定の不備も厄介な問題です。エルニーニョ現象のモデル(大気海洋結合モデル)へのデータ同化の適用を通して、少ないサンプル数でも巨大な観測の次元に対処する方法、よいデータ同化モデルの選択法を提案しました。
物理的現象としてツェナーダイオードのアバランシェ降伏現象に注目し、この現象を利用した乱数発生について研究しています。乱数ボードAは平成22年1月にスパコンシステムの一部として導入したボードですが、一枚当たりの乱数発生速度は400MB/秒を超えており、その時点での世界最高速でした。乱数ボードCを同年7月に導入しましたが、640MB/秒の発生速度を有し、記録を更新しました。高速化や高品質化を実現するために発生回路や一様化手法の見直しの研究を行っています。
ベイズ統計を利用したデータ解析は、非常に長い計算時間を必要とすることがある上、プログラム開発にも大きな手間がかかります。当センターでは、ベイズ フィルタを利用した時系列解析のためのソフトウェアを、インターネットを通じて誰でも手軽に利用できるように、クラウドコンピューティングサービスとして 公開しています。10 年以上にわたって実績のあるカルマンフィルターベースのWebDecompや、分散型並列計算機上で動作する粒子フィルタベースのCloCKTiMEは、 国内外の多くのユーザに利用されています。
計算機の処理能力の向上とともに大規模かつ複雑精緻なデータ同化モデルを使ったシミュレーションが可能になりました。しかし、学会発表や論文への解析結果発表は依然として2次元プロットが主流であり、シミュレーション結果から時間変化・空間変化を包括的に捉えることは難しいのが現状です。そこで、シミュレーションおよび実際に観測・計測された物理量データの3次元可視化ツールの開発を行い、シミュレーション結果の解析作業を一本化すると同時に、データ同化のインパクトを一般社会にもアピールします。
宇宙空間は希薄なプラズマ、つまり電荷を持つ粒子で構成される気体で満たされており、それが様々な現象を引き起こしています。しかし、宇宙空間は実際にその場に行って観測することが困難なため、我々が手にしている観測データは、宇宙空間で起こっている現象のほんの断片を捉えているに過ぎません。そこで、データ同化によって、観測で得られる限られた情報を物理法則を記述する数値シミュレーションモデルと組み合わせ、現象の全貌を明らかにすることを目指しています。
データ同化に基づくバイオモデリングとシミュレーション技術の開発を行っています。分子間相互作用データの情報を利用して計算機内で仮想分子相互作用系を大量に作り出し、データ同化技術を駆使することで高品質の予測モデルを自動構築します。網羅的多階層計測を基礎とする次世代の生命情報から複雑多様な生命システムの動作原理を理解するために、計測とモデリングを繋ぐ科学であるデータ同化が大きな役割を果たします。
計算機の発達は、データ同化のような計算集約型の研究を可能にしただけではなく、研究の過程、結果の発表、普及の方法などにも大きな影響を与えてきました。特にフリーの統計解析システムRの影響は大きく、応用研究だけではなく基礎研究にも広く利用されています。本研究所は統計科学のための専用機としては世界でも有数のスーパーコンピュータ群を所有しており、その上でRを効果的に利用することは重要な課題です。複数のシステムそれぞれに対するRの改良、および全体が連携して計算するシステムの構成などを研究しています。
京速コンピュータ「京」に代表されるスカラ型並列計算機や、画像演算処理装置を汎用の目的に利用することが可能なGPGPUでは、メモリや演算装置が階層化された構成になっているという特徴があります。階層化に伴うメモリアクセスのレイテンシや通信負荷などのボトルネックの影響は、数千並列以上では特に大きくなり、素朴な並列化が機能しなくなります。そこで、はじめから階層アーキテクチャを考慮したアルゴリズムを新たに設計し、高速な統計計算環境を開発することを目指します。
English page