データ同化研究開発センター

Research and Development Center for Data Assimilation

Home 用語集

用語集

(A) (B) (C) (D) (E) (F) (G) (H) (I) (K) (L) (M) (N) (O) (P) (R) (S) (T) (V) (W) (Y)

A

analysis increment
【解析インクリメント】
データ同化により修正される状態の量のこと。

B

background covariance
【背景誤差共分散行列】
初期時刻における状態をモデリングしたときの共分散行列のこと。
background error estimate
【背景値】
初期時刻における状態をモデリングしたときの平均ベクトルのこと。第一推定値ともいう。
barotropic 
【順圧】
海水面から海底まで積分した平均的な運動。水平方向の分布のみをもつ。
biochemical reaction network
【生化学反応ネットワーク】
転写因子による標的遺伝子の発現制御やタンパク質間相互作用など、生体内分子間相互作用の有無を模式的に表す因果ダイアグラム。
(The) Boltzmann equation
【ボルツマン方程式】
流体粒子の速度分布関数の時間変化を記述する、統計力学の基礎となる方程式の一つ。
boundary condition 
【境界条件】
シミュレーションモデルにおいて,対象とする領域とそうでない領域との 境界に与える条件.

C

central dogma of molecular biology
【分子生物学のセントラル・ドグマ】
DNA のタンパク質コード領域に記されたATGC(アデニン、グアニン、チミン、シトシンの4 種類の有機塩基)から成る塩基配列の情報は、転写と呼ばれる過程を経て、一旦mRNA(messenger ribonucleic acid)に変換される。次の段階では、mRNA の塩基配列に則してアミノ酸が重合され、ポリペプチド鎖が合成される。ポリペプチド(タンパク質)の合成過程は翻訳と呼ばれる。
clock gene
【時計遺伝子】
細胞に内在する概日周期と呼ばれる約24 時間の生物リズムを制御している遺伝子。時計遺伝子から転写されるmRNA 濃度の周期的振動が生物の概日周期のリズムを生み出している。代表的な反応経路として、period 遺伝子やcryptochrome 遺伝子のネガティブフィードバックループやclock、bmal 遺伝子が関与するフィードフォーワードループが知られている。
component tide 
【分潮】
海洋潮汐の運動のうち特定の周期の成分を指す。半日周期の運動のうち、代表的なものはM2分潮である。
covariance inflation
【共分散膨張法】
システムノイズを明示的に与えずに、状態の分散共分散行列を定数倍することで、システムノイズと同様の役割を持たせる手法。少ないメンバー数でのアンサンブルカルマンフィルタで用いられる。
CSML
【Cell System Markup Language】
動的な生化学反応ネットワークモデルを記述することを目的としたXMLフォーマット(Extensible Markup Language)のひとつ。
CUDA
【Compute Unified Device Architecture】
NVIDIA社が提供するプログラミング言語および環境である。GPUで並列に稼働するスレッドの振る舞いを自然に記述できるように、C言語を拡張したものになっている。
curse of dimensionality
【次元の呪い】
探査空間の次元が高くなることで探査空間の体積が指数的に増大する等、問題の高次元さに伴う困難を表す言葉。

D

data assimilation 
【データ同化】
シミュレーションなどの数値モデルによる対象状態の時間発展更新と、装置からの部分的な観測量に基づく状態補正の二つを適切に組み合わせる作業。
data-parallel computations
【データ並列計算】
同一のプログラム(の複製)が同形式の多数のデータを並列に処理する、並列計算の形態をさす。特にメモリ操作に対して、算術処理が占める割合が高い場合をさす。GPGPUプログラミングにおいて、理想的なプログラムの形態である。
degeneracy
【退化】
粒子フィルタの文脈では、複数のモンテカルロ・サンプルが同じ値を取り、有効粒子数が低下することをさす。また、SIRの場合に多くの粒子で重みがほぼ0になる結果、有効粒子数が低下する場合もやはりこの術語を用いる。
dependent variables 
【従属変数】
時間的にも、空間的にも相互に関連している変数。正確に言えば、どちらかの場合もありえる。どちらにも関連していない変数どうしは、独立であるという。
DNA microarray 
【DNAマイクロアレイ】
細胞内の遺伝子発現量(mRNAの転写レベル)を測定するために開発された実験器具。スライドガラスやシリコン基板上に、DNAの部分配列(プローブ)を 高密度に配置、固定したもの。細胞から抽出したmRNAを逆転写によって変換したcDNAをアレイ上のプローブとハイブリダイゼーションすることで、数万 遺伝子の発現量を網羅的に測定することができる。Affymetrix社のGeneChip、米スタンフォード大学によって開発されたcDNAマイクロア レイが有名。
dynamic model 
【動的モデル】
システムが時間とともに変容するモデル。dyanamical model は力学モデルで、違う概念。

E

EGF(epidermal growth factor) 
【上皮細胞増殖因子】
細胞膜上にある特異的な受容体(EGFR: EGF receptor)に結合することで、その下流にあるタンパク質群のチロシンキナーゼ活性を促進し、DNA合成や細胞増殖を促進する。いくつかの癌におい てEGFRの変異が確認されており、抗がん剤の標的分子として注目されており、シグナル伝達経路の解明に期待が高まっている。 filtered estimate フィルター推定値時刻tにおける状態変数の推定値を、その時点まで(t も含む)の観測データを用いて得たもの。
El Nino phenomenon
【エルニーニョ現象】
太平洋赤道域の中部から東部にかけて、海面水温が平年より高くなる現象。エルニーニョとはスペイン語で「男の子」を意味する。日本では長い梅雨が続いて冷夏になる一方、冬は暖冬になりやすい。⇔ラニーニャ現象
energetic neutral atom (ENA)
【高速中性粒子】
磁気圏などに存在する高エネルギーの正の電荷を持ったイオンが、地球周辺に存在する希薄な低温大気の中性粒子と衝突して電荷交換反応を起こすことで生成さ れる、エネルギーの高い中性の粒子。イオンは運動が惑星磁場に拘束されるが、中性粒子に変化すると磁場に影響されずに直進できるので、それがどこからどの くらい飛んできたかを遠隔観測することで中性粒子の元となるイオンの分布についての情報を得ることができる。
ensemble Kalman filter 
【アンサンブルカルマンフィルター】
非線型のシステムモデル、非ガウスのシステムノイズを仮定した状態空間モデルに対して、カルマンフィルターと同様な逐次的な状態更新を行うアルゴリズム。 観測モデル・観測ノイズは線型・ガウスのままである。状態の確率分布を多数の実現値からなる集団(アンサンブル)が表す経験分布として表現する。アンサン ブルの標本共分散行列を用いて定義したカルマンゲインの近似量を用いて、個々の実現値(アンサンブルメンバー)の値を更新する。
ensemble Kalman smoother 
【アンサンブルカルマン平滑化】
アンサンブルカルマンフィルターを受け、非線型・非ガウスのシステムモデル、線型・ガウスの観測モデルからなる状態空間モデルに対して、固定ラグ平滑化と 同様な状態更新を行うアルゴリズム。アンサンブルカルマンフィルターの場合と同様に、平滑ゲインをアンサンブルの共分散行列で近似し、アンサンブルの値を 更新する。
ensemble spread
【アンサンブルスプレッド】
アンサンブルを構成する状態の実現値のうち、値が最大のものと最小を取り出し、その幅をいう。
environmental economics
【環境経済学】
経済学の一分野。環境問題を解決するためには経済的原因に着目しなくてはならず、近年急速に発展した分野である。環境に貨幣価値を与える環境経済学評価、環境税や二酸化炭素取引制度のような経済政策手段の研究などが挙げられる。

F

filtering
【フィルタリング】
現在までの観測から現在の状態を推定すること。

G

GCA
【Grand Challenge Applications】
挑戦的な大規模アプリケーション。一般に、新しい高性能並列計算機の開発プロジェクトの文脈で使用され、その計算機を用いてはじめて解決可能なアプリケーションの一群をさす。
GPGPU
【General Purpose Graphical Processing Unit】
汎用画像演算処理装置。GPUを微分方程式の汎用計算に転用するときに、この名で呼ばれる。近年では、汎用計算への需要が特にHPCの分野で高まったために、Teslaシリーズのような汎用計算に特化した製品が登場するに至った。
GPU
【Graphical Processing Unit】
画像演算処理装置。初期の段階では、幾何学図形(円、直線)の描画、ピクセルマップの転送、三次元グラフィックで利用されるポリゴンの奥行情報の保持など の限定された機能を提供していたが、2000年以降ゲーム等で要求される機能の高性能化に伴いしだいに演算能力が汎用化していった。
graph
【グラフ】
いくつかの頂点と辺の集合が示す構造で、頂点は変数、辺は変数同士の依存関係を表す。

H

harmonic constant 
【調和定数】
正弦関数で表される分潮の振幅と位相。
HPC
【High-performance Computing】
高性能計算。主に、スーパーコンピュータやクラスタコンピュータを用いて解決される科学技術計算をさす。
hybrid functional petri net
【ハイブリッド・ファンクショナル・ペトリネット】
システム生物学おいて比較的広範に利用されるモデリング言語。生化学反応系のネットワークモデルを、視覚的に表現するためのアーキテクチャ。ペトリネット (petri net)という離散事象システムを数学的に記述するためのアーキテクチャを、連続事象を含めて表現できるように一般化したもの。

I

IMAGE
【IMAGE衛星】
NASA(米国国立航空宇宙局)が打ち上げた磁気圏・電離圏の遠隔観測を主目的とした人工衛星。IMAGEは"Imager for Magnetopause-to-Aurora Global Exploration"の略とされている。2000年3月25日にVandenberg空軍基地からDelta IIロケットによって打ち上げられた。軌道傾斜角90度、遠地点高度45922km、近地点高度1000km、軌道周期14.2時間。電離圏、磁気圏のプ ラズマの分布を調べるための高速中性粒子撮像観測装置の他、オーロラ観測のための遠紫外撮像装置、プラズマ圏観測のための極端紫外撮像装置などが搭載され ていた。2005年12月に運用を停止。
in silico 
【イン・シリコ】
シミュレーションなど、計算機上で行う細胞や生体分子を取り扱う実験。in vivoやin vitroの対義語。
in vitro 
【イン・ビトロ】
試験管内など、人為的にコントロールされた環境で行う分子生物学や生化学の実験。
in vivo 
【イン・ビボ】
人為的にコントロールされていない環境で行う分子生物学や生化学の実験。一般的には、培養細胞などを取り扱う。
initial condition 
【初期条件】
シミュレーション開始時に与える条件.

K

Kalman filter 
【カルマンフィルター】
離散時刻の場合を考える。時刻 t-1 までの過去全ての観測データにもとづく状態ベクトルの確率分布と、新たに時刻tのデータを観測したもとでの状態ベクトルの確率分布の間の関係を司る漸化 式。線形ガウス状態空間モデルの場合はすべての分布がガウス分布になるので、漸化式は具体的には状態ベクトルの平均値ベクトルと、分散共分散行列の時間更 新の漸化式となる。カルマンが定式化したのでこの名前がついている。

L

La Nina phenomenon 
【ラニーニャ現象】
太平洋赤道域の中部から東部にかけて、海面水温が平年より低くなる現象。原語はスペイン語で「女の子」の意。エルニーニョとは全く逆の温度偏差パターンとなる。ラニーニャ現象が起こると、日本では空梅雨、猛暑、渇水、寒冬になるといわれている。⇔エルニーニョ現象
large-scale measurement system 
【大規模観測システム】
複数の人工衛星や、地上の多数の観測網(ネットワーク)などによる全地球の環境をモニターするシステム。あるいは、特定の興味(観測)対象を組織的に同時複数量で計測しデータを蓄積獲得するシステムのこと。
likelihood
【尤度】
仮定した観測モデルのもとで、実際に観測されたデータが得られる確率。観測モデルに含まれるパラメータの関数となる。
linear Gaussian state space model 
【線形ガウス状態空間モデル】
通常、状態空間モデルと呼ばれる。システムモデル、観測モデルがともに線形かつ、システムモデルにおける擾乱項であるシステムノイズおよび観測モデルのノイズである観測ノイズがともにガウス(正規)分布に従うと仮定するモデルのこと。

M

magnetosphere
【磁気圏】
惑星周辺にあって、惑星固有磁場がその場所のプラズマの運動を支配している領域。地球の磁気圏は、地球から太陽側に地球半径の10倍程度の距離まで、反太 陽側に地球半径の200倍以上の距離までの範囲を占める。地球磁気圏は、磁場が双極子場に近い形状をしている内部領域と、磁場が太陽風に引き延ばされて直 線に近い形状になっている尾部領域に分けることができる。磁気圏内部には、双極子磁場に捕捉された荷電粒子が、リングカレントや放射線帯などを形成する。
many core
【メニーコア】
CPU が収まっているパッケージに数十数百と、多数のプロセッサコアが入っている。大量のプロセッサを用意して処理速度の大幅な向上を狙う考え方。
mass spectrometry 
【タンパク質量分析】
質量分析装置(MS: Mass Spectrometry)を用いて、タンパク質やペプチドなどの試料をイオン化し、質量/電荷(m/z)にしたがい分離することで、その測定強度から試 料の質量を推測するプロテオーム解析技術。イオン化の手法としてMALDU法とESI法が有名。
maximum likelihood
【最尤法】
尤度を最大とするように、尤度を構成しているパラメータを推定すること。
Monte Carlo method
【モンテカルロ法】
乱数を用いて有限個の点で確率分布を近似する手法の総称。一般的に、多重積分の近似計算や統計物理のシミュレーションに用いられる。統計科学の分野では、積分で表現されたベイズ推定量を計算するために、モンテカルロ法の応用が広く浸透している。
Monte Carlo mixture Kalman filter 
【モンテカルロ混合カルマンフィルタ】
複数のカルマンフィルタによる状態更新を、確率的に切り替え統合するような、統合化された状態更新アルゴリズム。
multi core
【マルチコア】
CPU が収まっているパッケージに複数のプロセッサコアが入っている。マルチプロセッサ構成のコンピュータの実装の一つ。

N

non-Gaussian disturbance behavior 
【非ガウス的擾乱】
ガウス分布でない分布、つまり非ガウス分布から発生したと仮定する(想像できる)擾乱項。ガウス分布は、標準偏差の3倍、4倍ともなると、その実現値の現 出は極めてまれで、膨大なサンプル数でもほとんどゼロに近いが、一方非ガウス分布はある一定の有限値をもつ。この性質を使って、たまにおこる現象の現出を 形式的にでも確率モデルとして表すときに、非ガウスノイズが利用される。近年のファイナンス工学でもこの性質を使ってさまざまモデルが提案されている。
normal distribution 
【正規分布】
ガウス分布とも呼ばれる。ほとんどの、多量観測の場合のばらつきを表す分布であり、性質がよいことから良く使われる。しかしながら、非線形変換がかかると 正規分布でなくなるため、精密な推定には非正規の場合の推定法が必要となる。粒子フィルタは,非線形時系列の場合にひとつの推定実現手法である。
numerical simulation model 
【数値シミュレーションモデル】
通常シミュレーションと呼ばれる、時刻t-1から時刻tへの計算機上での状態更新を行う実体形式。

O

observation model 
【観測モデル】
measurement model とも呼ばれる。状態ベクトルから、具体的データの観測にいたる道筋、状態ベクトルとデータベクトルとの関係を表現する関数。
observation noise 
【観測ノイズ】
状態空間モデルにおいて、実際の観測と状態から導かれる観測されるべき量との差をあらわす誤差項のこと。測器誤差などをモデリングするのが一般的であるが、津波データ同化においては、さらに通常時のトレンド的でない成分についても観測ノイズとしてモデリングを行っている。
oceanic tide 
【海洋潮汐】
月や太陽の引力によって引き起こされる海水の運動。天体の運動は規則的であり、半日および一日周期の正弦関数的な運動の合成で表される。
oceanography 
【海洋学】
海流、海中化学物質、海棲生物、プレートテクトニクスなどの海洋の諸現象・変動を調べる地球科学の一分野。解析対象によって、海洋物理学・海洋化学・海洋生物学・海洋地質学などの分野にさらに分けられる。

P

parallel particle filter
【並列粒子フィルタ】
粒子フィルタは、並列性が非常に高いという利点があり、計算の大規模化が比較的低コストで実現可能である。並列粒子フィルタ(parallel particle filter) あるいは分散型粒子フィルタ(distributed particle filter)と呼ばれる並列計算の実装方法が提案されている。
particle filter
【粒子フィルタ】
システムモデル、観測モデルが線型で記述できる場合に限らず、一般のシステムに対して適用できる逐次的な状態推定の手法。状態の確率分布をアンサンブル近似で記述し、アンサンブルを構成する各サンプルを尤度の重みでリサンプリングすることでフィルタリングを行う。
positive definite matrix
【正定値行列】
行列Aとゼロでない任意のベクトルxを用いた2次形式x'Axが常に正であるとき、Aは正定値行列であるという。
prediction
【予測】
現在までの観測から将来の状態を推定すること。
processor core
【プロセッサコア】
コンピュータの頭脳 (CPU) の中で命令制御、演算、メモリを備えた演算をするブロック。
profit maximization
【利潤最大化】
企業などの生産者が合理的に生産を行う際に目標とする利潤の最大化。生産物の販売収入より生産にかかった費用を差し引いた金額。

R

rank
【ランク】
行列の各列をベクトルとみなしたとき、1次独立な列の最大個数をその行列のランクという。
reanalysis data 
【再解析データ】
データ同化のプロセスを経て得られた状態変数の推定値。逐次データ同化の場合は、平滑化推定値が対応する。
remote sensing
【遠隔観測】
対象物を離れた場所から観測すること。通常はリモートセンシングと呼ばれることが多い。人工衛星や航空機からの光学観測などの電磁波を介した観測がその代 表的なもので、気象衛星による雲などの撮像の他、地形調査、資源探査などさまざまな用途で用いられるが、近年は高速中性粒子を介した磁気圏などの宇宙空間 の観測も盛んになりつつある。
representation error
【表現誤差】
観測ノイズのうち、観測機器の特性によらない部分をいう。
ring current
【リングカレント】
磁気圏内部に捕捉された高エネルギーの荷電粒子によって惑星を取り巻くような形で形成される電流。地球の場合、地球の周りを西向きに流れており、この電流の発達が地上で観測される磁気嵐の主たる原因になっている。

S

SBML
【Systems Biology Markup Language】
動的な生化学反応ネットワークモデルを記述することを目的としたXMLフォーマット(Extensible Markup Language)のひとつ。
sea bottom topography data set 
【海底地形データセット】
30秒から数分刻みの水深データセット。音波による水深測定をもとにしたものが中心であるが、一部のデータは、衛星により観測される重力異常を利用して補正をかけているものもある。
shallow water equations 
【浅水波方程式】
水の伝播について、水深が波長に対して浅い場合に成り立つ方程式系.津波の伝播は基本的に、この方程式系に従う。
signal-transducing pathway 
【シグナル伝達経路】
細胞外シグナル分子(主にタンパク質)を介した刺激を、細胞質や核内に伝えるための生化学反応の連鎖。一般には、細胞膜上の受容体と細胞外シグナル分子の 結合によってシグナル伝達が開始し、Gタンパク共役因子の活性化機構、細胞内のタンパクリン酸化・脱リン酸化、転写因子活性による遺伝子の転写調節などに よって構成される。
SILAC method 
【SILAC法】
タンパク質量分析法の一種で、安定同位体ラベル法をアフィニティークロマトグラフィーと組み合わせることで定量的意味を持つプロテオームデータを得ることができる。
SIR
【Sampling Importance Resampling】
粒子フィルタ (PF: Particle Filter) の実装方法のひとつ。観測に対する条件付き確率分布のモンテカルロ・サンプルを得るのに、もとの確率分布を表現するそれをリサンプルすることで実現する。 退化が起こりにくい手法であるが、メモリコピーが必要であり、メモリアクセスが高価であるGPU環境では不利である。SISも参照のこと。
SIS
【Sequential Importance Resampling】
粒子フィルタ (PF: Particle Filter) の実装方法のひとつ。確率分布はモンテカルロ・そんプルと各サンプルに対する重みの対として表現される。観測に対する条件付き確率分布は、重みを更新する ことで得られる。リサンプリングが不要であるため、GPUのようなメモリアクセスが高価である環境で有利に働くが、退化が起こりやすく、より多くのモンテ カルロ・サンプルを必要とする。SIRも参照のこと。
smoothing
【平滑化】
現在までの観測から過去の状態を推定すること。
spin-up 
【スピンアップ】
シミュレーションモデルに与えた初期値がモデルに十分に整合していない場合、初めの方の計算結果にはノイズが現れる。このノイズを落とすために、シミュ レーションによる時間発展の計算をノイズが現れなくなるまで続けること。シミュレーションだけでなく、データ同化計算の前にも行われる。
state vector 
【状態ベクトル】
システムの状態を記述する変数で構成されるベクトル量。データ同化の場合は、シミュレーション変数及び諸パラメータなどをすべて並べたベクトル量。
stochastic differential equation
【確率微分方程式】
微分方程式において、確率変数の項をもつ方程式。その解は確率過程となる。
stochastic variable 
【確率変数】
時間、空間的状態発展(更新)に、確率的な要因を含む変数。
strong constraint 
【強拘束】
システムノイズをゼロとするシステムモデルを指す。
strong nonlinear 
【強非線形】
システム、観測モデルが非線形の場合、それらを線形化近似し、カルマンフィルタの考えを適用する状態更新の計算手法が、拡張カルマンフィルタと呼ばれる。このような、モデルをあらかじめ局所線形化するような近似解法が役に立たないほど非線形性が強いこと。
SVM (Support Vector Machine)
【サポートベクターマシン】
二値分類のための機械学習アルゴリズムの一。未知ベクトルの分類は、これと既知ベクトルの内積の重みづけ和に定数項を加えた線形関数の符号であたえられ る。重みづけ和は、分離平面と既知ベクトルとの距離が最も大きくなるように、二次計画法により決定される。線形関数に現れる内積を適切な内積性を満たすス カラー関数と置き換えることで、分離面を非線形曲面に拡張できる。
system model 
【システムモデル】
update model と呼ばれることもある。状態ベクトルの、その時間更新を表現する実体形式。
system noise 
【システムノイズ】
シミュレーションモデルが解く時間発展過程において、不確定性を許すために付加された項。
systems biology 
【システムズバイオロジー】
生体内の情報伝達(タンパク相互作用、リン酸化・脱リン酸化、転写、翻訳など)や物質輸送のメカニズムをシステムとして捉え、生命現象を理解・解明することを目的とする研究領域。

T

tide gauge 
【潮位計】
沿岸に設置される海水面高を測定する機器のこと。通常数十秒から2分程度の時間分解能をもつ。津波は少なくとも数分周期であるので、ほぼ分解可能である。
transcription factor
【転写因子】
転写の制御に関わるタンパク質の複合体。核内あるいは細胞質中に不活性状態で存在している転写因子は、細胞内のタンパク質間相互作用をトリガーとして活性 型に変換され、標的遺伝子の上流配列に埋め込まれたプロモーター配列に結合する。このDNA-タンパク質間相互作用が標的遺伝子の転写を制御している。
trend model 
【トレンドモデル】
時系列解析において、時系列データからトレンド成分を抽出する際に用いるモデル。1次元の場合はランダムウォークモデルのあてはめになっている。状態空間 モデルとカルマンフィルタの組み合わせにより推定が可能である。津波データ同化では、津波成分以外の成分の抽出というデータの前処理のために使用してい る。
tsunami 
【津波】
震源が浅海底での地震であった場合などにおいて、海底の急激な地形変動が、その上部の海水面変動としてあらわれ、それが波として伝播したもの。地震が原因であることがほとんどであるが、地すべりなどが原因の場合もある。
twin experiment 
【双子実験】
データ同化による推定がうまくいっているかどうかを確認するための数値実験の手法。双子実験では、まず、真の境界条件のもとでのシミュレーションを走ら せ、そこから得られる試験用の観測データを作成する。次にこの観測データと、偽の境界条件の下でデータ同化を行う。この同化により、偽の境界条件が修正さ れ、真の境界条件すなわち海底地形に近づいたならば、手法が有効であると確認できる、という検証法である。

V

variance parameter 
【分散パラメータ】
不確実性などを表現する際に、そのばらつき具合を表すもの。境界条件に導入する場合の分散パラメータは、状態ベクトルの一部に確率変数を導入し、その分散共分散行列を与えることに相当する。

W

weak constraint 
【弱拘束】
強拘束に対して、システムノイズがゼロでないシステムモデルを指す。一般的なシステムモデルのことである。

Y

Yamato rises 
【大和堆】
日本海中央部に存在する海山。南北に2つの山があり、それぞれ南堆、北堆とよばれる。この領域においては、データセット間で水深の違いが大きいことが確認されている。
 

Home 用語集