核心概念
不規則にサンプリングされた時系列データの予測のために、単純な曲線関数を用いて連続的な潜在状態を表現するモデルを提案する。
摘要
本研究では、不規則にサンプリングされた時系列データ(IMTS)の予測のために、Functional Latent Dynamics (FLD)と呼ばれる新しいモデルファミリーを提案している。FLDでは、潜在状態を単純な曲線関数で表現し、観測値のみから曲線の係数を学習する。これにより、従来のODE(常微分方程式)ベースのモデルと比べて、計算効率が高く、欠損値にも柔軟に対応できる。
実験では、4つの既存ベンチマークデータセットを用いて評価を行った。その結果、FLDは最先端のIMTS予測モデルと同等の予測精度を達成しつつ、推論時間を大幅に短縮できることが示された。特に、最も正確なFLDバリアントは、ODE系モデルの最良モデルを7つのタスクで上回った。
また、合成データを用いた実験では、FLDが非線形な時系列も正確に学習できることが確認された。今後の課題として、異なる種類の曲線関数を組み合わせる方法や、確率的な予測への拡張などが考えられる。
统计
不規則にサンプリングされた時系列データでは、観測値と欠損値が混在する
4つのベンチマークデータセットの特徴:
USHCN: 5つの変数、1996-2000年の観測データ、欠損率78%
Physionet-2012: 37の vital signs、48時間の観測データ、欠損率80.4%
MIMIC-III: 96の変数、48時間の観測データ、欠損率94.2%
MIMIC-IV: 102の変数、920時間の観測データ、欠損率97.8%
引用
"Irregularly sampled time series with missing values are often observed in multiple real-world applications such as healthcare, climate and astronomy."
"FLD serves as an alternative to ODE-based models and can handle both missing values and irregular sampling."
"FLD significantly outperforms competing models in terms of inference time."