本研究は、線形再帰ニューラルネットワーク(LRNN)の正規言語モデリング能力を調査したものである。
まず、理論的分析から、入力非依存のLRNNでは減算演算を表現できないことを示した。これは、正規言語のモデル化に限界があることを意味する。
そこで、入力依存の遷移行列を持つLRNNを提案した。具体的には、ブロック対角型の遷移行列を採用し、各ブロックの列ノルムを制限することで数値的安定性を確保した。
提案モデルを、Sum、EvenPair、ModArithといった正規言語タスクで評価した。実験の結果、提案モデルが唯一、長距離外挿性能を発揮できることが分かった。一方、既存のLRNNモデルは外挿性能が低いことが確認された。
以上より、入力依存性と十分な表現力が正規言語モデリングに重要であることが示された。
In eine andere Sprache
aus dem Quellinhalt
arxiv.org
Wichtige Erkenntnisse aus
by Ting-Han Fan... um arxiv.org 04-10-2024
https://arxiv.org/pdf/2309.07412.pdfTiefere Fragen