本論文では、構成的μ-計算のためのゲームセマンティクスを定義し、二関係Kripkeセマンティクスとの同値性を証明する。さらに、このゲームセマンティクスを用いて、μ-計算がIS5上でモーダル論理に崩壊することを示し、μIS5の完全性を証明する。
大規模言語モデルの論理推論能力を向上させるために、入力コンテキストから論理的表現を抽出し、拡張し、自然言語に翻訳して入力プロンプトに組み込む。
大規模言語モデルは自然言語の論理的推論を行うことができるか、この問題に取り組むため、25種類の推論パターンを網羅するLogicBenchデータセットを提案し、GPT-4、ChatGPT、Gemini、Llama-2、Mistralなどの言語モデルの性能を評価した。実験結果は、これらの言語モデルが複雑な推論や否定を含む推論に苦戦していることを示している。