本論文では、最大エントロピー微分動的計画法をTsallisエントロピーを用いて一般化した手法を提案する。Tsallisエントロピーを用いることで、最適制御ポリシーがq-Gaussianとなり、より広範な探索が可能になる。さらに、探索分散がトラジェクトリの価値関数に応じて自動的にスケーリングされるため、必要に応じて効果的な探索を行うことができる。