本論文では、バンディット環境における組み合わせアームの選択問題を考え、各ラウンドでの切り替えコストを考慮した最適化手法を提案する。バンディットフィードバックとセミバンディットフィードバックの2つの設定において、最小最大レグレットの下限を導出し、それに近づくアルゴリズムを設計する。