Основные понятия
오프라인 강화 학습의 샘플 복잡성을 모델 기반 접근법으로 해결
Статистика
모델 기반 오프라인 강화 학습은 ε-정확도를 위해 SC⋆clipped(1−γ)3ε2의 샘플 복잡성을 달성
유한 시간 MDPs에 대한 VI-LCB 알고리즘은 H4SC⋆clippedε2의 샘플 복잡성을 달성
Цитаты
"모델 기반 오프라인 강화 학습은 ε-정확도를 위해 SC⋆clipped(1−γ)3ε2의 샘플 복잡성을 달성"
"VI-LCB 알고리즘은 H4SC⋆clippedε2의 샘플 복잡성을 달성"