부분 관측 마르코프 결정 과정

🏷️ 정보 머신러닝

부분 관측 마르코프 결정 과정

부분 관측 마르코프 결정 과정(Partially Observable Markov Decision Process, POMDP)은 에이전트가 환경의 실제 상태를 완전히 관측할 수 없고, 불완전한 관측값만 받는 강화 학습 프레임워크이다.

핵심