박서홍

🏷️ 인물 강화학습

개요

박서홍(Seohong Park)은 UC 버클리 컴퓨터과학 박사과정 연구자로, 서게이 레빈 그룹에서 오프라인 강화학습, 비지도 스킬 학습, RL 확장성을 연구합니다.

업적

대표 연구로 HIQL(Offline Goal-Conditioned RL with Latent States as Actions, NeurIPS 2023)이 있습니다. 잠재 상태를 행동처럼 다뤄 오프라인 목표 조건 강화학습을 계층적으로 푸는 방법입니다. 이외에 Hilbert 표현 기반 파운데이션 정책(HILP, ICML 2024), "Horizon Reduction Makes RL Scalable"(2025) 등 RL의 확장성과 표현학습을 잇는 연구를 이어가고 있습니다.