Guohui Zhang

🏷️ 인물 머신러닝 영상처리

Guohui Zhang은 Feng Zhao 교수 연구실 소속의 University of Science and Technology of China(USTC) 박사과정 연구자입니다. 시각 생성 모델에 강화학습 기반 fine-tuning을 적용하는 흐름을 일관되게 추적해온 1저자입니다.

대표 선행 연구로는 MaskFocus(arXiv:2512.18766, 2025)와 Group Critical-Token Policy Optimization(arXiv:2509.22485, 2025)이 있습니다. 두 논문 모두 image generation에서 어느 step·어느 token이 진짜 중요한가를 식별해 정책 업데이트를 그쪽에 집중시키는 아이디어를 다뤘습니다. OmniNFT의 region-wise loss reweighting은 같은 critical 영역에 reward를 집중시킨다는 발상의 연장선에 있습니다.

OmniNFT(arXiv:2605.12480)에서는 다시 1저자를 맡아 joint audio-video diffusion으로 무대를 옮겼습니다. modality-wise advantage routing, layer-wise gradient surgery, region-wise loss reweighting 세 디자인이 모두 RL signal을 올바른 자리에 흘려보낸다는 본인의 연구 톤을 이어갑니다.

대부분의 공동 저자가 USTC와 JD Explore Academy 양쪽에 걸쳐 있는데, OmniNFT 저자 명단도 USTC 본진(1저자·교신저자 포함)과 JD Explore Academy 인사가 섞여 있습니다.