Dongrui Liu

🏷️ 인물 LLM

Dongrui Liu(刘东瑞)는 상하이 인공지능 연구소(Shanghai AI Lab) 연구원으로, 상하이교통대학교에도 적을 두고 있습니다. 연구 관심사는 AI 안전·보안(AI Safety and Security)과 설명가능 AI(XAI)입니다.

신뢰할 수 있는 대규모 언어모델을 만드는 쪽으로 꾸준히 작업해 왔습니다. LLM이 인지하는 문제 난이도 추정, 추론 동역학, 멀티모달 지식 충돌 벤치마크, 디퓨전 LLM의 안전 취약점 같은 주제로 EMNLP 2025, NeurIPS 2025, ICLR 2026, AAAI 2026 등에 논문을 냈습니다.

HLL - Can Agents Cross Humanity's Last Line of Verification에서는 Linfeng Zhang과 함께 교신저자를 맡았습니다. AI 안전을 연구하는 그에게 CAPTCHA는 자연스러운 소재입니다. CAPTCHA는 봇과 사람을 가르려고 일부러 세운 방어선이고, 에이전트가 그 경계를 넘을 수 있는지는 곧 자동화 악용의 위험을 재는 안전 문제이기 때문입니다.