Liwei Jiang

🏷️ LLM NLP

Liwei Jiang은 미국 워싱턴 대학교 Paul G. Allen School of Computer Science & Engineering의 최종 학년 박사과정 연구자로, Yejin Choi의 지도 아래 AI 안전성과 가치 정렬을 연구한다. 박사 과정 중 NVIDIA와 Allen Institute for AI(Ai2)에서 방문 연구원을 겸했다.

주요 연구 방향은 언어 모델의 도덕적 추론 능력 평가와 다원적 가치 정렬이다. 2021년 발표한 "Can Machines Learn Morality? The Delphi Experiment"(arXiv:2110.07574)는 크라우드소싱으로 수집한 도덕 규범 텍스트로 AI를 훈련시켜 인간의 도덕 판단을 예측하게 하는 Delphi 시스템을 제안했다. 이 논문은 Nature Machine Intelligence에 2025년 게재됐다. NAACL 2022 Best Paper Award, EMNLP 2023 Outstanding Paper Award, CHI 2024 Best Paper Award 등 여러 탑 컨퍼런스에서 수상 이력을 보유하고 있다.

2025년 10월 공개한 "Artificial Hivemind: The Open-Ended Homogeneity of Language Models (and Beyond)"(arXiv:2510.22954)는 NeurIPS 2025 Datasets and Benchmarks Track에서 Best Paper Award를 수상했으며 Oral(상위 0.35%) 발표로 선정됐다. 26,000개의 개방형 질문으로 구성된 INFINITY-CHAT 데이터셋을 구축해 70개 이상의 최신 LLM을 평가한 결과, 모델 패밀리와 크기를 넘어 서로 다른 모델들이 놀랄 만큼 유사한 출력을 생성하는 "군집 정신(Artificial Hivemind)" 현상을 발견했다. 앙상블이나 온도 조절로 출력 다양성을 확보할 수 있다는 통념을 실증적으로 반박한 결과였다.

2025년 12월 샌디에고에서 열린 NeurIPS 2025에서 Artificial Hivemind 논문의 구두 발표를 직접 진행했다. 지도 교수인 Yejin Choi와 함께 LLM이 진정한 다양성을 갖추지 못한 채 단일한 관점으로 수렴하는 문제를 AI 안전성의 핵심 과제로 제시하는 연구 흐름을 이어가고 있다.