댄 헨드릭스

개요

댄 헨드릭스(Dan Hendrycks, 1994~)는 미국의 AI 안전 연구자이자 AI 평가 벤치마크 설계자입니다. AI 안전 센터(Center for AI Safety, CAIS)의 창립자 겸 이사로, GELU 활성화 함수, MMLU, MATH, Humanity's Last Exam 등 현대 LLM 평가 인프라의 핵심 벤치마크를 다수 설계했습니다. xAI와 Scale AI의 안전 자문도 겸직하고 있으며, 기술 연구, 벤치마크 설계, 정책 옹호를 모두 아우르는 보기 드문 위치에 있습니다.

연구 초기에는 활성화 함수와 분포 외 탐지(out-of-distribution detection) 등 기초 연구에 집중했고, 이후 AI 능력 측정으로 이동했습니다. 현재는 AI 위험을 국가 안보 프레임으로 다루는 정책 연구까지 범위를 넓히고 있습니다. MMLU와 MATH는 현재까지 LLM 평가에서 가장 오래 인용되는 벤치마크 중 두 가지로 꼽힙니다.

2026년 기준 누적 피인용 수가 방대하며, CAIS는 AI 안전 연구 생태계에서 독립적인 소통 채널로 자리를 굳혔습니다. AI 위험 성명 이후 그는 기술 연구자이면서도 공공 담론에서 가장 많이 인용되는 AI 안전 목소리 중 하나가 되었습니다.

생애

댄 헨드릭스는 미주리 주 마셜필드(Marshfield)에서 복음주의 기독교 가정에서 자랐습니다. 시카고 대학교(University of Chicago)에서 컴퓨터 과학 학사 학위를 받았고(2018), 이후 UC 버클리에서 Dawn Song, Jacob Steinhardt 지도 아래 박사 학위를 취득했습니다(2022). 학부 재학 중인 2016년에 이미 GELU 활성화 함수를 제안한 논문을 공개해 일찍부터 주목을 받았습니다.

박사 과정에서는 AI 능력의 정량적 측정에 집중했습니다. 2021년 MMLU와 MATH를 연달아 발표하며 LLM 평가 분야의 핵심 기여자로 자리잡았습니다. 2022년 박사 졸업 직후 비영리 AI 안전 연구 기관인 CAIS를 설립하고 이사직을 맡았습니다. 2023년 CAIS 주도로 발표한 AI 위험 성명에는 제프리 힌턴, 요슈아 벤지오 등 수백 명의 연구자와 산업 전문가가 서명했습니다.

2025년에는 에릭 슈미트(Eric Schmidt), 알렉산드르 왕(Alexandr Wang)과 함께 Superintelligence Strategy 보고서를 발표했고, 같은 해 10월에는 AGI 정의 논문에 공동 저자로 참여하며 연구 범위를 정책 영역으로 더욱 확장했습니다. 2026년에는 CAIS가 AI 웰빙 연구를 발표하며 연구 영역을 AI 권리 문제까지 확장하는 방향을 제시했습니다.

업적

헨드릭스의 첫 번째 주요 기여는 GELU(Gaussian Error Linear Units) 활성화 함수입니다(2016). 당시 학부생이던 그가 공개한 이 함수는 이후 BERT, GPT 계열, ViT 등 대형 모델의 기본 활성화 함수로 채택되어 현대 딥러닝 아키텍처의 표준 구성 요소가 되었습니다.

2021년 발표한 MMLU(Massive Multitask Language Understanding)는 57개 도메인, 1만 5908개 다지선다 문항으로 구성된 LLM 평가 벤치마크입니다. 발표 당시 최상위 모델들이 50% 수준에 머물렀고, 이후 수년간 LLM 능력 평가의 기준으로 사용되다 포화 상태에 접어들었습니다. 같은 해 공개한 MATH 데이터셋은 수학 경시 문제 1만 2500개로 구성되어 모델의 수학 추론 한계를 구체적으로 측정할 수 있게 했습니다.

2025년 초 Scale AI와 공동으로 Humanity's Last Exam(HLE)을 발표했습니다. 500개 이상의 기관 소속 전문가 1000명 가까이가 기여한 2500개 전문가 수준 문항으로 구성되며, 공개 당시 최상위 모델도 2~8%에 그쳐 기존 벤치마크 포화 문제를 정면으로 제기했습니다. 2025년 3월에는 Superintelligence Strategy 보고서를 발표했습니다. 초지능 개발이 국가 안보 사안이며, 상호확증 AI 오작동(Mutual Assured AI Malfunction, MAIM) 억지 전략이 필요하다는 주장을 담고 있습니다. 같은 해 10월에는 요슈아 벤지오, 에릭 슈미트, 게리 마커스, 맥스 테그마크 등 30명 이상과 함께 AGI 정의 논문(arXiv:2510.18212)을 발표했습니다.

여담

헨드릭스는 일론 머스크와의 대화에서 기존 벤치마크가 너무 쉽다는 말을 들은 것이 Humanity's Last Exam을 만드는 계기가 되었다고 밝힌 바 있습니다. 기존 MMLU를 자신이 만들었으면서, 그것이 포화됐다고 판단해 스스로 더 어려운 후속 벤치마크를 설계한 셈입니다.

AI 안전에 대한 그의 접근 방식은 기술, 측정, 정책 세 층위를 동시에 다루는 특징이 있습니다. 순수 안전 연구자들은 정책 쪽을 기피하고, 정책 전문가들은 기술 깊이가 얕은 경우가 많은데, 헨드릭스는 GELU와 MMLU 같은 기초 기여부터 Superintelligence Strategy 같은 정책 보고서까지 스펙트럼이 넓습니다. xAI와 Scale AI 양쪽 자문을 동시에 맡는 것도 이 중립적 포지셔닝의 반영으로 읽힙니다.

2023년 AI 위험 성명 이후 CAIS는 AI 안전 담론의 주요 채널로 자리잡았습니다. 헨드릭스 본인은 AI 위험을 개연성 낮은 공상과학 시나리오가 아니라 현실적 국가 안보 문제로 프레이밍해야 한다고 강조하며, 이 관점이 Superintelligence Strategy 보고서로 구체화되었습니다. 2026년 AI 웰빙 연구 발표는 안전 연구의 외연이 AI 권리 영역으로까지 뻗어나갈 수 있음을 보여주는 또 하나의 사례입니다.

주요 논문

Gaussian Error Linear Units (GELU) (2016)
A Baseline for Detecting Misclassified and Out-of-Distribution Examples in Neural Networks (ICLR 2017)
Aligning AI With Shared Human Values (2020)
MMLU: Measuring Massive Multitask Language Understanding (2021)
MATH: Measuring Mathematical Problem Solving With the MATH Dataset (2021)
Unsolved Problems in ML Safety (2022)
AI Safety: State of the Field Through Quantitative Lens (2022)
Humanity's Last Exam (2025)
Superintelligence Strategy (2025)
A Definition of AGI (arXiv:2510.18212, 2025)