재러드 카플란

개요

재러드 카플란(Jared Kaplan)은 Anthropic의 공동 창립자이자 수석 과학자(Chief Science Officer)이며, 존스 홉킨스 대학교 물리학과 부교수입니다. 이론물리학자 출신으로 AI 연구로 전환한 대표적 사례로, 2020년 발표한 스케일링 법칙(Scaling Laws) 연구로 현대 대규모 언어 모델 개발의 기틀을 마련했습니다.

모델 성능이 파라미터 수, 데이터 양, 연산량에 따라 예측 가능한 멱함수 관계를 따른다는 핵심 발견은 이후 GPT-3부터 현재에 이르는 대형 모델 개발 전략 전체의 이론적 근거가 되었습니다. 2025년 타임지가 선정한 'AI 분야에서 가장 영향력 있는 100인(Time100 AI)'에 이름을 올렸습니다.

2024년 10월에는 Anthropic의 책임 스케일링 책임자(Responsible Scaling Officer)로 임명되어, 모델 출시 전 안전 기준을 설정하고 평가하는 역할도 겸임하고 있습니다.

생애

카플란은 스탠퍼드 대학교에서 물리학과 수학을 전공하여 학사 학위를 취득했습니다. 이후 하버드 대학교에서 물리학 박사 학위를 받았으며, 지도교수는 입자물리학과 홀로그래피 분야의 석학 니마 아르카니-하메드(Nima Arkani-Hamed)였습니다. 박사 논문 주제는 "홀로그래피의 여러 측면(Aspects of Holography)"(2009)으로, 끈 이론과 등각장론을 다뤘습니다.

박사 학위 취득 후 존스 홉킨스 대학교 물리학과에 임용되어 조교수 및 부교수로 재직했습니다. 이 기간 유효장 이론, 입자물리학, 우주론, 산란 진폭 등 이론물리학 연구를 이어가는 한편, 기계학습과 물리학의 접점에 관심을 갖기 시작했습니다. 2019년 전후로 OpenAI와 협력 연구를 진행하며 AI 연구로 중심을 옮겼고, 2021년 다리오 아모데이, 다니엘라 아모데이, 샘 맥캔들리시 등과 함께 Anthropic을 공동 창립했습니다.

2025년 YC AI Startup School에서 이론물리학에서 AI로의 전환 과정과 지능의 예측 가능한 스케일링에 대해 강연했습니다. 2026년 5월 기준 Anthropic의 기업 가치는 9,650억 달러에 달하는 펀딩 라운드를 완료했으며, 카플란은 공동 창립자이자 핵심 과학 리더로서 회사의 연구 방향을 총괄하고 있습니다.

업적

카플란의 핵심 기여는 2020년 OpenAI 재직 당시 발표한 Scaling Laws for Neural Language Models입니다. 이 논문은 언어 모델의 교차 엔트로피 손실이 모델 파라미터 수, 학습 데이터 토큰 수, 연산 예산에 대해 각각 멱함수 관계로 감소함을 실험적으로 증명했습니다. 세 가지 요소 중 어느 것이 병목인지에 따라 최적 모델 크기와 데이터 배분이 달라진다는 처방도 제시했으며, 이는 이후 Chinchilla(2022)를 비롯한 스케일링 최적화 연구의 출발점이 됐습니다.

같은 해 공동 저술한 "Language Models are Few-Shot Learners"는 GPT-3를 발표한 논문으로, 대형 언어 모델이 파인튜닝 없이 맥락 내 학습(in-context learning)만으로 다양한 태스크를 수행할 수 있음을 보였습니다. 스케일링 법칙과 GPT-3는 현대 LLM 개발 패러다임의 양대 축을 동시에 정립한 성과로 평가받습니다.

Anthropic에서는 스케일링 연구를 안전 프레임워크와 결합하는 작업을 주도하고 있습니다. 2024년 책임 스케일링 책임자(RSO)로 임명된 이후, Claude 4 출시 시 이전 모델보다 더 엄격한 안전 조항을 적용하도록 결정하는 등 모델 출시 기준을 직접 관장하고 있습니다. Constitutional AI 개발에도 핵심적으로 기여했으며, 이는 Anthropic이 ChatGPT와 차별화되는 가장 중요한 안전 방법론 중 하나입니다.

여담

카플란의 이력에서 가장 두드러지는 점은 이론물리학에서 AI로의 전환이 단순한 분야 이동이 아니라는 것입니다. 그가 스케일링 법칙을 발견하는 과정에서 활용한 도구는 멱함수와 스케일링 관계를 물리계에서 탐구하던 응집물질물리학 및 통계역학의 사고 방식이었습니다. 물리학자들이 상전이나 임계 현상에서 보는 스케일 불변성(scale invariance)이 신경망 학습에서도 나타난다는 직관이 핵심이었습니다.

존스 홉킨스 교수직을 지속적으로 유지하는 것도 눈여겨볼 대목입니다. 스타트업 창업 이후에도 학교 직함을 내려놓지 않는 이유는 명시된 바 없지만, 이론물리학자 정체성을 유지하려는 의식적 선택으로 해석되곤 합니다. 학계와 산업계 사이 경계가 가장 허물어진 분야가 AI임을 보여주는 단적인 사례이기도 합니다.

Anthropic의 RSO 역할은 AI 산업 전반을 통틀어 드문 직위로, 안전 기준 설정 책임자가 동시에 과학 연구 최고 책임자를 겸임하는 구조입니다. 카플란이 이 역할을 통해 단순히 좋은 모델을 만드는 것을 넘어, 모델이 얼마나 강력해질 수 있는지에 대한 상한선을 회사 내부에서 직접 관리하고 있다는 점에서 스케일링 법칙 연구와 현재 역할 사이의 일관성이 엿보입니다.

주요 논문

Scaling Laws for Neural Language Models (arXiv:2001.08361, 2020)
Language Models are Few-Shot Learners (GPT-3, NeurIPS 2020)
Scaling Laws for Transfer (arXiv:2102.01293, 2021)
Explaining Neural Scaling Laws (PNAS 2024, arXiv:2102.06701)
An Empirical Model of Large-Batch Training (arXiv:1812.06162, 2018)
The Principles of Deep Learning Theory (Cambridge University Press, 2022, 샘 맥캔들리시 공저)