안드레이 카파시

개요

안드레이 카파시(Andrej Karpathy)는 슬로바키아-캐나다 출신 AI 연구자이자 교육자입니다. 스탠퍼드 대학교에서 컴퓨터 비전 박사 학위를 취득하고, OpenAI 창립 멤버, Tesla AI 디렉터, Eureka Labs 설립자를 거쳐 2026년 5월 Anthropic에 합류해 Claude 사전학습 연구팀을 이끌고 있습니다.

딥러닝 교육 콘텐츠 제작자로서도 큰 영향력을 발휘합니다. CS231n 강의와 Neural Networks: Zero to Hero 유튜브 시리즈는 전 세계 수백만 명의 ML 입문 경로가 되었습니다. 2025년 초에는 "바이브 코딩(vibe coding)"이라는 용어를 만들어 소프트웨어 업계 전반에 확산시켰습니다.

기술 리더십과 대중 교육을 동시에 추구한다는 점에서 동시대 AI 연구자 중 독보적인 위치를 차지합니다. 연구 논문보다 실용적인 튜토리얼, 오픈소스 코드, 공개 강의를 통해 영향력을 행사하는 방식이 특징입니다.

생애

1986년 슬로바키아에서 태어나 캐나다로 이주했습니다. 토론토 대학교에서 컴퓨터 과학과 물리학을 전공한 뒤, 스탠퍼드 대학교로 진학해 Fei-Fei Li 교수 지도 아래 컴퓨터 비전 박사 학위를 취득했습니다. 박사 과정 중 ImageNet 분류 챌린지에 직접 참가하며 인간 수준 성능 측정 실험을 수행한 일화로도 알려져 있습니다.

2015년 샘 올트먼, 일리야 수츠케버 등과 함께 OpenAI를 공동 창립했습니다. 2017년 OpenAI를 떠나 Tesla에 합류해 자율주행 시스템 Autopilot의 비전 기반 신경망 설계를 책임지는 AI 디렉터(Senior Director of AI)직을 맡았습니다. 2022년 Tesla를 퇴사하고 잠시 OpenAI에 복귀했다가 2024년 2월 OpenAI를 최종 퇴사했습니다.

2024년 7월 AI 네이티브 교육 스타트업 Eureka Labs를 설립했으며, 약 2000만 달러 규모의 시드 투자를 유치했습니다. 2026년 5월 19일 Eureka Labs를 떠나 Anthropic에 합류했습니다. 닉 조셉(Nick Joseph) 지휘 아래 Claude 사전학습 연구팀을 구성하는 역할을 맡았으며, 22개월의 독립 창업자 챕터가 이로써 마무리되었습니다.

업적

박사 재학 중 설계한 CS231n(Convolutional Neural Networks for Visual Recognition)은 스탠퍼드 역사상 처음으로 대규모 딥러닝을 다룬 강의였습니다. 2015년 150명이었던 수강생이 2017년 750명으로 증가했으며, 이후 무료 공개된 강의 자료는 전 세계 딥러닝 입문자들의 표준 교재가 되었습니다.

Tesla 재직 기간(2017-2022)에는 카메라만으로 자율주행을 구현하는 Pure Vision 접근법을 주도했습니다. LiDAR 없이 여덟 방향 카메라에서 수집한 영상만으로 3D 공간을 인식하는 Autopilot 아키텍처를 설계했으며, 이 방향성은 이후 Tesla FSD 개발의 기반이 되었습니다.

Eureka Labs에서는 LLM101n을 발표했습니다. 파이썬, C, CUDA를 사용해 처음부터 스토리텔러 LLM을 구축하는 과정을 담은 오픈소스 커리큘럼으로, 깃허브 공개 8주 만에 3만 6000스타를 기록했습니다. 2025년 2월에는 "바이브 코딩" 개념을 처음 정의했고, 2026년 6월 Sequoia Ascent 컨퍼런스에서 발표한 "Software 3.0" 논지를 통해 에이전틱 엔지니어링 개념을 체계화했습니다. Anthropic 합류 이후에는 Claude를 활용해 사전학습 연구 사이클 자체를 가속화하는 방향으로 작업하고 있습니다.

여담

카파시는 연구 논문보다 교육 자료와 X(트위터) 글로 더 많이 알려진 드문 사례입니다. "Neural Networks: Zero to Hero" 유튜브 시리즈는 GPT-2를 처음부터 구현하는 과정을 250줄 이내 코드로 보여주는 karpathy/nanoGPT를 중심으로 구성되어 있으며, 깃허브 스타 4만 개 이상을 기록했습니다.

ImageNet 인간 참조(human reference) 실험에서 카파시는 직접 1000가지 클래스 이미지를 수작업으로 분류하며 5.1% 오류율을 기록했고, 이 수치는 이후 딥러닝 모델 성능 비교의 기준점으로 자주 인용되었습니다. Anthropic 합류 발표 직후 AI 업계는 이를 사전학습 자동화 시대의 신호탄으로 해석했으며, 다수의 미디어가 "가장 영향력 있는 AI 인재 이동 중 하나"라고 보도했습니다.

Anthropic에서 카파시의 팀 목표는 Claude 자신을 사용해 사전학습 연구 사이클을 압축하는 것입니다. 이것이 실현된다면 Anthropic은 재귀적 AI 개선(recursive AI improvement)을 구조화된 인간 감독 아래 실증하는 사례가 됩니다. 그의 합류가 단순한 인재 영입을 넘어 프론티어 모델 개발 방식 자체를 바꿀 수 있는지에 관심이 쏠리고 있습니다.

주요 논문

Large-Scale Video Classification with Convolutional Neural Networks (CVPR 2014)
Deep Fragment Embeddings for Bidirectional Image Sentence Mapping (NeurIPS 2014)
Deep Visual-Semantic Alignments for Generating Image Descriptions (CVPR 2015)
Visualizing and Understanding Recurrent Networks (ICLR 2016 Workshop)
PixelCNN++: Improving the PixelCNN with Discretized Logistic Mixture Likelihood and Other Modifications (ICLR 2017)
Connecting Images and Natural Language (Stanford PhD Thesis, 2016)
Language Models are Unsupervised Multitask Learners (GPT-2, OpenAI 2019, 공동 저자)
WebGPT: Browser-assisted Question-Answering with Human Feedback (arXiv 2021, 공동 저자)