팀 크라스카

개요

팀 크라스카(Tim Kraska)는 MIT 전기공학·컴퓨터과학과 교수로, CSAIL 데이터 시스템 그룹을 공동으로 이끕니다. MIT 데이터 시스템 및 AI 연구소(DSAIL@CSAIL)의 창립 공동 디렉터이자, MIT 생성형 AI 임팩트 컨소시엄(MGAIC)의 공동 디렉터를 겸합니다. 2026년 7월 1일부로 정교수(Full Professor)로 승진이 확정되었습니다.

연구 방향은 "머신러닝을 위한 시스템을 짓고, 시스템을 위해 머신러닝을 쓴다"는 한 문장으로 압축됩니다. 데이터베이스 인덱스, 쿼리 최적화, 스케줄링 등 전통적인 시스템 컴포넌트를 학습 가능한 모듈로 대체하거나 보강하는 방향을 개척해왔습니다. 2025~2026년에는 데이터 인프라 가상화 프로젝트 BRAD, 에이전트 기반 Text-to-SQL 시스템 AgentSM 등으로 연구 외연을 확장하고 있습니다.

산업계와의 접점도 넓습니다. 아마존 AWS 응용과학 디렉터를 겸직하며, Instancio와 Einblick Analytics를 공동 창업해 둘 다 인수로 마무리한 이력이 있습니다.

생애

팀 크라스카는 독일 출신으로, ETH 취리히에서 컴퓨터과학 박사 학위를 받았습니다. 이후 UC 버클리 AMPLab에서 박사후 연구원으로 활동하며 분산 데이터 시스템 분야에 기반을 다졌습니다. 2013년 브라운대학교 조교수로 임용되며 독립 연구자 경력을 시작했습니다.

2015년 MIT 부교수로 합류한 뒤 데이터 시스템과 머신러닝의 접점을 집중적으로 탐구했습니다. 2017년 구글 연구자들과 공동으로 learned index 개념을 제안하면서 국제적인 주목을 받았고, 이를 계기로 DSAIL을 설립해 데이터 시스템·AI 융합 연구의 거점을 구축했습니다. 2026년 MIT EECS의 정교수 승진 발표는 그동안의 연구 성과를 공식적으로 인정하는 이정표입니다.

창업 경험도 풍부합니다. 데이터 분석 플랫폼 스타트업 Einblick Analytics를 공동 창업했으며, 이 회사는 후속 인수로 이어졌습니다. AWS 겸직을 통해 학계 연구 결과를 대규모 클라우드 환경에 직접 접목하는 흐름도 이어가고 있습니다.

업적

크라스카의 가장 대표적인 기여는 learned index 구조입니다. 2018년 제프 딘, Alex Beutel 등 구글 동료들과 발표한 "The Case for Learned Index Structures"(SIGMOD 2018)는, 머신러닝 모델이 전통적인 B-Tree 인덱스를 대체하거나 정렬 알고리즘을 보강할 수 있음을 처음으로 체계적으로 보인 연구입니다. 기존 인덱스 대비 크기가 최대 100배 작고 속도는 빠른 학습 기반 인덱스를 제시하며 데이터베이스 분야에 큰 파장을 일으켰습니다.

이 흐름에서 파생된 연구들이 instance-optimized data systems라는 더 넓은 연구 의제를 형성했습니다. 쿼리 최적화기, 조인 순서 결정, 카디널리티 추정 등 전통적으로 수작업 휴리스틱에 의존하던 시스템 컴포넌트들을 학습 가능한 모듈로 대체하는 일련의 연구가 SIGMOD, VLDB, NeurIPS 등에 발표되었습니다.

2025년 발표한 BRAD 프로젝트는 데이터 인프라 가상화라는 새로운 방향을 제시합니다. 클라우드 데이터 인프라 전반을 자동으로 최적화하는 시스템을 목표로, 학습 기반 스케줄링·리소스 관리 연구 성과를 통합한 결과물입니다. 2026년 초 공개된 AgentSM은 에이전트가 의미론적 메모리를 활용해 Text-to-SQL 쿼리 생성 정확도를 높이는 시스템으로, LLM과 데이터 시스템의 결합을 한 단계 심화시켰습니다.

여담

크라스카는 알렉스 장의 공동 지도교수이자 시니어 저자로 Recursive Language Models(RLM) 연구에 참여했습니다. LLM 추론을 "프롬프트를 외부 환경으로 다루는 시스템 문제"로 재정의한 RLM의 시각은, 데이터 시스템을 학습 가능한 컴포넌트로 재해석해온 그의 연구 철학과 자연스럽게 맞닿아 있습니다.

PipeRAG(KDD 2025) 연구에서는 검색 증강 생성(RAG) 파이프라인의 병렬화를 통해 지연 시간을 대폭 단축하는 방법을 제안했습니다. 데이터 시스템 연구자가 LLM 서빙 최적화 문제를 시스템 관점에서 풀어낸 사례로 주목받았습니다.

CSAIL Everest 이니셔티브의 공동 디렉터도 맡고 있어, MIT 내에서 AI·시스템 융합 연구 생태계를 키우는 데 기여하고 있습니다.

주요 논문

The Case for Learned Index Structures (SIGMOD 2018) -- 제프 딘 등과 공동. learned index 구조를 처음 제안한 선구적 연구.
SageDB: A Learned Database System (CIDR 2019) -- 데이터베이스 전반을 학습 기반 컴포넌트로 구성하는 비전 제시.
ALEX: An Updatable Adaptive Learned Index (SIGMOD 2020) -- 갱신 가능한 적응형 learned index.
Bao: Making Learned Query Optimization Practical (SIGMOD 2021) -- 학습 기반 쿼리 최적화를 실용화한 연구.
Are Learned Indexes Structures a Replacement for B-Trees? (VLDB 2022) -- learned index의 실용 가능성을 종합적으로 평가.
Cardinality Estimation: An Experimental Survey (VLDB 2023) -- 카디널리티 추정 방법론 종합 실험 비교.
Virtualizing Cloud Data Infrastructures with BRAD (SIGMOD 2025) -- 클라우드 데이터 인프라 가상화 프레임워크.
PipeRAG: Fast Retrieval-Augmented Generation via Adaptive Pipeline Parallelism (KDD 2025) -- RAG 파이프라인 병렬화로 지연 시간 단축.
AgentSM: Semantic Memory for Agentic Text-to-SQL (2026) -- 에이전트 기반 Text-to-SQL 의미론적 메모리 시스템.