Omar Khattab
오마르 카타브(Omar Khattab)는 MIT 조교수로, 정보 검색과 LLM 중심의 엔드투엔드 AI 시스템을 연구한다. 현대 신경망 검색과 LM 프로그래밍 두 분야 모두에서 표준이 된 작업을 만든 연구자다.
대표 작업은 두 갈래다. 하나는 ColBERT로, 멀티벡터 검색(multi-vector retrieval)을 개척한 모델이다. ColBERT, ColBERTv2, 그리고 사실상 표준이 된 PLAID 인덱싱까지 이어지며 신경망 검색의 지형을 바꿨다. 다른 하나는 DSPy로, LM을 쓰는 임시방편식 프롬프트 엔지니어링을 조합 가능한 모듈과 자동 최적화로 대체하는 프로그래밍 모델이다. 두 프로젝트 모두 월 50만 회 이상 다운로드되는 오픈소스로 자리잡았고, 여러 기업·연구실에서 실제로 쓰인다.
Recursive Language Models에는 Alex L. Zhang의 공동 지도교수로 참여했다. RLM이 "LLM이 자기 자신을 프로그래밍 가능한 형태로 재귀 호출한다"는 발상을 핵심에 둔 것은, LM 호출을 코드로 조립한다는 DSPy의 문제의식을 추론 시점으로 끌어온 것으로 읽을 수 있다. 검색 에이전트가 외부 데이터를 환경으로 다루던 기존 방식의 한계(결국 컨텍스트 창을 채우고 압축으로 무너진다)를 정확히 짚어낸 §관련연구도 그의 검색 배경과 닿아 있다.