아시시 바스와니
개요
아시시 바스와니(Ashish Vaswani)는 인도계 컴퓨터 과학자이자 기업인으로, 2017년 "Attention Is All You Need" 논문의 제1저자입니다. 이 논문은 현재 ChatGPT, Gemini, Claude 등 사실상 모든 대형 언어 모델의 핵심 아키텍처인 Transformer를 처음으로 제안했습니다. 논문의 인용 수는 2025년 기준 21만 건을 넘어 AI 역사상 가장 많이 인용된 논문 중 하나로 자리잡았습니다.
2023년 Niki Parmar와 함께 Essential AI를 공동창업해 CEO를 맡고 있습니다. 2025년 5월 시리즈 B로 1억 7,500만 달러를 조달하며 기업 가치 10억 달러를 인정받았고, 같은 해 말 오픈 웨이트 모델 Rnj-1(라마누잔)을 공개했습니다. 상업적 성공과 오픈사이언스를 동시에 추구하는 전략이 Essential AI의 핵심 정체성입니다.
생애
바스와니는 인도 출신으로 Birla Institute of Technology, Mesra에서 컴퓨터 과학 학부를 마쳤습니다. 이후 미국으로 건너가 University of Southern California(USC)에서 석사(2004-2006)와 박사(2006-2014) 학위를 취득했습니다. 박사 과정에서 자연어 처리와 통계적 기계 번역을 연구했으며, 지도 교수는 Liang Huang과 David Chiang이었습니다. 학업 도중 IBM과 Google에서 인턴십을 경험했고, 졸업 직후에는 USC 정보과학연구소(ISI)의 자연어 그룹에서 컴퓨터 과학자로 2년간 근무했습니다.
2016년 7월 Google Brain에 스태프 리서치 사이언티스트로 합류했습니다. 이곳에서 노암 셰이저, 니키 파마르, 야코프 우스코레이트, 일리아 폴로수킨 등 7명의 연구자와 함께 트랜스포머 논문을 작성했습니다. 논문 발표 이후에도 Google Brain에서 대규모 신경망과 비전 트랜스포머 연구를 이어갔습니다.
2021년에는 니키 파마르, 리온 존스 등 일부 트랜스포머 공저자들과 함께 Adept AI를 공동창업해 AI 에이전트와 소프트웨어 자동화 도구 개발에 도전했습니다. 이후 2023년 Adept를 떠나 니키 파마르와 함께 Essential AI를 새로 창업했습니다. 스타트업을 두 번 창업하는 과정에서도 바스와니는 "트랜스포머의 본질을 실제 제품으로 구현한다"는 기조를 일관되게 유지해 왔습니다.
업적
트랜스포머 이전의 시퀀스 모델은 주로 순환 신경망(RNN)이나 LSTM에 의존했습니다. 바스와니와 공동 저자들은 순환 구조를 완전히 배제하고 셀프 어텐션만으로 시퀀스 전체를 병렬 처리하는 아키텍처를 제안했습니다. 이 구조는 학습 속도와 성능 모두에서 기존 방식을 크게 앞섰고, 이후 BERT, GPT 계열 모델 모두 트랜스포머를 기반으로 설계되어 오늘에 이르렀습니다.
Essential AI는 2023년 말 5,650만 달러 규모의 시리즈 A를 유치하며 스텔스 모드에서 등장했습니다. 투자사에는 Google, Nvidia, AMD, March Capital 등이 포함되었습니다. 2025년 5월에는 10억 달러 기업 가치 평가를 받으며 1억 7,500만 달러 규모의 시리즈 B를 마무리했습니다. 기업 AI 워크플로 자동화, 인간 의사결정 보조, 비즈니스 기능 전반의 AI 통합을 핵심 제품 방향으로 삼고 있습니다.
2025년 말 공개된 Rnj-1(라마누잔) 모델은 처음부터 새로 학습한 오픈 웨이트 모델로, 베이스와 인스트럭션 튜닝 버전이 함께 출시되었습니다. 수학자 스리니바사 라마누잔의 이름을 붙인 것은 수학적 추론 능력에 대한 포부를 담은 것이며, 바스와니는 오픈 웨이트 공개가 AI의 지속적인 발전을 위한 필수 조건이라는 입장을 X(구 트위터)를 통해 직접 밝히기도 했습니다.
여담
바스와니는 트랜스포머 논문 저자 8명 중 제1저자로 표기되어 있지만, 저자들 스스로는 기여도가 모두 동등하다고 강조해 왔습니다. 논문 제목 "Attention Is All You Need"는 비틀즈의 노래 "All You Need Is Love"를 패러디한 것으로 알려져 있으며, 연구팀의 가벼운 유머 감각이 결과적으로 AI 역사에서 가장 유명한 논문 제목 중 하나가 되었습니다.
Essential AI라는 사명은 AI 기술을 기업 워크플로의 핵심 요소(essential)로 만들겠다는 의도와 함께, "트랜스포머의 본질(essence)"을 이어가겠다는 중의적 의미를 담고 있다고 설명됩니다. Rnj-1 모델명에 라마누잔을 택한 것 역시 단순한 마케팅이 아니라, 수학적 직관과 AI 추론 능력 사이의 연결에 대한 바스와니의 오랜 관심을 반영한 것입니다.
Google Brain 재직 시절부터 바스와니는 비전 트랜스포머 연구에 깊이 관여했습니다. 합성곱 없이 셀프 어텐션만으로 이미지를 인식하는 방향을 일찍부터 탐구했으며, 이 흐름은 ViT(Vision Transformer) 등장 이전부터 이어져 온 연구 계보입니다.
주요 논문
- Attention Is All You Need (2017) — Transformer 아키텍처 제안, 어텐션만으로 RNN을 대체
- One Model To Learn Them All (2017) — 단일 모델로 번역·이미지 분류·음성 인식 등 다중 도메인 동시 학습
- Image Transformer (2018) — 이미지 생성에 셀프 어텐션 적용
- Stand-Alone Self-Attention in Vision Models (2019) — 합성곱 없이 셀프 어텐션만으로 이미지 인식
- Scaling Local Self-Attention for Parameter Efficient Visual Backbones (2021) — 로컬 셀프 어텐션을 확장한 시각 백본
- Rnj-1 Technical Report (2025) — Essential AI의 오픈 웨이트 기반·인스트럭션 모델 공개