앤서니 루이스
개요
M. Anthony Lewis(앤서니 루이스)는 로보틱스, 인공지능, 뉴로모픽 컴퓨팅 분야에서 수십 년 경력을 쌓아온 연구자입니다. 2023년 11월부터 BrainChip의 최고기술책임자(CTO)로 재직하고 있으며, BrainChip의 Akida 뉴로모픽 프로세서 위에서 대형 언어 모델을 구동하기 위한 아키텍처 경량화 전략을 이끌고 있습니다. 뉴로사이언스에서 영감을 받은 AI 설계와 극저전력 엣지 추론을 핵심 관심사로 삼고 있습니다.
2026년 ICML에서 발표한 "Do Transformers Need Three Projections?"(Do Transformers Need Three Projections - Systematic Study of QKV Variants)의 교신 저자로, 알리 카얌, 아누샤 마단 고팔과 함께 트랜스포머 어텐션의 Q·K·V 투영 구조를 체계적으로 분석했습니다. 엣지 디바이스를 직접 겨냥한 이 연구는 그의 경력 전반을 관통하는 "학술 신경과학과 산업 엣지 AI의 접점"을 잘 보여줍니다.
생애
루이스는 UCLA에서 사이버네틱스 및 전기공학 학위를 취득한 뒤 남캘리포니아 대학교(USC)에서 로보틱스와 신경과학을 융합한 전기공학 박사 학위를 받았습니다. 이후 애리조나 대학교 조교수로 임용되어 뉴로사이언스 기반 로보틱스 연구를 이끌었으며, 일리노이 대학교 어바나-샴페인, 워털루 대학교에서도 방문·겸임 교수로 활동했습니다.
산업계에서는 퀄컴에서 Zeroth 뉴로모픽 엔지니어링 프로젝트를 총괄했고, HP에서는 AI 및 이머징 컴퓨트 랩 VP 겸 글로벌 헤드로 딥러닝·로보틱스 연구를 이끌었습니다. 그 사이 정부 지원 R&D 기업을 직접 창업해 뉴로모픽 컴퓨팅과 로보틱스 분야 스타트업 에코시스템에도 투자자 겸 어드바이저로 참여했습니다. 2023년 11월 BrainChip CTO로 합류하며 현재 직책을 맡고 있습니다.
업적
루이스의 핵심 공헌은 뉴로사이언스 원리를 실제 하드웨어와 연결하는 공학적 번역에 있습니다. 퀄컴 시절 Zeroth 프로젝트는 신경모사 칩 위에서 인공지능 에이전트와 로보틱스가 동작하는 초기 사례를 산업 규모로 구현한 작업이었습니다. BrainChip에서는 Akida 프로세서의 TENN(Temporal Event-based Neural Network) 아키텍처를 활용해 컨볼루션 연산을 이벤트 기반 희소 처리로 대체하는 설계 방향을 주도하고 있습니다.
2025년 5월 Embedded Vision Summit에서는 "State-Space Models vs Transformers at the Extreme Edge: Architectural Choices for Low Power AI"를 발표하며 SSM 계열이 에너지 제약 환경에서 트랜스포머 대비 갖는 이점을 정리했습니다. 같은 해 Embedded World 2025에서는 TENNs를 이용한 실시간 제스처 인식 시스템을 시연하면서, 모델 아키텍처와 훈련 파이프라인, 하드웨어 구현을 공동 설계(co-design)하는 방법론이 최신 성능을 달성한다는 것을 보였습니다.
트랜스포머 QKV 구조 연구에서는 K=V를 묶는 설계가 QK를 묶는 방식보다 KV 캐시를 50% 절감하면서 혼란도 손실은 3%에 그치는 최적 트레이드오프임을 실험으로 입증했습니다. 이는 IoT·모바일처럼 메모리 대역폭이 병목인 환경을 직접 겨냥합니다.
여담
루이스의 연구 이력은 "두뇌 작동 방식을 기계에 이식한다"는 단일 질문을 수십 년간 붙잡은 흔적입니다. UCLA 시절 사이버네틱스에서 출발해 USC에서 뉴로사이언스-로보틱스를 결합한 박사 연구로 이어졌고, 학계 이후에는 퀄컴, HP, BrainChip으로 차례로 옮기면서 같은 질문을 산업 규모로 실험해 왔습니다. 창업 경험과 스타트업 투자 이력도 갖고 있어 순수 연구자보다 벤처-아카데미아 경계인에 가깝습니다.
BrainChip은 뉴로모픽 AI 칩 분야의 선두 상장사 중 하나로, 루이스가 CTO로 합류한 2023년 이후 학계와의 공동 연구 논문 게재가 눈에 띄게 늘었습니다. 그의 네트워크와 학술 언어를 구사하는 능력이 산업체-학계 협업을 촉진하는 역할을 하는 것으로 보입니다.
주요 논문
- Do Transformers Need Three Projections - Systematic Study of QKV Variants (ICML 2026, 교신 저자)
- "State-Space Models vs Transformers at the Extreme Edge: Architectural Choices for Low Power AI" (Embedded Vision Summit 2025, 발표)
- "Fast Online Recognition of Gestures using Hardware Efficient Spatiotemporal Convolutional Networks via Codesign" (Embedded World 2025)
- Zeroth 뉴로모픽 엔지니어링 프로젝트 관련 다수 특허 및 기술보고서 (퀄컴, 2010년대)
- 뉴로사이언스 기반 보행 로보틱스 시뮬레이션 연구 다수 (애리조나 대학교, 2000년대)