치우쉐루이
개요
치우쉐루이(Xuerui Qiu)는 중국과학원(CASIA) 자동화연구소와 중관촌학원 소속 박사과정생입니다. 궈치 리 교수의 지도 아래 연구하고 있으며, 뉴로모픽 컴퓨팅·컴퓨터비전·LLM 양자화라는 세 축을 오가는 폭넓은 연구 포트폴리오를 갖추고 있습니다.
2024년 전자과기대학교(UESTC)에서 학부를 마쳤습니다. 재학 중 Liang-Jian Deng 교수와 Malu Zhang 교수의 지도를 받았으며, 이 시기부터 스파이킹 신경망(SNN)과 대규모 언어 모델의 접점을 탐색하기 시작했습니다.
2026년 현재 National Science Review(NSR), HYDRA-X(arXiv:2606.13289), SpikeMLLM, NSLLM 등 상위 저널·국제 학회 수준의 연구 성과를 잇달아 발표하고 있습니다. 박사과정 2년차임에도 이미 복수의 제1저자·공동 제1저자 논문을 보유한 신진 연구자입니다.
생애
치우쉐루이는 중국 쓰촨성 출신으로, UESTC에서 학부 과정을 마쳤습니다. UESTC는 전자·통신·AI 분야에서 중국 내 상위권 공대 중 하나로, 이곳에서 기초를 다진 것이 이후 연구의 토대가 되었습니다. 학부 시절부터 Liang-Jian Deng, Malu Zhang 지도 교수와 함께 스파이킹 신경망 관련 프로젝트에 참여했습니다.
2024년 대학원 진학 후에는 중국과학원 자동화연구소에서 궈치 리 교수 팀에 합류했습니다. 중관촌학원과의 공동 소속은 베이징의 AI 산학 생태계에 가까운 연구 환경을 의미합니다. 박사 진학 직후인 2025년 초부터 ICLR 2025, IEEE T-PAMI, AAAI 2025 등에 논문을 게재하기 시작했습니다.
2026년에는 HYDRA-X(arXiv:2606.13289)에서 장궈전, Yutao Cui와 함께 공동 제1저자로 이름을 올렸습니다. 같은 해 국제 학술지 National Science Review에 NSLLM 관련 논문도 공저자로 발표하는 등, 박사과정생으로서 이례적인 속도로 성과를 쌓고 있습니다.
업적
치우쉐루이의 핵심 기여는 크게 세 방향으로 나뉩니다.
첫째, 통합 멀티모달 모델 분야입니다. HYDRA-X(arXiv:2606.13289, 2026)에서는 HYDRA-XTok이라는 전체론적 시각 토크나이저를 설계하고, 잠재 공간 기반 시각 편집 방식인 STI(State Token Injection)를 도입했습니다. 단일 모델에서 이미지·비디오 이해·생성·편집을 통합하는 데 공동 제1저자로서 핵심 역할을 담당했습니다. 앞선 HYDRA 시리즈(arXiv:2603.15228, 2026)에서는 튜블릿 인과 어텐션(tubelet causal attention)과 계층적 2x2 패치파이(hierarchical patchify) 구조로 재구성 품질과 생성 다양성을 동시에 향상시켰습니다.
둘째, 뉴로모픽·스파이킹 언어 모델 분야입니다. NSLLM(National Science Review, 2026)은 스파이킹 신경망(SNN) 기반으로 LLM의 에너지 소비와 해석 가능성 문제를 동시에 다루는 통합 뉴로모픽 프레임워크입니다. SpikeMLLM(arXiv:2604.18610, 2026)은 스파이킹 기반 멀티모달 LLM으로, 모달리티별 시간 스케일과 시간 압축 기법을 도입했습니다.
셋째, 모델 압축·양자화 분야입니다. MASQuant(arXiv:2603.04800, 2026)는 멀티모달 LLM을 위한 모달리티 인식 스무싱 양자화 방법론이며, ICLR 2025에 채택된 양자화 관련 논문도 이 시기의 성과입니다.
여담
박사과정 2년 안에 NSR, HYDRA-X, SpikeMLLM, MASQuant 등 여러 연구를 동시에 진행하는 속도는 중국 AI 연구 그룹의 생산성과 협업 문화를 반영합니다. CASIA 자동화연구소는 중국 내 AI·컴퓨터비전 분야의 핵심 연구 기관 중 하나로, 풍부한 협업 자원이 이런 속도를 가능하게 합니다.
뉴로모픽과 LLM 양자화를 동시에 다루는 연구자는 드뭅니다. 에너지 효율적 AI라는 공통 목표 아래 SNN 기반 접근과 압축 기반 접근을 병행하는 치우쉐루이의 방향은, 온디바이스 AI와 그린 AI 담론이 강해지는 현재 시점에서 주목받는 포지션입니다.
스파이킹 신경망을 대형 언어 모델에 적용하려는 시도는 아직 실용화 수준에는 거리가 있지만, NSLLM과 SpikeMLLM 같은 연구가 이 격차를 좁히는 과정을 잘 보여줍니다.
주요 논문
- "High-Performance Temporal Reversible Spiking Neural Networks with O(L) Training Memory and O(1) Inference Cost" (ICML, 2024)
- "Efficient 3D Recognition with Event-driven Spike Sparse Convolution" (AAAI, 2025)
- 양자화 관련 논문 (ICLR, 2025)
- "Advancing Multimodal Large Language Models with Quantization-Aware Scale Learning" (2025, arXiv:2408.03735)
- "Self-supervised learning" 관련 논문 (IEEE T-PAMI, 2025)
- "FreeAct: Freeing Activations for LLM Quantization" (arXiv:2603.01776, 2026)
- "MASQuant: Modality-Aware Smoothing Quantization for Multimodal Large Language Models" (arXiv:2603.04800, 2026)
- "SpikeMLLM: Spike-based Multimodal Large Language Models via Modality-Specific Temporal Scales and Temporal Compression" (arXiv:2604.18610, 2026)
- HYDRA 시리즈 (arXiv:2603.15228, 2026) -- 통합 멀티모달 시각 토크나이저
- HYDRA-X (arXiv:2606.13289, 2026) -- 공동 제1저자, 교신 저자 왕리민
- NSLLM: 뉴로모픽 스파이킹 기반 LLM 통합 프레임워크 (National Science Review, 2026)