RoPE

🏷️ 정보 LLM

RoPE

RoPE(Rotary Position Embeddings)는 토큰의 위치 정보를 임베딩에 더하는 대신, 쿼리와 키 벡터에 회전 행렬을 적용하여 토큰 쌍 간의 상대 위치 거리가 내적에 자연스럽게 반영되게 하는 위치 인코딩 방법이다.

핵심

수식

\[\text{RoPE}(q, m) = R_m q = \begin{pmatrix}\cos m\theta \\ \sin m\theta\end{pmatrix} \otimes q \text{ (per 2D block)}\]