행렬
행렬
행렬(Matrix)은 수를 행(row)과 열(column)의 직사각형 배열로 나열한 수학적 구조이다. 머신러닝에서 데이터셋, 선형 변환, 가중치 등을 표현하는 기본 도구이다.
핵심
- \(m \times n\) 행렬 \(A\)는 \(m\)개의 행과 \(n\)개의 열을 갖는다
- 행렬 곱셈 \(C = AB\): \((C)_{ij} = \sum_k A_{ik}B_{kj}\)
- 전치 행렬 \(A^T\): 행과 열을 바꾼 행렬
- 역행렬 \(A^{-1}\): \(AA^{-1} = I\)를 만족하는 행렬 (정방 비특이 행렬에만 존재)
- 신경망의 각 층은 가중치 행렬로 표현되며, 순전파는 행렬 곱셈의 연속이다
수식
정규 방정식에서의 행렬 표현: \(\theta = (X^TX)^{-1}X^Ty\)