이전 시간 단계의 은닉 상태를 현재 입력과 함께 처리하여 순서가 있는 데이터를 모델링하는 신경망
태그: 딥러닝
23개의 게시물
-
순환 신경망 2026-04-10 -
확산 모델 2026-04-10노이즈 추가(순방향)와 노이즈 제거(역방향) 과정을 학습하여 데이터를 생성하는 생성 모델
-
LSTM 2026-04-10게이트 메커니즘으로 장거리 의존성 문제를 해결한 RNN의 개선 모델
-
역전파 2026-04-10신경망에서 연쇄 법칙을 이용해 각 매개변수의 그래디언트를 효율적으로 계산하는 알고리즘
-
ReLU 2026-04-10음수 입력을 0으로 만들고 양수 입력은 그대로 통과시키는 신경망 활성화 함수
-
기울기 소실 2026-04-10역전파 중 그래디언트가 초기 층으로 전달될수록 지수적으로 작아져 학습이 안 되는 문제
-
미니 배치 경사 하강법 2026-04-10전체 데이터를 작은 배치로 나눠 배치마다 그래디언트를 계산하고 가중치를 업데이트하는 최적화 방법
-
종단간 학습 2026-04-10원시 입력에서 최종 출력까지 중간 처리 단계 없이 단일 모델로 학습하는 방식
-
내부 공변량 이동 2026-04-10신경망 학습 중 이전 층의 매개변수 변화로 인해 각 층의 입력 분포가 지속적으로 변하는 현상
-
AI 과학자 Kosmos를 소개합니다. 데이터와 연구 목표를 주면 자동으로 논문을 읽고, 데이터를 분석하고, 가설을 생성해 과학 보고서를 작성합니다. 6개월간 인간 연구자가 수행할 작업을 하루에 끝내고 모든 단계가 투명하게 공개됩니다. 신경생물학, 재료과학, 통계유전학등 다양한 분야에서 실제 발견을 만들어냈습니다.
-
The Free Transformer 2025-10-27|-
-
LLM Tokenization 정리 2025-09-13LLM이 텍스트를 이해하는 첫 단계인 토큰화(Tokenization)의 다양한 방법을 정리합니다. 단어, 문자, 서브워드(BPE, WordPiece), SentencePiece 등 주요 토큰화 기법의 원리와 장단점을 비교하고, 모델 성능에 미치는 영향을 설명합니다.
-
스탠퍼드 CME295 트랜스포머와 LLM 강의 공동 강사
-
CNN의 아버지, 2018 튜링상, 현재 AMI Labs
-
UC Berkeley 교수, 로봇공학 및 강화학습 분야 세계적 전문가
-
NVIDIA 공동 창립자이자 CEO, GPU 기반 AI 컴퓨팅 혁명의 주역
-
Anthropic 공동 창립자, 신경망 해석가능성 분야 선구적 연구자
-
Anthropic 공동 창립자이자 수석 과학자, 스케일링 법칙 핵심 저자
-
Tesla AI 디렉터 출신 AI 교육자, Eureka Labs 설립자
-
스탠퍼드 CS229 딥러닝 파트 강사
-
SSI 공동 창립자이자 CEO, OpenAI 전 수석 과학자
-
Google DeepMind CEO, 2024년 노벨 화학상 수상자
-
스탠퍼드 CS229 교수, Coursera 공동 창립자, deeplearning.ai 설립자