데이터를 특징값 기준으로 반복적으로 분기하여 예측하는 트리 구조 모델
태그: 머신러닝
82개의 게시물
-
의사결정 트리 2026-04-10 -
그래디언트 부스팅 2026-04-10손실 함수의 음의 그래디언트(잔차)를 타겟으로 약학습기를 순차 추가하는 부스팅 방법
-
부스팅 2026-04-10약한 학습기를 순차적으로 훈련하여 이전 모델의 오류를 보정하는 앙상블 방법
-
이산화 2026-04-10연속 상태 공간을 유한한 이산 격자로 나눠 표 형태의 강화 학습을 적용하는 기법
-
잠재 변수 2026-04-10직접 관측되지 않고 다른 변수를 통해 간접적으로 추론되는 숨겨진 변수
-
EM 알고리즘 2026-04-10잠재 변수가 있는 모델에서 최대 우도 추정을 반복적으로 수행하는 알고리즘
-
클러스터링 2026-04-10레이블 없이 유사한 데이터 포인트를 같은 그룹(클러스터)으로 묶는 비지도 학습 과제
-
슬랙 변수 2026-04-10소프트 마진 SVM에서 마진 제약 조건의 위반을 허용하기 위해 도입하는 변수
-
직접 정책 탐색 2026-04-10가치 함수를 거치지 않고 정책 매개변수를 직접 최적화하는 강화 학습 접근법
-
K-평균 클러스터링 2026-04-10데이터를 K개의 클러스터로 분할하는 대표적인 비지도 학습 알고리즘
-
퍼셉트론 2026-04-10입력의 선형 결합에 계단 함수를 적용하는 가장 단순한 선형 분류기
-
아핀 함수 2026-04-10선형 변환에 상수 항(편향)을 더한 함수
-
서포트 벡터 머신 2026-04-10두 클래스를 가장 넓은 마진으로 분리하는 초평면을 찾는 분류 알고리즘
-
인자 분석 2026-04-10고차원 데이터를 소수의 잠재 요인으로 설명하는 생성 모델
-
국소 가중 회귀 2026-04-10예측 시 쿼리 포인트 근처의 훈련 데이터에 더 높은 가중치를 부여하는 비매개변수 회귀
-
함수적 마진 2026-04-10SVM에서 데이터 포인트와 결정 경계 간의 정규화되지 않은 거리 측도
-
편향-분산 트레이드오프 2026-04-10모델의 편향과 분산은 서로 반비례하여, 둘의 균형이 일반화 성능을 결정한다
-
시그모이드 함수 2026-04-10실수 입력을 (0, 1) 구간으로 압축하는 S자형 활성화 함수
-
기하학적 마진 2026-04-10SVM에서 데이터 포인트와 결정 초평면 사이의 실제 유클리드 거리
-
커널 트릭 2026-04-10고차원 특징 공간으로의 명시적 매핑 없이 내적을 커널 함수로 대체하는 기법
-
라플라스 스무딩 2026-04-10확률 추정 시 훈련 데이터에 없는 범주에도 작은 확률을 할당하는 스무딩 기법
-
선형 이차 조절기 2026-04-10선형 동역학 시스템에서 이차 비용 함수를 최소화하는 최적 제어기
-
독립 성분 분석 2026-04-10관측된 혼합 신호로부터 통계적으로 독립인 원본 신호를 복원하는 알고리즘
-
베이즈 규칙 2026-04-10사전 확률과 우도를 결합해 사후 확률을 계산하는 확률론의 핵심 정리
-
배깅 2026-04-10부트스트랩으로 만든 여러 데이터 샘플로 독립적인 모델을 훈련한 뒤 결합하는 앙상블 방법
-
표현자 정리 2026-04-10정규화된 손실 최소화 문제의 최적 해가 훈련 데이터의 선형 결합으로 표현된다는 정리
-
일반화 선형 모델 2026-04-10지수족 분포를 가정하고 선형 예측자를 연결 함수로 변환하는 통합 모델 프레임워크
-
커널 2026-04-10두 데이터 포인트 간의 유사도를 측정하는 함수로, 고차원 매핑 없이 비선형 학습을 가능하게 함
-
뉴턴 방법 2026-04-10이차 미분(헤시안)을 활용해 경사 하강법보다 빠르게 최적점에 수렴하는 최적화 알고리즘
-
로지스틱 회귀 2026-04-10시그모이드 함수를 이용해 이진 분류 확률을 출력하는 선형 분류 알고리즘
-
K-겹 교차 검증 2026-04-10데이터를 K개의 폴드로 나눠 K번 반복 검증하는 교차 검증 방법
-
가우시안 혼합 모델 2026-04-10데이터가 여러 가우시안 분포의 혼합에서 생성되었다고 가정하는 확률적 클러스터링 모델
-
나이브 베이즈 2026-04-10특징들이 클래스 조건부 독립이라는 단순한 가정으로 분류하는 생성 모델
-
가치 함수 2026-04-10강화 학습에서 특정 상태 또는 상태-행동 쌍의 장기적인 기댓값을 나타내는 함수
-
정책 반복 2026-04-10정책 평가와 정책 개선을 교대로 수행하여 최적 정책을 찾는 강화 학습 알고리즘
-
가우시안 판별 분석 2026-04-10각 클래스의 특징 분포를 다변량 가우시안으로 모델링하는 생성 분류 알고리즘
-
가우시안 분포 2026-04-10평균과 분산으로 정의되는 종 모양의 확률 분포
-
랜덤 포레스트 2026-04-10배깅과 특징 무작위 선택을 결합한 의사결정 트리 앙상블 알고리즘
-
강화 학습 2026-04-10환경과 상호작용하며 보상을 최대화하는 정책을 학습하는 머신러닝 패러다임
-
XGBoost 2026-04-10그래디언트 부스팅의 확장으로, 정규화와 병렬화를 통해 속도와 성능을 개선한 구현체
-
벨만 방정식 2026-04-10현재 상태의 가치를 즉각 보상과 다음 상태 가치의 합으로 재귀적으로 표현하는 방정식
-
대각합 2026-04-10정방 행렬의 주대각선 원소들의 합
-
최대 우도 추정 2026-04-10관측 데이터의 우도를 최대화하는 모델 매개변수를 추정하는 방법
-
우도 함수 2026-04-10주어진 매개변수 하에서 관측 데이터가 나타날 확률을 매개변수의 함수로 표현한 것
-
ALVINN 2026-04-101989년 개발된 자율 주행 신경망으로, 머신러닝 역사의 초기 사례 중 하나
-
조건부 독립 2026-04-10제3의 변수가 주어졌을 때 두 변수가 통계적으로 독립이 되는 관계
-
정규화 2026-04-10과적합을 방지하기 위해 손실 함수에 모델 복잡도에 대한 벌점 항을 추가하는 기법
-
다변량 가우시안 분포 2026-04-10다차원 데이터를 모델링하는 가우시안 분포의 다변량 확장
-
학습 곡선 2026-04-10훈련 데이터 크기 변화에 따른 훈련/검증 오류를 시각화하여 편향-분산 문제를 진단하는 도구
-
가치 반복 2026-04-10벨만 방정식을 반복 적용하여 최적 가치 함수를 구하는 동적 프로그래밍 알고리즘
-
가우시안 커널 2026-04-10두 포인트 간의 유클리드 거리 기반 지수 함수로 정의되는 가장 널리 쓰이는 커널
-
머서 정리 2026-04-10함수가 유효한 커널이 되기 위한 필요충분조건을 제시하는 정리
-
좌표 상승 2026-04-10한 번에 하나의 매개변수만 최적화하면서 전체 목적 함수를 반복적으로 최대화하는 방법
-
PCA 2026-04-10데이터의 분산을 최대한 보존하는 직교 축(주성분)을 찾아 차원을 축소하는 알고리즘
-
칵테일 파티 문제 2026-04-10여러 신호가 섞인 혼합 신호에서 원본 신호를 분리하는 신호 분리 문제
-
비지도 학습 2026-04-10레이블 없이 데이터의 숨겨진 구조를 발견하는 머신러닝 패러다임
-
최소제곱법 2026-04-10예측값과 실제값의 제곱 오차 합을 최소화하여 모델 매개변수를 추정하는 방법
-
교차 검증 2026-04-10데이터를 여러 방식으로 분할해 모델 성능을 더 신뢰있게 추정하는 검증 방법
-
차원의 저주 2026-04-10차원이 증가할수록 데이터 희소성, 계산 비용, 거리 의미 손실 등이 기하급수적으로 악화되는 현상
-
부분 관측 마르코프 결정 과정 2026-04-10에이전트가 환경의 완전한 상태를 관측할 수 없는 강화 학습 프레임워크
-
지도 학습 2026-04-10레이블이 있는 데이터로 입력-출력 관계를 학습하는 머신러닝 패러다임
-
행렬 2026-04-10수를 직사각형 배열로 나열한 수학적 구조로, 선형 변환과 데이터 표현의 기본 도구
-
마르코프 결정 과정 2026-04-10상태, 행동, 전이 확률, 보상으로 구성되는 강화 학습의 수학적 프레임워크
-
분류 2026-04-10입력을 미리 정의된 이산 클래스 중 하나로 예측하는 지도 학습의 한 유형
-
오류 분석 2026-04-10모델이 잘못 예측한 사례를 분석해 개선 방향을 도출하는 진단 방법
-
소프트맥스 회귀 2026-04-10로지스틱 회귀를 다중 클래스로 확장한 분류 알고리즘
-
회귀 2026-04-10연속적인 출력값을 예측하는 지도 학습의 한 유형
-
적합 가치 반복 2026-04-10연속 상태 공간에서 가치 함수를 함수 근사기로 표현하는 강화 학습 알고리즘
-
지수족 2026-04-10특정 형태의 확률 분포 패밀리로, GLM의 이론적 토대를 형성하는 분포 집합
-
교차 엔트로피 2026-04-10두 확률 분포 간의 차이를 측정하는 손실 함수로, 분류 문제에서 표준적으로 사용
-
판다스 기능 명단 2025-04-05Python 데이터 분석 라이브러리 Pandas(판다스)의 핵심 기능 요약 문서입니다. Series와 DataFrame 생성, loc, iloc, 불린 인덱싱 등 데이터 선택 및 수정을 위한 주요 기법들을 코드 예제와 함께 제공하여 빠른 참조를 돕습니다.
-
넘파이 기능 명단 2025-04-05Python의 핵심 과학 계산 라이브러리인 NumPy(넘파이)의 주요 기능을 정리한 문서입니다. 배열 생성, 연산, 인덱싱, 변형, 통계 함수, 난수 생성 등 필수적인 NumPy 사용법을 코드 예제와 함께 제공하여 빠르게 찾아볼 수 있도록 돕습니다.
-
맷플롯립 기능 명단 2025-04-05Python의 대표적인 데이터 시각화 라이브러리인 Matplotlib(맷플롯립)의 핵심 기능을 정리한 문서입니다. 기본 그래프 생성부터 커스터마이징, 서브플롯, 고급 그래프, 스타일링 등 필수 사용법을 코드 예제와 함께 제공하여 원하는 차트를 빠르게 만들 수 있도록 돕습니다.
-
Kaggle API 사용법 2025-04-05Kaggle API의 설치 및 사용법을 정리한 가이드입니다. API 토큰 설정 방법부터 CLI 또는 Python 코드를 사용하여 데이터셋과 대회 데이터를 다운로드하는 등 주요 기능을 예제와 함께 설명하여 Kaggle 환경 외부에서의 활용을 돕습니다.
-
사이킷런 라이브러리 기능 명단 2025-04-05Python 머신러닝 라이브러리 Scikit-learn(사이킷런)의 핵심 기능을 정리한 치트시트입니다. 데이터 전처리, 모델링, 평가 등 머신러닝 워크플로 각 단계별 주요 모듈과 클래스를 코드로 제공하여 빠른 참조를 돕습니다.
-
Google Colab에서 Kaggle 설정하기 2025-04-05데이터 사이언스 프로젝트 환경 구성을 위해 Google Colab에서 Kaggle API와 Git/Github를 설정하는 방법을 안내합니다. 각 서비스의 계정 생성부터 Colab에서 Kaggle 데이터셋을 다운로드하기 위한 API 연동 과정까지 단계별로 설명합니다.
-
머신러닝 체크리스트 2025-04-05머신러닝 프로젝트의 전체 과정을 체계적으로 관리하기 위한 체크리스트입니다. 프로젝트 개요부터 데이터 탐색, 시각화, 모델링, 배포, 그리고 유지보수까지 각 단계에서 수행해야 할 주요 항목들을 정리하여 성공적인 프로젝트 완수를 돕습니다.
-
스탠퍼드 CS229 딥러닝 파트 강사
-
UC Berkeley 교수, 로봇공학 및 강화학습 분야 세계적 전문가
-
스탠퍼드 CME295 트랜스포머와 LLM 강의 공동 강사, 치트시트 시리즈 제작자
-
스탠퍼드 CS229 교수, Coursera 공동 창립자, deeplearning.ai 설립자
-
Google DeepMind CEO, 2024년 노벨 화학상 수상자