정규화된 확률을 거치지 않고 에너지 표면을 직접 깎는 학습 프레임워크의 정식 정의. 손실 함수의 좋고 나쁨을 마진 조건 하나로 가르고, GTN과 CRF·SVMM을 같은 그릇에 담는다.
태그: 머신러닝
124개의 게시물
-
A Tutorial on Energy-Based Learning 2026-05-24 -
Efficient BackProp 2026-05-241998년 AT&T Bell Labs와 GMD Berlin 팀이 정리한 신경망 학습 트릭 모음. 확률적 경사 하강이 왜 이기는지, 입력 정규화·시그모이드·학습률·초기화·2차 방법을 어떻게 다룰지 한 챕터로 못 박은 책 챕터. 현대 딥러닝 학습 레시피의 출발점입니다.
-
온톨로지, Knowledge Graph, Graph RAG 2026-05-17그래프, 그래프 DB, Knowledge Graph, 온톨로지, Graph RAG, Second Brain. 이름이 비슷한 개념들을 한 줄로 줄세우고, 진짜 차이가 어디에 있는지 정리합니다
-
Vision-Language-Action 모델이 학습하는 reactive observation-to-action 매핑과 World Model 계열의 예측적 dynamics 모델링이 별도의 흐름으로 흘러오다가 한 모델 안에서 합쳐지기 시작했습니다. Fudan 신뢰성 임바디드 AI 연구소가 이 합류 지점을 World Action Models로 명명하고 정의·아키텍처·데이터·평가의 네 축으로 정리한 첫 서베이를 살펴봅니다.
-
전 Cohere VP of Research [[Sara Hooker]]가 공동창업한 Adaption Labs가 첫 제품 AutoScientist를 공개했습니다. 모델 학습·정렬 전체 research loop을 자동화하는 시스템으로, 데이터 큐레이션과 학습 recipe를 동시에 self-improve 합니다. 사내 AI 리서처가 직접 설정한 학습 대비 평균 +35%, win rate는 48%에서 64%로 올랐다고 합니다. 첫 30일 무료, $50M 시드 (Emergence Capital + Mozilla Ventures 리드).
-
Dalal Alharthi 2026-05-14University of Arizona College of Applied Science & Technology의 사이버보안 조교수. UC Irvine 컴퓨터과학 박사. 클라우드 보안과 AI 기반 보안 위협을 함께 다루는 연구자.
-
Ethan David James Parks 2026-05-14University of Arizona 소속 연구자. Predictive Maps of Multi-Agent Reasoning의 1저자로 successor representation을 LLM 멀티에이전트 통신 그래프로 옮긴 분석을 주도.
-
19B 규모 joint audio-video diffusion 모델 LTX-2 위에 RL fine-tuning을 얹어 영상 품질·음향 품질·립싱크를 동시에 끌어올린 OmniNFT를 정리합니다. modality-wise advantage routing, layer-wise gradient surgery, region-wise loss reweighting 세 디자인이 multi-modal RL의 reward hacking 양상을 어떻게 바꾸는지, 그리고 한국 비디오 생성 스타트업·후반 작업 도구 관점에서 어떤 의미를 갖는지 봅니다.
-
멀티에이전트 LLM 시스템의 chain·star·mesh 토폴로지를 추론을 돌리기 전에 단 세 개의 고윳값으로 진단하자는 제안. successor representation을 통신 그래프에 얹어 drift·consensus·robustness를 closed-form으로 풉니다.
-
증류 2026-05-07대형 Teacher 모델의 출력으로 소형 Student 모델을 학습시키는 기법. 비용 효율과 함께 모델 편향이 하위 모델로 조용히 전파되는 통로가 되기도 합니다.
-
WRING - 회전 기반 디바이어싱으로 두더지 잡기 딜레마 풀기 2026-05-05WRING은 모델 구조 훼손을 최소화하고 두더지 잡기 딜레마를 완화합니다. 재학습이 불필요해 실용적입니다.
-
함수적 마진 2026-04-10SVM에서 데이터 포인트와 결정 경계 간의 정규화되지 않은 거리 측도
-
선형 이차 조절기 2026-04-10선형 동역학 시스템에서 이차 비용 함수를 최소화하는 최적 제어기
-
부스팅 2026-04-10약한 학습기를 순차적으로 훈련하여 이전 모델의 오류를 보정하는 앙상블 방법
-
가우시안 커널 2026-04-10두 포인트 간의 유클리드 거리 기반 지수 함수로 정의되는 가장 널리 쓰이는 커널
-
정규화 2026-04-10과적합을 방지하기 위해 손실 함수에 모델 복잡도에 대한 벌점 항을 추가하는 기법
-
분류 2026-04-10입력을 미리 정의된 이산 클래스 중 하나로 예측하는 지도 학습의 한 유형
-
랜덤 포레스트 2026-04-10배깅과 특징 무작위 선택을 결합한 의사결정 트리 앙상블 알고리즘
-
기하학적 마진 2026-04-10SVM에서 데이터 포인트와 결정 초평면 사이의 실제 유클리드 거리
-
가우시안 분포 2026-04-10평균과 분산으로 정의되는 종 모양의 확률 분포
-
차원의 저주 2026-04-10차원이 증가할수록 데이터 희소성, 계산 비용, 거리 의미 손실 등이 기하급수적으로 악화되는 현상
-
대각합 2026-04-10정방 행렬의 주대각선 원소들의 합
-
우도 함수 2026-04-10주어진 매개변수 하에서 관측 데이터가 나타날 확률을 매개변수의 함수로 표현한 것
-
정책 반복 2026-04-10정책 평가와 정책 개선을 교대로 수행하여 최적 정책을 찾는 강화 학습 알고리즘
-
인자 분석 2026-04-10고차원 데이터를 소수의 잠재 요인으로 설명하는 생성 모델
-
잠재 변수 2026-04-10직접 관측되지 않고 다른 변수를 통해 간접적으로 추론되는 숨겨진 변수
-
나이브 베이즈 2026-04-10특징들이 클래스 조건부 독립이라는 단순한 가정으로 분류하는 생성 모델
-
독립 성분 분석 2026-04-10관측된 혼합 신호로부터 통계적으로 독립인 원본 신호를 복원하는 알고리즘
-
오류 분석 2026-04-10모델이 잘못 예측한 사례를 분석해 개선 방향을 도출하는 진단 방법
-
의사결정 트리 2026-04-10데이터를 특징값 기준으로 반복적으로 분기하여 예측하는 트리 구조 모델
-
국소 가중 회귀 2026-04-10예측 시 쿼리 포인트 근처의 훈련 데이터에 더 높은 가중치를 부여하는 비매개변수 회귀
-
편향-분산 트레이드오프 2026-04-10모델의 편향과 분산은 서로 반비례하여, 둘의 균형이 일반화 성능을 결정한다
-
지수족 2026-04-10특정 형태의 확률 분포 패밀리로, GLM의 이론적 토대를 형성하는 분포 집합
-
서포트 벡터 머신 2026-04-10두 클래스를 가장 넓은 마진으로 분리하는 초평면을 찾는 분류 알고리즘
-
다변량 가우시안 분포 2026-04-10다차원 데이터를 모델링하는 가우시안 분포의 다변량 확장
-
표현자 정리 2026-04-10정규화된 손실 최소화 문제의 최적 해가 훈련 데이터의 선형 결합으로 표현된다는 정리
-
베이즈 규칙 2026-04-10사전 확률과 우도를 결합해 사후 확률을 계산하는 확률론의 핵심 정리
-
가치 함수 2026-04-10강화 학습에서 특정 상태 또는 상태-행동 쌍의 장기적인 기댓값을 나타내는 함수
-
슬랙 변수 2026-04-10소프트 마진 SVM에서 마진 제약 조건의 위반을 허용하기 위해 도입하는 변수
-
일반화 선형 모델 2026-04-10지수족 분포를 가정하고 선형 예측자를 연결 함수로 변환하는 통합 모델 프레임워크
-
학습 곡선 2026-04-10훈련 데이터 크기 변화에 따른 훈련/검증 오류를 시각화하여 편향-분산 문제를 진단하는 도구
-
강화 학습 2026-04-10환경과 상호작용하며 보상을 최대화하는 정책을 학습하는 머신러닝 패러다임
-
K-겹 교차 검증 2026-04-10데이터를 K개의 폴드로 나눠 K번 반복 검증하는 교차 검증 방법
-
이산화 2026-04-10연속 상태 공간을 유한한 이산 격자로 나눠 표 형태의 강화 학습을 적용하는 기법
-
소프트맥스 회귀 2026-04-10로지스틱 회귀를 다중 클래스로 확장한 분류 알고리즘
-
비지도 학습 2026-04-10레이블 없이 데이터의 숨겨진 구조를 발견하는 머신러닝 패러다임
-
칵테일 파티 문제 2026-04-10여러 신호가 섞인 혼합 신호에서 원본 신호를 분리하는 신호 분리 문제
-
교차 검증 2026-04-10데이터를 여러 방식으로 분할해 모델 성능을 더 신뢰있게 추정하는 검증 방법
-
가치 반복 2026-04-10벨만 방정식을 반복 적용하여 최적 가치 함수를 구하는 동적 프로그래밍 알고리즘
-
뉴턴 방법 2026-04-10이차 미분(헤시안)을 활용해 경사 하강법보다 빠르게 최적점에 수렴하는 최적화 알고리즘
-
마르코프 결정 과정 2026-04-10상태, 행동, 전이 확률, 보상으로 구성되는 강화 학습의 수학적 프레임워크
-
좌표 상승 2026-04-10한 번에 하나의 매개변수만 최적화하면서 전체 목적 함수를 반복적으로 최대화하는 방법
-
라플라스 스무딩 2026-04-10확률 추정 시 훈련 데이터에 없는 범주에도 작은 확률을 할당하는 스무딩 기법
-
퍼셉트론 2026-04-10입력의 선형 결합에 계단 함수를 적용하는 가장 단순한 선형 분류기
-
조건부 독립 2026-04-10제3의 변수가 주어졌을 때 두 변수가 통계적으로 독립이 되는 관계
-
행렬 2026-04-10수를 직사각형 배열로 나열한 수학적 구조로, 선형 변환과 데이터 표현의 기본 도구
-
지도 학습 2026-04-10레이블이 있는 데이터로 입력-출력 관계를 학습하는 머신러닝 패러다임
-
클러스터링 2026-04-10레이블 없이 유사한 데이터 포인트를 같은 그룹(클러스터)으로 묶는 비지도 학습 과제
-
배깅 2026-04-10부트스트랩으로 만든 여러 데이터 샘플로 독립적인 모델을 훈련한 뒤 결합하는 앙상블 방법
-
PCA 2026-04-10데이터의 분산을 최대한 보존하는 직교 축(주성분)을 찾아 차원을 축소하는 알고리즘
-
머서 정리 2026-04-10함수가 유효한 커널이 되기 위한 필요충분조건을 제시하는 정리
-
가우시안 혼합 모델 2026-04-10데이터가 여러 가우시안 분포의 혼합에서 생성되었다고 가정하는 확률적 클러스터링 모델
-
가우시안 판별 분석 2026-04-10각 클래스의 특징 분포를 다변량 가우시안으로 모델링하는 생성 분류 알고리즘
-
로지스틱 회귀 2026-04-10시그모이드 함수를 이용해 이진 분류 확률을 출력하는 선형 분류 알고리즘
-
벨만 방정식 2026-04-10현재 상태의 가치를 즉각 보상과 다음 상태 가치의 합으로 재귀적으로 표현하는 방정식
-
K-평균 클러스터링 2026-04-10데이터를 K개의 클러스터로 분할하는 대표적인 비지도 학습 알고리즘
-
ALVINN 2026-04-101989년 개발된 자율 주행 신경망으로, 머신러닝 역사의 초기 사례 중 하나
-
직접 정책 탐색 2026-04-10가치 함수를 거치지 않고 정책 매개변수를 직접 최적화하는 강화 학습 접근법
-
적합 가치 반복 2026-04-10연속 상태 공간에서 가치 함수를 함수 근사기로 표현하는 강화 학습 알고리즘
-
커널 트릭 2026-04-10고차원 특징 공간으로의 명시적 매핑 없이 내적을 커널 함수로 대체하는 기법
-
그래디언트 부스팅 2026-04-10손실 함수의 음의 그래디언트(잔차)를 타겟으로 약학습기를 순차 추가하는 부스팅 방법
-
XGBoost 2026-04-10그래디언트 부스팅의 확장으로, 정규화와 병렬화를 통해 속도와 성능을 개선한 구현체
-
최대 우도 추정 2026-04-10관측 데이터의 우도를 최대화하는 모델 매개변수를 추정하는 방법
-
EM 알고리즘 2026-04-10잠재 변수가 있는 모델에서 최대 우도 추정을 반복적으로 수행하는 알고리즘
-
커널 2026-04-10두 데이터 포인트 간의 유사도를 측정하는 함수로, 고차원 매핑 없이 비선형 학습을 가능하게 함
-
교차 엔트로피 2026-04-10두 확률 분포 간의 차이를 측정하는 손실 함수로, 분류 문제에서 표준적으로 사용
-
아핀 함수 2026-04-10선형 변환에 상수 항(편향)을 더한 함수
-
최소제곱법 2026-04-10예측값과 실제값의 제곱 오차 합을 최소화하여 모델 매개변수를 추정하는 방법
-
부분 관측 마르코프 결정 과정 2026-04-10에이전트가 환경의 완전한 상태를 관측할 수 없는 강화 학습 프레임워크
-
시그모이드 함수 2026-04-10실수 입력을 (0, 1) 구간으로 압축하는 S자형 활성화 함수
-
회귀 2026-04-10연속적인 출력값을 예측하는 지도 학습의 한 유형
-
맷플롯립 기능 명단 2025-04-05Python의 대표적인 데이터 시각화 라이브러리인 Matplotlib(맷플롯립)의 핵심 기능을 정리한 문서입니다. 기본 그래프 생성부터 커스터마이징, 서브플롯, 고급 그래프, 스타일링 등 필수 사용법을 코드 예제와 함께 제공하여 원하는 차트를 빠르게 만들 수 있도록 돕습니다.
-
Google Colab에서 Kaggle 설정하기 2025-04-05데이터 사이언스 프로젝트 환경 구성을 위해 Google Colab에서 Kaggle API와 Git/Github를 설정하는 방법을 안내합니다. 각 서비스의 계정 생성부터 Colab에서 Kaggle 데이터셋을 다운로드하기 위한 API 연동 과정까지 단계별로 설명합니다.
-
Kaggle API 사용법 2025-04-05Kaggle API의 설치 및 사용법을 정리한 가이드입니다. API 토큰 설정 방법부터 CLI 또는 Python 코드를 사용하여 데이터셋과 대회 데이터를 다운로드하는 등 주요 기능을 예제와 함께 설명하여 Kaggle 환경 외부에서의 활용을 돕습니다.
-
넘파이 기능 명단 2025-04-05Python의 핵심 과학 계산 라이브러리인 NumPy(넘파이)의 주요 기능을 정리한 문서입니다. 배열 생성, 연산, 인덱싱, 변형, 통계 함수, 난수 생성 등 필수적인 NumPy 사용법을 코드 예제와 함께 제공하여 빠르게 찾아볼 수 있도록 돕습니다.
-
머신러닝 체크리스트 2025-04-05머신러닝 프로젝트의 전체 과정을 체계적으로 관리하기 위한 체크리스트입니다. 프로젝트 개요부터 데이터 탐색, 시각화, 모델링, 배포, 그리고 유지보수까지 각 단계에서 수행해야 할 주요 항목들을 정리하여 성공적인 프로젝트 완수를 돕습니다.
-
판다스 기능 명단 2025-04-05Python 데이터 분석 라이브러리 Pandas(판다스)의 핵심 기능 요약 문서입니다. Series와 DataFrame 생성, loc, iloc, 불린 인덱싱 등 데이터 선택 및 수정을 위한 주요 기법들을 코드 예제와 함께 제공하여 빠른 참조를 돕습니다.
-
사이킷런 라이브러리 기능 명단 2025-04-05Python 머신러닝 라이브러리 Scikit-learn(사이킷런)의 핵심 기능을 정리한 치트시트입니다. 데이터 전처리, 모델링, 평가 등 머신러닝 워크플로 각 단계별 주요 모듈과 클래스를 코드로 제공하여 빠른 참조를 돕습니다.
-
Google Research NYC Algorithms 팀 Research Scientist, 스케칭·스트리밍 알고리즘 이론 전문가
-
Google Research의 KV cache 6× 압축 알고리즘, ICLR 2026 발표, 학습 없이 3-bit 양자화에 정확도 손실 zero
-
스탠퍼드 CME295 트랜스포머와 LLM 강의 공동 강사, 치트시트 시리즈 제작자
-
Willamette 대학교 전산학과 교수, 신경망 학습 동역학 연구자, Neural Networks - Tricks of the Trade 공동 편집자
-
SVM 공동 발명자, UC Berkeley EECS 교수, MEMS 센서 회로 권위자
-
Meta가 2026년 4월 공개한 첫 사유 AI 모델, Llama 라인업을 대체하는 Meta Superintelligence Labs의 첫 결과물
-
USTC 자동화학과 정교수이자 컴퓨터 비전·대규모 멀티모달 모델 연구 그룹 지도교수. OmniNFT의 교신 저자로 [[Guohui Zhang]]·[[Hu Yu]] 등 1저자 학생들의 시각 생성 + RL 라인을 총괄.
-
JD.COM VP이자 JD Explore Academy Vision and Multimodal Lab 디렉터. 마이크로소프트 리서치 아시아 NLP 그룹 시니어 프린시펄 리서처, StepFun Technical Fellow를 거쳐 합류. NLP·코드 인텔리전스·멀티모달 파운데이션 모델·AI 에이전트 분야 시니어 저자.
-
Google Fellow & VP, Google Research Algorithms & Optimization 총괄, Gemini Data Area Lead
-
USTC 박사과정. [[Feng Zhao]] 연구실에서 image restoration·diffusion·flow-based generative model을 연구. OmniNFT 공저자.
-
DrLIM·연속 학습·로봇 RL의 권위자, Google DeepMind VP of Research, 인문학 학부에서 ML 박사로 전환한 이력
-
수학 LLM·자동 증명 분야 핵심 연구자, CMU LTI 조교수, DARPA expMath PI
-
텍스트나 이미지 같은 입력을 의미가 보존된 고차원 실수 벡터로 변환한 표현
-
AI 모델 효율성·공정성 연구로 알려진 컴퓨터 과학자, Cohere For AI 전 VP, Adaption Labs 공동 창업자 겸 CEO
-
독일 TU Berlin 머신러닝 학과 학과장, 커널 방법·BCI·설명 가능한 AI 연구 권위자
-
모델 가중치의 정밀도를 낮춰 크기와 속도를 개선하는 압축 기법
-
Self-RAG 저자, RAG·검색 보강 LM 분야 대표 연구자, University of Washington NLP PhD
-
USTC 박사과정. masked image generation·autoregressive image generation에 GRPO 계열 정책 최적화를 적용해온 1저자로, OmniNFT에서는 joint audio-video diffusion으로 RL 프레임워크를 확장.
-
Lightricks가 공개한 19B 파라미터 규모의 joint audio-video foundation model. asymmetric dual-stream(비디오·오디오) 구조에 bidirectional cross-attention으로 modality imbalance를 처리. OmniNFT의 backbone으로 사용됨.
-
USC 부교수 + Google Research 파트타임 연구자, 신뢰 가능한 대규모 최적화 알고리즘 전문가
-
UC Berkeley 교수, 로봇공학 및 강화학습 분야 세계적 전문가
-
사전 학습된 모델을 특정 태스크나 도메인에 맞게 추가 학습하는 방법
-
워터셰드 분할과 segmentation tree 이론의 권위자, ESIEE Paris 정교수, 수리형태학 표준 교과서 공저자
-
스탠퍼드 CS229 교수, Coursera 공동 창립자, deeplearning.ai 설립자
-
Google DeepMind CEO, 2024년 노벨 화학상 수상자
-
JD Explore Academy 연구원. CVPR 2024 YOLO-World(Real-Time Open-Vocabulary Object Detection)의 공동·교신 저자로 알려진 비전 연구자. OmniNFT의 프로젝트 리더.
-
확률적 경사 하강법(SGD)의 실용화를 이끈 프랑스계 머신러닝 연구자, Meta FAIR 시니어 연구원
-
UCLA CS Associate Professor, PLUSLAB 디렉터, controllable·creative natural language generation 분야 NSF CAREER 수상자
-
Siamese 네트워크용 contrastive loss를 도입한 인도 출신 머신러닝 연구자, 현재 NYU Courant + Grossman School of Medicine 정교수
-
JD.COM 산하 AI 연구 조직. Vision and Multimodal Lab을 [[Nan Duan]] 디렉터가 이끌고 있으며, 비전·멀티모달 파운데이션 모델과 비디오 생성 라인을 외부 대학(USTC 등)과 공동 연구.
-
미국 수학자·전산학자. 노스이스턴대 교수. 역전파 1986 Nature 논문 3저자이자 REINFORCE 정책 그래디언트의 창시자.
-
2025년 Mark Zuckerberg가 Meta 내부에 신설한 AI 연구 조직, Alexandr Wang이 이끌며 Muse Spark가 첫 결과물
-
스탠퍼드 CS229 딥러닝 파트 강사
-
중국과학원 자동화연구소(CASIA) 정교수이자 패턴인식국가중점실험실(NLPR) 시각 감시·추적 분야 시니어 PI
-
인지과학자, UCSD PDP 그룹의 중심 인물. 역전파 1986 Nature 논문 1저자이자 connectionism의 설계자.
-
UCLA CS Associate Professor, Amazon Scholar, VisualBERT·GLIP 등 비전-언어 모델과 NLP 편향 연구로 알려짐