Cha Jinwoo - 태그: 머신러닝

Multi-Resolution Flow Matching - Training-Free Diffusion Acceleration via Staged Sampling 2026-07-05

재훈련 없이 FLUX·Qwen-Image 같은 플로우 매칭 확산 모델을 10× 가속하는 MrFlow를 제안합니다. 초반 스텝은 저해상도 잠재 공간에서 처리하고, 픽셀 공간 GAN 슈퍼해상도를 거쳐 단 1스텝 고해상도 정제로 마무리하는 단계별 파이프라인입니다.

ELDR - Expert-Locality-Aware Decode Routing for PD-Disaggregated MoE Serving 2026-07-05

PD 분리(Prefill-Decode 분리) 환경에서 MoE 모델의 decode 지연을 5.9-13.9% 줄이는 ELDR을 제안합니다. Prefill 단계의 전문가 활성화 패턴(서명)을 활용해, 이미 해당 전문가 가중치를 캐시한 워커로 decode 요청을 라우팅합니다.

In-Context World Modeling for Robotic Control 2026-06-29

VLA 모델이 새로운 카메라 시점에서 실패하는 원인을 시스템 식별 문제로 재정의하고, 랜덤 탐색 행동 몇 가지를 컨텍스트로 주입해 파라미터 업데이트 없이 적응하는 ICWM 프레임워크를 제안합니다.

LIBERO 2026-06-29

로봇 조작의 평생학습과 지식 전이를 평가하는 벤치마크. 공간·물체·목표·장기 네 개 태스크 수트로 구성됩니다.

Qwen-AgentWorld - Language World Models for General Agents 2026-06-26

Qwen 팀이 7개 에이전트 도메인을 단일 모델로 시뮬레이션하는 언어 세계 모델 Qwen-AgentWorld를 공개했습니다. 환경을 예측하는 세계 모델 훈련이 에이전트 강화학습의 새 축이 될 수 있음을 실험으로 보입니다.

Unlimited OCR Works - Welcome the Era of One-shot Long-horizon Parsing 2026-06-25

DeepSeek OCR 디코더의 모든 어텐션을 R-SWA로 교체해 KV 캐시를 상수로 유지. 단일 forward pass로 수십 페이지 문서를 파싱하고 OmniDocBench v1.6 SOTA 93.92% 달성.

ACE-Ego-0 - Unifying Egocentric Human and Robotic Data for VLA Pretraining 2026-06-24

로봇 조작 데이터가 비싸고 편향된 문제를 인간 1인칭 영상 1,478시간으로 보완한 VLA 사전학습 프레임워크. 공간·구조·시간 세 축의 표현 통합과 신뢰도 가중 보조 손실로 RoboCasa, RoboTwin 2.0 모두에서 최고 성능을 달성했습니다.

Looped World Models 2026-06-21

파라미터를 공유하는 단일 트랜스포머 블록을 반복 적용해 환경 상태를 정제하는 세계 모델. 1B 파라미터로 claude-opus-4-6-max 대비 ScienceWorld EM +21.2%p를 달성하며, 잠재 깊이를 새로운 스케일링 축으로 제안합니다.

존 점퍼가 Anthropic에 합류합니다 2026-06-20

알파폴드2로 2024년 노벨 화학상을 받은 존 점퍼(John Jumper)가 구글 DeepMind를 떠나 Anthropic에 합류합니다.

VibeThinker-3B - Exploring the Frontier of Verifiable Reasoning in Small Language Models 2026-06-19

Sina Weibo의 9인 연구팀이 3B 파라미터만으로 DeepSeek V3.2(671B), Kimi K2.5(1T) 수준의 수학 추론 성능을 달성한 방법. Spectrum-to-Signal Principle 기반 5단계 포스트트레이닝 레시피와, 검증 가능한 추론이 지식 저장보다 파라미터 효율이 높다는 Parametric Compression-Coverage Hypothesis를 제안합니다.

From AGI to ASI 2026-06-17

AGI 이후의 세계를 다룬 Google DeepMind의 분석 보고서. Legg-Hutter 점수로 AGI/ASI/UAI를 형식적으로 구분하고, 네 가지 경로(스케일링·패러다임 전환·재귀적 자기 개선·멀티에이전트 집합)와 여섯 가지 병목을 체계적으로 분석합니다.

On the Scaling of PEFT - Towards Million Personal Models of Trillion Parameters 2026-06-16

PEFT를 비용 절감 수단이 아닌 수백만 개의 퍼스널 모델을 운용하는 스케일링 메커니즘으로 재정의한 Mind Lab의 연구입니다. Scale Up, Scale Down, Scale Out 세 축의 의존 구조와 MinT 인프라를 제시합니다.

Flourish - 뇌를 역설계해 AI 전력 위기를 푸는 스타트업 2026-06-10

베이조스와 GV, Lux가 5억 달러를 댄 브레인 인스파이어드 AI 스타트업 Flourish. 커넥토믹스로 뇌의 핵심 알고리즘을 찾아 20~50W로 돌아가는 AI를 만들겠다는, 스케일링 대신 뇌 모방이라는 베팅을 짚어봅니다.

Parameter Golf 2026-06-10

16MB 이하 모델을 10분 안에 8개 H100에서 최적화하는 ML 엔지니어링 챌린지

autoresearch 2026-06-10

[[안드레이 카파시]]의 자동화된 ML 실험 프레임워크. 에이전트가 학습 코드를 수정하고 실험을 자율 관리

Generative Criticality in Large Language Model Temperature Scaling 2026-06-09

물리학자들이 LLM의 temperature 슬라이더를 통계물리의 상전이로 들여다본 논문입니다. 토큰 임베딩을 스핀 변수로 놓고 보면, 특정 임계온도 근처에서 출력의 질서와 무질서가 물의 끓는점처럼 급격히 바뀌는 임계 현상이 나타납니다. susceptibility 급첨두, order parameter 붕괴, 내재 차원 최소라는 세 신호가 같은 지점을 가리킵니다.

Efficient BackProp 2026-05-28

1998년 AT&T Bell Labs와 GMD Berlin 팀이 정리한 신경망 학습 트릭 모음. 확률적 경사 하강이 왜 이기는지, 입력 정규화·시그모이드·학습률·초기화·2차 방법을 어떻게 다룰지 한 챕터로 못 박은 책 챕터. 현대 딥러닝 학습 레시피의 출발점입니다.

A Tutorial on Energy-Based Learning 2026-05-26

정규화된 확률을 거치지 않고 에너지 표면을 직접 깎는 학습 프레임워크의 정식 정의. 손실 함수의 좋고 나쁨을 마진 조건 하나로 가르고, GTN과 CRF·SVMM을 같은 그릇에 담는다.

온톨로지, Knowledge Graph, Graph RAG 2026-05-17

그래프, 그래프 DB, Knowledge Graph, 온톨로지, Graph RAG, Second Brain. 이름이 비슷한 개념들을 한 줄로 줄세우고, 진짜 차이가 어디에 있는지 정리합니다

AutoScientist - Sara Hooker가 모델 학습 자체를 자동화합니다 2026-05-15

전 Cohere VP of Research [[사라 후커]]가 공동창업한 Adaption Labs가 첫 제품 AutoScientist를 공개했습니다. 모델 학습·정렬 전체 research loop을 자동화하는 시스템으로, 데이터 큐레이션과 학습 recipe를 동시에 self-improve 합니다. 사내 AI 리서처가 직접 설정한 학습 대비 평균 +35%, win rate는 48%에서 64%로 올랐다고 합니다. 첫 30일 무료, $50M 시드 (Emergence Capital + Mozilla Ventures 리드).

World Action Models - The Next Frontier in Embodied AI 2026-05-15

Vision-Language-Action 모델이 학습하는 reactive observation-to-action 매핑과 World Model 계열의 예측적 dynamics 모델링이 별도의 흐름으로 흘러오다가 한 모델 안에서 합쳐지기 시작했습니다. Fudan 신뢰성 임바디드 AI 연구소가 이 합류 지점을 World Action Models로 명명하고 정의·아키텍처·데이터·평가의 네 축으로 정리한 첫 서베이를 살펴봅니다.

OmniNFT - Modality-wise Omni Diffusion Reinforcement for Joint Audio-Video Generation 2026-05-14

19B 규모 joint audio-video diffusion 모델 LTX-2 위에 RL fine-tuning을 얹어 영상 품질·음향 품질·립싱크를 동시에 끌어올린 OmniNFT를 정리합니다. modality-wise advantage routing, layer-wise gradient surgery, region-wise loss reweighting 세 디자인이 multi-modal RL의 reward hacking 양상을 어떻게 바꾸는지, 그리고 한국 비디오 생성 스타트업·후반 작업 도구 관점에서 어떤 의미를 갖는지 봅니다.

Predictive Maps of Multi-Agent Reasoning - A Successor-Representation Spectrum for LLM Communication Topologies 2026-05-14

멀티에이전트 LLM 시스템의 chain·star·mesh 토폴로지를 추론을 돌리기 전에 단 세 개의 고윳값으로 진단하자는 제안. successor representation을 통신 그래프에 얹어 drift·consensus·robustness를 closed-form으로 풉니다.

증류 2026-05-07

대형 Teacher 모델의 출력으로 소형 Student 모델을 학습시키는 기법. 비용 효율과 함께 모델 편향이 하위 모델로 조용히 전파되는 통로가 되기도 합니다.

WRING - 회전 기반 디바이어싱으로 두더지 잡기 딜레마 풀기 2026-05-05

WRING은 모델 구조 훼손을 최소화하고 두더지 잡기 딜레마를 완화합니다. 재학습이 불필요해 실용적입니다.

CS229 머신러닝 강의 목차 2026-04-14

1장 - 머신러닝이란 무엇인가 2026-04-13

2장 - 선형 회귀와 경사 하강법 2026-04-12

경사 하강법으로 선형 회귀 파라미터를 학습하는 원리와 배치, 확률적 경사 하강법의 차이, 정규 방정식으로 한 번에 최적해를 구하는 방법을 다룹니다

3장 - 국소 가중 회귀와 로지스틱 회귀 2026-04-11

국소 가중 회귀로 비선형 함수를 피팅하는 원리와 최소제곱법의 확률적 해석, 로지스틱 회귀와 뉴턴 방법을 이용한 최적화를 다룹니다

차원의 저주 2026-04-10

차원이 증가할수록 데이터 희소성, 계산 비용, 거리 의미 손실 등이 기하급수적으로 악화되는 현상

교차 엔트로피 2026-04-10

두 확률 분포 간의 차이를 측정하는 손실 함수로, 분류 문제에서 표준적으로 사용

K-평균 클러스터링 2026-04-10

데이터를 K개의 클러스터로 분할하는 대표적인 비지도 학습 알고리즘

다변량 가우시안 분포 2026-04-10

다차원 데이터를 모델링하는 가우시안 분포의 다변량 확장

로지스틱 회귀 2026-04-10

시그모이드 함수를 이용해 이진 분류 확률을 출력하는 선형 분류 알고리즘

가치 반복 2026-04-10

벨만 방정식을 반복 적용하여 최적 가치 함수를 구하는 동적 프로그래밍 알고리즘

최소제곱법 2026-04-10

예측값과 실제값의 제곱 오차 합을 최소화하여 모델 매개변수를 추정하는 방법

소프트맥스 회귀 2026-04-10

로지스틱 회귀를 다중 클래스로 확장한 분류 알고리즘

시그모이드 함수 2026-04-10

실수 입력을 (0, 1) 구간으로 압축하는 S자형 활성화 함수

그래디언트 부스팅 2026-04-10

손실 함수의 음의 그래디언트(잔차)를 타겟으로 약학습기를 순차 추가하는 부스팅 방법

부분 관측 마르코프 결정 과정 2026-04-10

에이전트가 환경의 완전한 상태를 관측할 수 없는 강화 학습 프레임워크

가우시안 분포 2026-04-10

평균과 분산으로 정의되는 종 모양의 확률 분포

일반화 선형 모델 2026-04-10

지수족 분포를 가정하고 선형 예측자를 연결 함수로 변환하는 통합 모델 프레임워크

칵테일 파티 문제 2026-04-10

여러 신호가 섞인 혼합 신호에서 원본 신호를 분리하는 신호 분리 문제

최대 우도 추정 2026-04-10

관측 데이터의 우도를 최대화하는 모델 매개변수를 추정하는 방법

적합 가치 반복 2026-04-10

연속 상태 공간에서 가치 함수를 함수 근사기로 표현하는 강화 학습 알고리즘

EM 알고리즘 2026-04-10

잠재 변수가 있는 모델에서 최대 우도 추정을 반복적으로 수행하는 알고리즘

라플라스 스무딩 2026-04-10

확률 추정 시 훈련 데이터에 없는 범주에도 작은 확률을 할당하는 스무딩 기법

PCA 2026-04-10

데이터의 분산을 최대한 보존하는 직교 축(주성분)을 찾아 차원을 축소하는 알고리즘

뉴턴 방법 2026-04-10

이차 미분(헤시안)을 활용해 경사 하강법보다 빠르게 최적점에 수렴하는 최적화 알고리즘

랜덤 포레스트 2026-04-10

배깅과 특징 무작위 선택을 결합한 의사결정 트리 앙상블 알고리즘

잠재 변수 2026-04-10

직접 관측되지 않고 다른 변수를 통해 간접적으로 추론되는 숨겨진 변수

부스팅 2026-04-10

약한 학습기를 순차적으로 훈련하여 이전 모델의 오류를 보정하는 앙상블 방법

지도 학습 2026-04-10

레이블이 있는 데이터로 입력-출력 관계를 학습하는 머신러닝 패러다임

클러스터링 2026-04-10

레이블 없이 유사한 데이터 포인트를 같은 그룹(클러스터)으로 묶는 비지도 학습 과제

배깅 2026-04-10

부트스트랩으로 만든 여러 데이터 샘플로 독립적인 모델을 훈련한 뒤 결합하는 앙상블 방법

행렬 2026-04-10

수를 직사각형 배열로 나열한 수학적 구조로, 선형 변환과 데이터 표현의 기본 도구

우도 함수 2026-04-10

주어진 매개변수 하에서 관측 데이터가 나타날 확률을 매개변수의 함수로 표현한 것

XGBoost 2026-04-10

그래디언트 부스팅의 확장으로, 정규화와 병렬화를 통해 속도와 성능을 개선한 구현체

대각합 2026-04-10

정방 행렬의 주대각선 원소들의 합

좌표 상승 2026-04-10

한 번에 하나의 매개변수만 최적화하면서 전체 목적 함수를 반복적으로 최대화하는 방법

기하학적 마진 2026-04-10

SVM에서 데이터 포인트와 결정 초평면 사이의 실제 유클리드 거리

가우시안 판별 분석 2026-04-10

각 클래스의 특징 분포를 다변량 가우시안으로 모델링하는 생성 분류 알고리즘

이산화 2026-04-10

연속 상태 공간을 유한한 이산 격자로 나눠 표 형태의 강화 학습을 적용하는 기법

벨만 방정식 2026-04-10

현재 상태의 가치를 즉각 보상과 다음 상태 가치의 합으로 재귀적으로 표현하는 방정식

K-겹 교차 검증 2026-04-10

데이터를 K개의 폴드로 나눠 K번 반복 검증하는 교차 검증 방법

ALVINN 2026-04-10

1989년 개발된 자율 주행 신경망으로, 머신러닝 역사의 초기 사례 중 하나

교차 검증 2026-04-10

데이터를 여러 방식으로 분할해 모델 성능을 더 신뢰있게 추정하는 검증 방법

비지도 학습 2026-04-10

레이블 없이 데이터의 숨겨진 구조를 발견하는 머신러닝 패러다임

함수적 마진 2026-04-10

SVM에서 데이터 포인트와 결정 경계 간의 정규화되지 않은 거리 측도

의사결정 트리 2026-04-10

데이터를 특징값 기준으로 반복적으로 분기하여 예측하는 트리 구조 모델

국소 가중 회귀 2026-04-10

예측 시 쿼리 포인트 근처의 훈련 데이터에 더 높은 가중치를 부여하는 비매개변수 회귀

슬랙 변수 2026-04-10

소프트 마진 SVM에서 마진 제약 조건의 위반을 허용하기 위해 도입하는 변수

조건부 독립 2026-04-10

제3의 변수가 주어졌을 때 두 변수가 통계적으로 독립이 되는 관계

강화 학습 2026-04-10

환경과 상호작용하며 보상을 최대화하는 정책을 학습하는 머신러닝 패러다임

머서 정리 2026-04-10

함수가 유효한 커널이 되기 위한 필요충분조건을 제시하는 정리

지수족 2026-04-10

특정 형태의 확률 분포 패밀리로, GLM의 이론적 토대를 형성하는 분포 집합

정책 반복 2026-04-10

정책 평가와 정책 개선을 교대로 수행하여 최적 정책을 찾는 강화 학습 알고리즘

가우시안 커널 2026-04-10

두 포인트 간의 유클리드 거리 기반 지수 함수로 정의되는 가장 널리 쓰이는 커널

아핀 함수 2026-04-10

선형 변환에 상수 항(편향)을 더한 함수

선형 이차 조절기 2026-04-10

선형 동역학 시스템에서 이차 비용 함수를 최소화하는 최적 제어기

오류 분석 2026-04-10

모델이 잘못 예측한 사례를 분석해 개선 방향을 도출하는 진단 방법

마르코프 결정 과정 2026-04-10

상태, 행동, 전이 확률, 보상으로 구성되는 강화 학습의 수학적 프레임워크

독립 성분 분석 2026-04-10

관측된 혼합 신호로부터 통계적으로 독립인 원본 신호를 복원하는 알고리즘

퍼셉트론 2026-04-10

입력의 선형 결합에 계단 함수를 적용하는 가장 단순한 선형 분류기

서포트 벡터 머신 2026-04-10

두 클래스를 가장 넓은 마진으로 분리하는 초평면을 찾는 분류 알고리즘

표현자 정리 2026-04-10

정규화된 손실 최소화 문제의 최적 해가 훈련 데이터의 선형 결합으로 표현된다는 정리

직접 정책 탐색 2026-04-10

가치 함수를 거치지 않고 정책 매개변수를 직접 최적화하는 강화 학습 접근법

분류 2026-04-10

입력을 미리 정의된 이산 클래스 중 하나로 예측하는 지도 학습의 한 유형

편향-분산 트레이드오프 2026-04-10

모델의 편향과 분산은 서로 반비례하여, 둘의 균형이 일반화 성능을 결정한다

나이브 베이즈 2026-04-10

특징들이 클래스 조건부 독립이라는 단순한 가정으로 분류하는 생성 모델

인자 분석 2026-04-10

고차원 데이터를 소수의 잠재 요인으로 설명하는 생성 모델

가우시안 혼합 모델 2026-04-10

데이터가 여러 가우시안 분포의 혼합에서 생성되었다고 가정하는 확률적 클러스터링 모델

가치 함수 2026-04-10

강화 학습에서 특정 상태 또는 상태-행동 쌍의 장기적인 기댓값을 나타내는 함수

회귀 2026-04-10

연속적인 출력값을 예측하는 지도 학습의 한 유형

학습 곡선 2026-04-10

훈련 데이터 크기 변화에 따른 훈련/검증 오류를 시각화하여 편향-분산 문제를 진단하는 도구

커널 2026-04-10

두 데이터 포인트 간의 유사도를 측정하는 함수로, 고차원 매핑 없이 비선형 학습을 가능하게 함

베이즈 규칙 2026-04-10

사전 확률과 우도를 결합해 사후 확률을 계산하는 확률론의 핵심 정리

정규화 2026-04-10

과적합을 방지하기 위해 손실 함수에 모델 복잡도에 대한 벌점 항을 추가하는 기법

커널 트릭 2026-04-10

고차원 특징 공간으로의 명시적 매핑 없이 내적을 커널 함수로 대체하는 기법

4장 - 퍼셉트론과 일반화 선형 모델 2026-04-10

지수족과 일반화 선형 모델을 통해 선형 회귀와 로지스틱 회귀가 하나의 프레임워크에서 도출되는 원리, 다중 클래스용 소프트맥스 회귀를 다룹니다

5장 - GDA와 나이브 베이즈 2026-04-09

생성 학습 알고리즘의 개념과 함께, 연속형 특성을 다루는 가우시안 판별 분석과 이산형 특성을 다루는 나이브 베이즈의 원리를 설명합니다

6장 - 서포트 벡터 머신 2026-04-08

라플라스 스무딩과 다항 이벤트 모델로 나이브 베이즈를 보완한 뒤, 함수적 마진과 기하학적 마진 개념으로 SVM 최적 마진 분류기를 유도합니다

7장 - 커널 2026-04-07

커널 트릭으로 고차원 특성 공간을 명시적 계산 없이 다루는 원리와, SVM에 커널을 결합해 비선형 분류기를 만드는 방법을 설명합니다

8장 - 데이터 분할, 모델과 교차 검증 2026-04-06

편향과 분산의 트레이드오프, 정규화의 역할, 훈련/개발/테스트 데이터 분할과 K겹 교차 검증으로 모델을 검증하는 방법을 다룹니다

9장 - 의사결정 트리와 앙상블 기법 2026-04-05

의사결정 트리의 분할 기준과 과적합 방지 원리를 다루고, 배깅, 랜덤 포레스트, 부스팅 등 앙상블 기법이 성능을 끌어올리는 이유를 설명합니다

10장 - 신경망 입문 2026-04-04

로지스틱 회귀가 신경망의 특수한 경우임을 보인 뒤, 순전파 방정식과 층 구조 설계, 소프트맥스 회귀를 통한 다중 클래스 분류를 다룹니다

11장 - 역전파와 신경망 개선 2026-04-03

연쇄 법칙으로 역전파를 유도하고, 활성화 함수 선택, 기울기 소실과 폭발 문제, 가중치 초기화, 미니 배치와 모멘텀 등 학습 안정화 기법을 다룹니다

12장 - ML 모델 디버깅과 오류 분석 2026-04-02

편향과 분산, 최적화 알고리즘과 목적 함수 중 무엇이 문제인지 진단하는 방법과, 오류 분석 및 절제 분석으로 개선 우선순위를 정하는 전략을 다룹니다

13장 - EM 알고리즘 2026-04-01

K평균 클러스터링에서 출발해 가우시안 혼합 모델을 학습하는 EM 알고리즘까지, 옌센 부등식으로 그 수렴을 엄밀하게 증명하는 과정을 다룹니다

14장 - EM 알고리즘과 인자 분석 2026-03-31

데이터가 적을 때 가우시안 혼합 모델이 실패하는 이유를 짚고, 잠재 변수를 이용한 인자 분석 모델과 그 EM 유도 과정을 자세히 다룹니다

15장 - PCA와 ICA 2026-03-30

주성분 분석으로 데이터의 차원을 축소하는 수학적 유도와 응용 사례를 다루고, 독립 성분 분석이 풀고자 하는 문제 설정을 소개합니다

16장 - 독립 성분 분석과 강화 학습 2026-03-29

칵테일 파티 문제를 푸는 독립 성분 분석을 마무리하고, 마르코프 결정 과정을 중심으로 강화 학습의 기본 틀과 정책 개념을 소개합니다

17장 - MDP와 가치 및 정책 반복 2026-03-28

마르코프 결정 과정의 가치 함수를 정의하고, 최적 정책을 구하는 가치 반복과 정책 반복 알고리즘, 상태 전이 확률 추정 방법을 다룹니다

18장 - 연속 상태 MDP와 모델 시뮬레이션 2026-03-27

연속 상태 공간을 다루는 이산화 기법의 한계를 짚고, 모델 기반 강화 학습과 시뮬레이터 구축을 거쳐 적합 가치 반복 알고리즘을 유도합니다

19장 - 보상 모델과 선형 동적 시스템 2026-03-26

상태 행동 보상과 유한 지평 MDP로 프레임워크를 확장한 뒤, 선형 동적 시스템에서 근사 없이 최적 정책을 계산하는 LQR을 유도합니다

20장 - 강화 학습 디버깅과 진단 2026-03-25

강화 학습 프로젝트에서 시뮬레이터, 보상 함수, 알고리즘 중 병목을 진단하는 체계적 방법과, 직접 정책 탐색인 REINFORCE 알고리즘을 다룹니다

판다스 기능 명단 2025-04-05

Python 데이터 분석 라이브러리 Pandas(판다스)의 핵심 기능 요약 문서입니다. Series와 DataFrame 생성, loc, iloc, 불린 인덱싱 등 데이터 선택 및 수정을 위한 주요 기법들을 코드 예제와 함께 제공하여 빠른 참조를 돕습니다.

Google Colab에서 Kaggle 설정하기 2025-04-05

데이터 사이언스 프로젝트 환경 구성을 위해 Google Colab에서 Kaggle API와 Git/Github를 설정하는 방법을 안내합니다. 각 서비스의 계정 생성부터 Colab에서 Kaggle 데이터셋을 다운로드하기 위한 API 연동 과정까지 단계별로 설명합니다.

맷플롯립 기능 명단 2025-04-05

Python의 대표적인 데이터 시각화 라이브러리인 Matplotlib(맷플롯립)의 핵심 기능을 정리한 문서입니다. 기본 그래프 생성부터 커스터마이징, 서브플롯, 고급 그래프, 스타일링 등 필수 사용법을 코드 예제와 함께 제공하여 원하는 차트를 빠르게 만들 수 있도록 돕습니다.

머신러닝 체크리스트 2025-04-05

머신러닝 프로젝트의 전체 과정을 체계적으로 관리하기 위한 체크리스트입니다. 프로젝트 개요부터 데이터 탐색, 시각화, 모델링, 배포, 그리고 유지보수까지 각 단계에서 수행해야 할 주요 항목들을 정리하여 성공적인 프로젝트 완수를 돕습니다.

넘파이 기능 명단 2025-04-05

Python의 핵심 과학 계산 라이브러리인 NumPy(넘파이)의 주요 기능을 정리한 문서입니다. 배열 생성, 연산, 인덱싱, 변형, 통계 함수, 난수 생성 등 필수적인 NumPy 사용법을 코드 예제와 함께 제공하여 빠르게 찾아볼 수 있도록 돕습니다.

Kaggle API 사용법 2025-04-05

Kaggle API의 설치 및 사용법을 정리한 가이드입니다. API 토큰 설정 방법부터 CLI 또는 Python 코드를 사용하여 데이터셋과 대회 데이터를 다운로드하는 등 주요 기능을 예제와 함께 설명하여 Kaggle 환경 외부에서의 활용을 돕습니다.

사이킷런 라이브러리 기능 명단 2025-04-05

Python 머신러닝 라이브러리 Scikit-learn(사이킷런)의 핵심 기능을 정리한 치트시트입니다. 데이터 전처리, 모델링, 평가 등 머신러닝 워크플로 각 단계별 주요 모듈과 클래스를 코드로 제공하여 빠른 참조를 돕습니다.

댄 헨드릭스

CAIS(Center for AI Safety) 설립자 겸 이사, MMLU·MATH·GELU 저자, AI 안전 및 평가 연구자

홍콩대학교

홍콩에서 가장 오래된 종합 연구대학

셰인 레그

Google DeepMind 공동창업자·Chief AGI Scientist. Marcus Hutter와 함께 Legg-Hutter 보편 지능 측도를 개발한 AGI 이론가.

알렉스 장

Recursive Language Models 1저자, MIT CSAIL 박사과정, 언어모델이 비효율적으로 쓰이는 지점을 파고드는 연구자

ETH 취리히

스위스의 세계적 공과대학

Shiwei Liu

ELLIS 튀빙겐 PI, 막스 플랑크 지능 시스템 연구소 그룹 리더. 희소성(sparsity)과 저랭크(low-rank) 근사를 활용한 대형 모델 효율 훈련·추론 연구.

니우준보

OpenDataLab의 연구원으로 문서 이해와 고효율 VLM을 중점 연구

난징대학교

중국 장쑤성의 최상위 종합대학

TurboQuant

Google Research의 KV cache 6× 압축 알고리즘, ICLR 2026 발표, 학습 없이 3-bit 양자화에 정확도 손실 zero

UC 버클리

미국 캘리포니아의 명문 공립 연구중심대학

링샤오 왕

RIKEN iTHEMS 연구원이자 도쿄대 지능물리학 연구소 조교수. 머신러닝과 물리학의 접점, 특히 QCD 역문제를 딥러닝으로 푸는 연구자

팡톈위

Tencent Hunyuan 수석 연구과학자. 멀티모달 RL 테크리드. 생성 모델·강화학습·신뢰할 수 있는 AI 전문가.

토론토 대학교

캐나다 명문대, 딥러닝의 발상지 중 하나

메이삼 라자비얀

USC 부교수 + Google Research 파트타임 연구자, 신뢰 가능한 대규모 최적화 알고리즘 전문가

신진우

KAIST 석좌교수. 머신러닝 이론과 표현학습 연구자. SIGMETRICS Test of Time·Rising Star 수상.

중페이린

Google Research NYC Algorithms 팀 Research Scientist, 스케칭·스트리밍 알고리즘 이론 전문가

션 웰렉

수학 LLM·자동 증명 분야 핵심 연구자, CMU LTI 조교수, DARPA expMath PI

뉴욕대학교

미국 뉴욕의 명문 사립대, 얀 르쿤이 재직

피터 아베일

UC 버클리 교수. 박사 시절 강화학습으로 헬리콥터에게 틱톡, 카오스 등 최상위 인간 조종사급 곡예비행을 가르쳤다

수밋 초프라

Siamese 네트워크용 contrastive loss를 도입한 인도 출신 머신러닝 연구자, 현재 NYU Courant + Grossman School of Medicine 정교수

톈진대학교

중국 톈진의 역사 깊은 종합 연구대학

왕청핑

FinVolution Group(玖富) Chief AI Scientist. 금융 도메인 그래프 AI와 GNN 프롬프트 튜닝 전문. h-index 23.

데미스 하사비스

Google DeepMind CEO, 노벨 화학상 수상자. 인류가 \

구전취안

UCLA 컴퓨터과학과 부교수, UCLA AGI Lab 대표, 통계적 머신러닝과 딥러닝 이론 전문가

바하브 미로크니

Google Fellow & VP, Google Research Algorithms & Optimization 총괄, Gemini Data Area Lead

주느비에브 오어

Willamette 대학교 전산학과 교수, 신경망 학습 동역학 연구자, Neural Networks - Tricks of the Trade 공동 편집자

앤드류 응

Coursera 공동 창립자. Google Brain 시절 1만 6천 개 CPU 코어로 신경망을 학습시켜 고양이 얼굴을 스스로 인식하게 만들었다

장카이웨이

UCLA CS Associate Professor, Amazon Scholar, VisualBERT·GLIP 등 비전-언어 모델과 NLP 편향 연구로 알려짐

일리노이대학교 어바나-샴페인

미국 중서부의 공학 명문 공립대

AlphaFold

단백질 3D 구조를 아미노산 서열만으로 예측하는 Google DeepMind의 AI, 2024년 노벨 화학상의 근거

팀 크라스카

MIT CSAIL 부교수, 데이터 시스템 그룹 공동 리더, learned index로 유명한 시스템·ML 융합 연구자

레옹 보투

확률적 경사 하강법(SGD)의 실용화를 이끈 프랑스계 머신러닝 연구자, Meta FAIR 시니어 연구원

장룽셴

대만 국립성공대(NCKU) 컴퓨터과학과 석좌교수. 지능형 정보검색(IIR) 연구실을 이끌며 AI·바이오인포매틱스·자연어처리를 연구합니다.

Jingjing Gong

Shanghai Innovation Institute 연구원. OpenMOSS 소속. 구현 AI·VLA·로봇 조작 연구.

Hongyuan Lu

CUHK 박사과정·FaceMind Research Asia 공동창업자. NLP·세계 모델 연구자.

앨런 다포

Google DeepMind 프론티어 전략 및 거버넌스 시니어 디렉터. Cooperative AI Foundation 창립자. AI 거버넌스 분야 선구자.

홍콩과학기술대학교

홍콩의 이공계 특화 연구대학

쑨이페이

절강대학교 조교수(ZJU-100 Young Professor). G-Retriever 저자. Graph RAG와 GNN 파인튜닝 전문.

줄리아 호켄마이어

미국 일리노이대 어배너섐페인(UIUC) 컴퓨터과학과 정교수. 전산언어학·자연어처리의 권위자로 CCG 문법과 이미지 캡셔닝 연구로 알려졌습니다.

먀오춘옌

NTU 컴퓨팅·데이터과학대 학장이자 President's Chair Professor. Human-Centered AI 전문가로 고령화·헬스·교육 분야 AI를 이끈다. IEEE 펠로우.

싱가포르국립대학교

싱가포르 최고의 종합 연구대학

Muse Spark

Meta가 2026년 4월 공개한 첫 사유 AI 모델, Llama 라인업을 대체하는 Meta Superintelligence Labs의 첫 결과물

자오펑

USTC 자동화학과 정교수이자 컴퓨터 비전·대규모 멀티모달 모델 연구 그룹 지도교수. OmniNFT의 교신 저자로 [[장궈후이]]·[[위후]] 등 1저자 학생들의 시각 생성 + RL 라인을 총괄.

Wayne Xin Zhao

중국인민대학교 고링 인공지능학원 교수. NLP·추천 시스템·LLM 분야 대형 서베이 논문으로 널리 알려진 연구자.

KAIST

대전에 위치한 한국 최고의 이공계 특화 연구대학

로널드 윌리엄스

미국 수학자·전산학자. 노스이스턴대 교수. 역전파 1986 Nature 논문 3저자이자 REINFORCE 정책 그래디언트의 창시자.

칭화대학교

중국 베이징의 최상위 이공계 종합대학

스탠퍼드 대학교

실리콘밸리 인접 미국 명문 사립대, AI 연구의 중심지

NeurIPS

머신러닝 분야 최대 규모의 국제 학회

위후

USTC 박사과정. [[자오펑]] 연구실에서 image restoration·diffusion·flow-based generative model을 연구. OmniNFT 공저자.

마리안 페르헐스트

KU Leuven MICAS 정교수이자 imec 연구 디렉터. 임베디드 머신러닝과 저전력 하드웨어 가속기의 권위자

토레 그래펠

Google DeepMind 디스팅귀시드 리서치 사이언티스트. TrueSkill 개발자, AlphaGo 공저자. 2025년 복귀 후 post-AGI 미래 팀을 이끌고 있습니다.

존 점퍼

AlphaFold2 연구 책임자. 39세에 노벨 화학상을 받아 70년 만에 가장 젊은 화학상 수상자가 되었다

황성주

KAIST 석좌교수이자 DeepAuto CEO. 메타러닝·효율적 딥러닝 연구자.

Byung-Kwan Lee

NVIDIA Research Taiwan 연구원, VLM 효율화 전문. 소형 VLM 강화학습·지식 이전 연구 프로젝트 리드.

튜링상

컴퓨터과학의 노벨상이라 불리는 ACM 최고 권위 상

임베딩

텍스트나 이미지 같은 입력을 의미가 보존된 고차원 실수 벡터로 변환한 표현

장원타오

베이징대 머신러닝연구센터(CMLR) 조교수, 데이터 중심 AI(DCAI) 그룹 리더. 데이터 중심 ML·그래프 ML·ML 시스템 연구. 텐센트·애플 거쳐 Mila(Bengio) 포닥 출신.

상하이교통대학교

중국 상하이의 최상위 이공계 종합대학

로랑 나즈만

워터셰드 분할과 segmentation tree 이론의 권위자, ESIEE Paris 정교수, 수리형태학 표준 교과서 공저자

오세웅

워싱턴대 교수. 프라이버시·강건·안전한 머신러닝과 데이터 중심 AI의 이론적 토대 연구자.

카네기멜런대학교

미국 피츠버그의 컴퓨터과학 최강 대학

옌수이청

AAAI·ACM·IEEE·IAPR 펠로우이자 H-index 140+의 컴퓨터비전·머신러닝 대가. 현재 Kunlun 2050 Research 총괄 겸 Skywork AI 수석과학자, NUS 교수.

사나에 로트피

메타 FAIR 리서치 사이언티스트. 딥러닝의 일반화를 압축·손실곡면 관점으로 파고드는 연구자. ICML 2022 Outstanding Paper 수상.

Shuicheng Yan

Kunlun Tech·Skywork AI 수석과학자, Kunlun 2050 연구원장. 전 Sea 그룹 수석과학자, 전 싱가포르국립대학교 부교수. 컴퓨터비전·머신러닝 분야 피인용 10만+, AAAI·ACM·IEEE Fellow

사라 후커

AI 모델 효율성·공정성 연구로 알려진 컴퓨터 과학자, Cohere For AI 전 VP, Adaption Labs 공동 창업자 겸 CEO

국립성공대학교

대만 타이난의 이공계 중심 국립대

Yibo Yang

상하이교통대학교 부교수, KAUST 연구과학자. 머신러닝·지속학습·평생학습·포스트트레이닝 연구. GateMem 교신저자

에단 파크스

University of Arizona 소속 연구자. Predictive Maps of Multi-Agent Reasoning의 1저자로 successor representation을 LLM 멀티에이전트 통신 그래프로 옮긴 분석을 주도.

AT&T Bell Labs

트랜지스터·정보이론을 낳은 전설적 산업 연구소

Wai Lam

CUHK 시스템공학·공학경영학과 교수. CUHK Text Mining Group 책임자. NLP·정보 검색 분야 선구적 연구자.

차치 바이스만

스탠퍼드 전기공학 교수. 정보이론과 데이터 압축의 권위자이자 스탠퍼드 압축 포럼 창립 디렉터

Hao Tang

베이징대학교 컴퓨터과학대학 조교수, Embodied and Generative Intelligence Lab 리더. 체화 AI, 생성 AI, 컴퓨터비전 연구.

JD Explore Academy

JD.COM 산하 AI 연구 조직. Vision and Multimodal Lab을 [[두안난]] 디렉터가 이끌고 있으며, 비전·멀티모달 파운데이션 모델과 비디오 생성 라인을 외부 대학(USTC 등)과 공동 연구.

장웨이난

상하이교통대(SJTU) 컴퓨터과학부 교수. 강화학습·에이전트 AI·임바디드 AI 분야의 대가로 논문 200편 이상, 피인용 3만 회를 넘습니다.

Siyin Wang

Fudan University 박사과정 연구자. 구현 AI·VLA 일반화·세계 모델링 연구. OpenMOSS 멤버.

하버드 대학교

미국 매사추세츠의 세계 최고 명문 사립대

파인튜닝

사전 학습된 모델을 특정 태스크나 도메인에 맞게 추가 학습하는 방법

티에리 탐베

스탠퍼드 전기공학 조교수. 알고리즘부터 실리콘까지 통째로 설계하는 효율적 AI 하드웨어 연구자이자 EdgeBERT 저자

양자화

모델 가중치의 정밀도를 낮춰 크기와 속도를 개선하는 압축 기법

양양

절강대학교(ZJU) 컴퓨터과학기술학부 교수. 그래프 기초 모델과 LLM-그래프 연계 연구를 이끄는 중국 그래프 AI 분야 핵심 PI.

난양공과대학교

싱가포르의 이공계 특화 연구대학

천레이

HKUST(GZ) Information Hub 학장, ACM·IEEE 펠로우. 데이터베이스·GNN 훈련 효율화 분야의 세계적 권위자로 VLDB Endowment 의장(2026-27).

베이징대학교

중국 베이징의 최고 명문 종합대학

장이판

프린스턴 대학교 컴퓨터과학 박사과정, Princeton AI Lab Fellow, LLM 아키텍처 및 추론 연구

DARPA

미국 국방고등연구계획국, 인터넷·자율주행 등 첨단 기술의 산실

장궈후이

USTC 박사과정. masked image generation·autoregressive image generation에 GRPO 계열 정책 최적화를 적용해온 1저자로, OmniNFT에서는 joint audio-video diffusion으로 RL 프레임워크를 확장.

두안난

JD.COM VP이자 JD Explore Academy Vision and Multimodal Lab 디렉터. 마이크로소프트 리서치 아시아 NLP 그룹 시니어 프린시펄 리서처, StepFun Technical Fellow를 거쳐 합류. NLP·코드 인텔리전스·멀티모달 파운데이션 모델·AI 에이전트 분야 시니어 저자.

아카리 아사이

Self-RAG 저자, RAG·검색 보강 LM 분야 대표 연구자, University of Washington NLP PhD

셔빈 아미디

쌍둥이 형제와 함께 스탠퍼드 CME295 강의를 가르치는 Google DeepMind 엔지니어. CS229·CS230 치트시트로 학습자 수백만 명에게 알려졌다

절강대학교

중국 항저우의 최상위 종합 연구대학

쾅쿤

저장대 인공지능학원 부교수. 인과추론과 머신러닝의 결합을 연구

Stanford HAI

스탠퍼드의 인간 중심 AI 연구소

Zhe Ren

지린대학교 인공지능대학 소속, GateMem 1저자. LLM 에이전트 메모리 거버넌스 연구

화중과학기술대학교

중국 우한의 이공계 명문 종합대학

황카이치

중국과학원 자동화연구소(CASIA) 정교수이자 패턴인식국가중점실험실(NLPR) 시각 감시·추적 분야 시니어 PI

데이비드 루멜하트

인지과학자, UCSD PDP 그룹의 중심 인물. 역전파 1986 Nature 논문 1저자이자 connectionism의 설계자.

팀 게네바인

Google DeepMind 리서치 사이언티스트. 정보이론 기반 유계 합리성·메타러닝 전문가. "From AGI to ASI" 1저자.

알렉스 펜틀런드

계산 사회과학을 개척한 MIT 미디어랩 교수이자 스탠퍼드 HAI 펠로우. 웨어러블 컴퓨팅과 인간 행동 데이터 연구의 대가

홍콩중문대학교

홍콩의 연구중심대학, 컴퓨터비전 강세

달랄 알하르티

University of Arizona College of Applied Science & Technology의 사이버보안 조교수. UC Irvine 컴퓨터과학 박사. 클라우드 보안과 AI 기반 보안 위협을 함께 다루는 연구자.

클라우스로베르트 뮐러

독일 TU Berlin 머신러닝 학과 학과장, 커널 방법·BCI·설명 가능한 AI 연구 권위자

IEEE

전기·전자·컴퓨터 분야 세계 최대 기술자 단체이자 학술지·학회 운영 기관

싱위 궈

화난사범대학(SCNU) 양자물질연구소 소속 핵·양자물질 물리학자. 양자컴퓨팅 기반 QCD 연구로 알려진 QuNu 협업 멤버

Youyang Yin

바이두 연구원. Unlimited OCR 및 장거리 문서 파싱 연구 리드.

키안 카탄포루쉬

스탠퍼드 CS229 딥러닝 파트 강사

야오시우밍

홍콩대(HKU) 컴퓨터과학과 교수이자 부학과장. 보안·암호학·핀테크·바이오인포매틱스 전문가로 h-index 61, 피인용 28,000+.

Wei Liu

ByteDance Seed Vision 팀 연구과학자. Seedream 4.0/4.5 이미지 생성·편집 공동 훈련 알고리즘 설계를 이끈 연구자.

펑난윈

UCLA CS Associate Professor, PLUSLAB 디렉터, controllable·creative natural language generation 분야 NSF CAREER 수상자

둥인펑

칭화대 컴퓨터과학기술과·AI연구원 연구자. 머신러닝의 적대적 견고성(adversarial robustness)과 신뢰가능 AI(trustworthy ML)가 주전공. CCF 우수박사학위논문상, MSRA·바이두 펠로십 수상.

중국과학기술대학교

중국 안후이성의 이공계 명문대

후아젠 루안

화난사범대학(SCNU) 양자물질연구소 소속 연구자. 통계장론으로 LLM 출력을 분석한 Generative Criticality 논문의 1저자

쑤팡이

대만 국립성공대(NCKU) 컴퓨터과학정보공학과 박사과정. 생성모델·의료 AI·공정성 AI를 연구하며 현재 하버드 의대 바이오의료정보학과에서 인턴 중입니다.

이아손 가브리엘

Google DeepMind AGI and Society 리드. AI 가치 정렬·윤리 전문가. 정치철학 배경의 AI 안전 연구자.

프린스턴 대학교

미국 아이비리그 명문 사립대

폴리나 키리첸코

메타 FAIR 리서치 사이언티스트. 분포 이동·가짜 상관·그룹 강건성 전문가로, 마지막 레이어 재학습(DFR)과 AbstentionBench로 알려져 있습니다.

Jingren Zhou

Alibaba Cloud CTO 겸 그룹 수석 과학자. Qwen·Wan 모델 총괄. ACM Fellow 2024, IEEE Fellow 2019

Jim Keller

전설적인 반도체 설계자이자 Tenstorrent CEO. AMD Zen 아키텍처, Apple A4/A5, Tesla Autopilot 칩, Intel Silicon Engineering 등을 거친 CPU·AI 가속기 분야의 연쇄 혁신가.

Meta Superintelligence Labs

2025년 Mark Zuckerberg가 Meta 내부에 신설한 AI 연구 조직, Alexandr Wang이 이끌며 Muse Spark가 첫 결과물

브라이언 후이

NUS 컴퓨팅학부 조교수. 그래프 이상 탐지, 사기 탐지, LLM 에이전트 연구.

탕성푸

미국 에모리대 컴퓨터과학과 교수. 오프라인 강화학습과 오프폴리시 평가(OPE)를 의료 의사결정에 적용해 온 연구자입니다.

Yang Yang

Shanghai Jiao Tong University 교수. 머신러닝·에이전트 연구자. EvoPolicyGym 교신저자.

안익진

Moloco 공동창업자 겸 CEO. 머신러닝 기반 광고·커머스 플랫폼 기업가.

마르쿠스 후터

위키피디아를 최소로 압축하면 최대 50만 유로를 주는 허터상을 만든 AIXI 창시자. 계산 불가능한 이론상 최적 에이전트로 지능을 정의했다

송린

JD Explore Academy 연구원. CVPR 2024 YOLO-World(Real-Time Open-Vocabulary Object Detection)의 공동·교신 저자로 알려진 비전 연구자. OmniNFT의 프로젝트 리더.

MIT

미국 매사추세츠의 세계 최정상 공과대학

베른하르트 보저

SVM 공동 발명자, UC Berkeley EECS 교수, MEMS 센서 회로 권위자

LTX-2

Lightricks가 공개한 19B 파라미터 규모의 joint audio-video foundation model. asymmetric dual-stream(비디오·오디오) 구조에 bidirectional cross-attention으로 modality imbalance를 처리. OmniNFT의 backbone으로 사용됨.

딜렉 하카니튀르

미국 일리노이대 어배너섐페인(UIUC) 컴퓨터과학과 교수. 대화형 AI의 권위자로 아마존 알렉사 AI 수석 주임과학자를 지냈습니다.

라이아 해드셀

DrLIM·연속 학습·로봇 RL의 권위자, Google DeepMind VP of Research, 인문학 학부에서 ML 박사로 전환한 이력

UCLA

미국 캘리포니아 로스앤젤레스의 명문 공립대

Dandan Guo

지린대학교 소속 머신러닝 연구자. 확률적 방법·심층 생성 모델·표현학습·최적수송 연구. GateMem 교신저자