학습 없이 기성 비디오 디퓨전 모델로 1,000프레임짜리 긴 영상을 생성하는 MIGA. FIFO-Diffusion 계열의 train-inference gap을 zigzag·unified 두 단계로 좁히고, self-reflection + long-range frame guidance로 장기 일관성을 끌어올려 VBench·NarrLV에서 SOTA를 찍습니다.
태그: 오픈소스
44개의 게시물
-
-
Amazon Neptune 2026-05-18AWS가 제공하는 완전 관리형 그래프 데이터베이스. Property Graph와 RDF를 모두 지원해 Cypher·Gremlin·SPARQL을 모두 쓸 수 있습니다.
-
Pellet 2026-05-18Clark & Parsia가 개발한 자바 기반 OWL DL 추론기. 산업 적용 사례가 많고 SWRL 규칙도 지원합니다.
-
Microsoft GraphRAG 2026-05-18마이크로소프트 리서치가 2024년 공개한 Graph RAG 오픈소스 구현체. LLM 기반 엔티티 추출과 커뮤니티 요약 기반 검색이 핵심입니다.
-
FaCT++ 2026-05-18맨체스터 대학교가 개발한 C++ 기반 OWL DL 추론기. C++로 작성되어 자바 기반 추론기보다 빠른 경우가 많습니다.
-
Neo4j 2026-05-18관계를 일급 시민으로 다루는 대표 그래프 데이터베이스. Cypher 쿼리 언어와 함께 사용되며 Knowledge Graph·Graph RAG 구현의 사실상 표준입니다.
-
ArangoDB 2026-05-18그래프·문서·키-값을 한 엔진에서 다루는 멀티모델 데이터베이스. AQL이라는 통합 쿼리 언어로 모델을 가로질러 조회합니다.
-
Cypher 2026-05-18Neo4j가 만든 그래프 쿼리 언어. ASCII 아트 형태로 노드와 관계를 표현해 가독성이 높고, 현재는 openCypher·GQL 표준의 기반이 됩니다.
-
HermiT 2026-05-18옥스퍼드 대학교가 개발한 OWL 2 DL 추론기. 하이퍼태블로(hypertableau) 알고리즘 기반으로 대규모 온톨로지에서도 빠릅니다.
-
Wikidata 2026-05-18위키미디어 재단이 운영하는 공개 협업 Knowledge Graph. 1억 개 이상의 항목을 담고 있으며 SPARQL로 누구나 쿼리 가능합니다.
-
Logseq 2026-05-18Roam Research에서 영감을 받은 오픈소스 PKM 도구. 로컬 마크다운/Org 모드 파일을 다루며 블록 단위 참조를 지원합니다.
-
Gremlin 2026-05-18Apache TinkerPop 프로젝트의 그래프 순회 언어. 함수형 체이닝 스타일로 그래프를 단계별로 탐색합니다.
-
SPARQL 2026-05-18RDF 데이터를 위한 W3C 표준 쿼리 언어. SQL과 비슷한 문법으로 트리플 패턴을 매칭해 시맨틱 웹·온톨로지 생태계의 사실상 표준입니다.
-
DBpedia 2026-05-18위키피디아 인포박스에서 구조화 데이터를 자동 추출해 만든 Knowledge Graph. 시맨틱 웹 초기의 대표 프로젝트입니다.
-
Cactus Needle 2026-05-15|-
-
사전 정의된 워크플로 그래프 위에서 sub-agent의 모델·reasoning budget·구조 선택을 컴파일 타임에 한 번에 탐색해 정확도-지연 trade-off 집합을 만들어내는 컴파일러입니다. DSPy가 프롬프트 자동화였다면, FlowCompile은 그래프 자체의 자동화로 한 칸 더 나아간 시도입니다.
-
SenseNova-U1 - Unifying Multimodal Understanding and Generation with NEO-unify Architecture 2026-05-14SenseTime이 Apache 2.0으로 공개한 SenseNova-U1은 VAE도 vision encoder도 들어내고 픽셀과 단어를 한 트랜스포머 안에서 같이 학습합니다. dense 8B와 30B-A3B MoE 두 변종으로 understanding-only VLM 수준 인지에 X2I 생성을 32배 압축률로 동시에 수행하는, native unified multimodal의 first-principle 결정판입니다.
-
Claude Code의 Agent View 정리 2026-05-13Anthropic이 2026-05-11에 Research Preview로 공개한 Claude Code의 Agent View 기능을 처음부터 끝까지 정리합니다. 다중 세션 대시보드, 백그라운드 실행, 상태 아이콘, 단축키, worktree 격리, supervisor 프로세스, 한계까지 모두 다룹니다.
-
AI 공부에 쓸 만한 GitHub 저장소 10개 2026-05-08Karpathy 연구 자동화 프레임워크부터 Microsoft AI 에이전트 코스까지, 2026년 실제로 써볼 만한 AI 관련 GitHub 저장소 10개를 정리했습니다.
-
LLM 파이프라인을 위한 PDF 추출 도구 비교 2026-05-08pdftotext, pymupdf4llm, MinerU, marker, docling — LLM 파이프라인에서 PDF를 다루는 대표 도구 5개와 상황별 선택 기준을 정리합니다. 한국어 문서, 표, 스캔본, 속도 — 무엇을 우선시하느냐에 따라 답이 달라집니다.
-
chromex - Chrome 사이드 패널 AI 어시스턴트 2026-05-07Chrome 사이드 패널에서 현재 페이지를 AI에게 그대로 던지는 오픈소스 확장이 나왔습니다. API 키는 로컬 서버에만 있고, YouTube 타임스탬프, 파일 업로드, 음성 입력까지 됩니다. 설치는 직접 빌드해야 합니다.
-
AI 에이전트의 기억 상실을 고치는 오픈소스 Beads 2026-05-07GitHub 22.6k 스타의 Beads는 AI 에이전트 기억 문제를 Git 같은 SQL로 해결하겠다고 합니다. 아이디어는 맞는데, 실제로는 어떨까요. Dolt 마이그레이션이 망가뜨린 것들, '의미 기억 감쇠'의 진짜 정체, Mem0와의 비교까지 정리합니다.
-
Claude Code 에이전트 토큰 소비 줄이는 완전 가이드 2026-05-04클로드 프로는 체험판, 맥스도 부족하다? 무조건 할당량 100%만 채우면 된다? 아닙니다. 당연히 잘 쓰는 법이 중요합니다. 클로드를 오래, 효율적으로 쓰려면 어떻게 해야 할까요? 클로드가 아닌 다른 것을 쓰면 해결될까요?
-
NVIDIA Nemotron-Personas-Korea 2026-04-30NVIDIA가 한국에게 뭔가 보여줍니다. 한국 인구 통계를 기반으로 700만 개의 합성 페르소나를 공개했습니다. 한국어 AI 학습 데이터의 구조적 공백을 메우는 시도입니다. 활용 방법이 무궁무진합니다. 예를 들어, 사업을 하고 있다면 가상의 소비자 타겟층에게 미리 후기를 들어볼 수도 있겠네요.
-
메모를 사랑하는 당신을 위해, 옵시디언 웹 클리퍼 2026-04-30인터넷을 돌아다니다가 저장하고 싶은 페이지, 글, 콘텐츠가 있을 때 여러분은 어떻게 하시나요? 저는 바로 옵시디언에 메모하고 싶어집니다. 하지만 탭을 오가며 글을 쓰기도 불편하고, 형식 맞추는 데 한 세월이 걸리고, 페이지에 광고가 많아서 머리가 아프기도 합니다. 옵시디언 웹 클리퍼는 바로 당신을 위한 완벽한 솔루션일지도 모릅니다.
-
MCP 1년, 생태계는 어디까지 왔나 2026-04-25MCP가 등장한 지 1년, 사실상 표준이 된 흐름과 아직 남은 균열을 정리합니다
-
DeepSeek V4 출시 임박 2026-04-23DeepSeek V4가 4월 말 출시 예정입니다. 1조 파라미터 MoE, 화웨이 Ascend 칩, CUDA 완전 배제. 중국 AI가 엔비디아 없이 프론티어를 달릴 수 있는지 실증하는 첫 사례가 될 것입니다.
-
Hermes Agent 2026-04-11Nous Research의 Hermes Agent — 스스로 배우고 성장하는 오픈소스 AI 에이전트. 5단계 메모리, 자동 스킬 생성, 6개 실행 백엔드, 40+ 도구를 갖춘 로컬 퍼스트 에이전트 프레임워크.
-
Llama 4 Scout 2026-04-11Meta의 Llama 4 Scout — 17B 파라미터 오픈소스 멀티모달 MoE 모델. 단일 H100 GPU에서 10M 토큰 컨텍스트, Gemma 3와 Gemini Flash를 능가하는 성능.
-
node-pretext 2026-04-05브라우저 없이 텍스트 너비를 정확히 측정하는 Node.js 라이브러리. Excalidraw 도해 자동 생성 과정에서 탄생한 서버사이드 measureText() 구현체.
-
Postgres 기반 오픈소스 BaaS, 바이브 코딩 시대 백엔드의 사실상 표준
-
Google Research의 KV cache 6× 압축 알고리즘, ICLR 2026 발표, 학습 없이 3-bit 양자화에 정확도 손실 zero
-
Hermes 모델/에이전트 오픈소스 AI 팀, agentskills.io 표준
-
Alibaba의 오픈 웨이트 LLM 시리즈, 다국어와 풀라인업 사이즈가 특징
-
Meta의 오픈 웨이트 LLM 시리즈, 오픈소스 LLM 생태계의 사실상 표준
-
프랑스 Mistral AI의 오픈 웨이트·상업용 LLM 시리즈
-
CMU LTI 부교수, NeuLab 리드, All Hands AI 공동창업자, 다국어 NLP·코드 생성 분야 대형 연구자
-
프랑스 파리에 본사를 둔 AI 기업, 유럽을 대표하는 LLM 개발사
-
SenseTime Senior Research Manager. LLMC·QDrop 등 LLM·VLM 경량화·양자화 라인을 이끈다.
-
Lightricks가 공개한 19B 파라미터 규모의 joint audio-video foundation model. asymmetric dual-stream(비디오·오디오) 구조에 bidirectional cross-attention으로 modality imbalance를 처리. OmniNFT의 backbone으로 사용됨.
-
01.AI의 LLM 시리즈, 카이푸 리(李开复)가 창업한 중국 모델 가족
-
EleutherAI 소속 다국어 NLP·토크나이저 연구자, UC San Diego 언어학 PhD
-
중국 DeepSeek의 LLM 시리즈, 효율적 학습과 R1 추론 모델로 주목받음
-
Zhipu AI(智谱)의 LLM 시리즈, 칭화대 스핀오프가 개발하는 중국 모델