Wikidata
Wikidata는 위키미디어 재단이 2012년 시작한 공개 협업 Knowledge Graph입니다. 위키피디아의 자매 프로젝트로, 위키미디어 모든 프로젝트(위키피디아 다국어판, 위키미디어 커먼즈 등)의 구조화 데이터 백본 역할을 합니다.
2026년 기준 1억 개 이상의 항목(item)을 보유하며, 각 항목에는 식별자(Q번호), 다국어 레이블, 속성(P번호), 출처가 붙습니다. 예를 들어 알베르트 아인슈타인은 Q937, "출생지" 속성은 P19입니다.
데이터는 CC0(공개 도메인)로 배포되어 누구나 자유롭게 재사용할 수 있습니다. Wikidata Query Service라는 공개 SPARQL 엔드포인트가 운영되어, 복잡한 쿼리를 외부에서 직접 실행할 수 있습니다.
Google Knowledge Graph, DBpedia, 학술 KG 등 다양한 시스템이 Wikidata를 기반 데이터로 흡수합니다. LLM의 사전학습 데이터에도 포함되어, 모델이 사실 질의에 답할 때의 주요 근거 중 하나입니다.