AI 챗봇은 정치적으로 편향돼 있는가 - WaPo 대규모 실험

이 글은 Washington Post 2026-06-24 보도를 참고하여 작성했습니다.

ChatGPT는 "객관적"이라고 합니다. Grok은 "검열 없는 대안"이라고 합니다. Gemini는 "균형 잡힌" 응답을 설계 목표로 내세웁니다. Washington Post가 Dartmouth College·Stanford University 연구진과 함께 이 주장들을 직접 검증했습니다.

테스트 대상은 GPT-5.5(ChatGPT), Gemini, Claude, Grok, DeepSeek, 그리고 보수 커뮤니티 Gab이 만든 Arya였습니다. 정치적으로 민감한 질문 묶음을 각 모델에 던지고, 응답이 좌편향 논거만 담았는지, 우편향 논거만 담았는지, 양측을 모두 제시했는지를 분류했습니다.

테스트 방법론

질문 설계는 Dartmouth와 Stanford 연구진이 맡았습니다. 낙태권, 이민, 총기 규제, 세금 정책처럼 미국 사회에서 실제로 첨예하게 갈리는 주제들이었습니다. 모델별로 동일한 질문을 여러 번 반복해 일관성도 측정했습니다.

분류 기준은 세 가지입니다. 첫째, 응답이 진보(좌편향) 논거만 제시했는가. 둘째, 보수(우편향) 논거만 제시했는가. 셋째, 양측 논거를 모두 담았는가. 한 모델이 특정 방향 논거만 일관되게 내놓으면 "편향"으로 판정합니다.

실험 결과

모델	좌편향만 (%)	균형 (%)	우편향만 (%)
ChatGPT (GPT-5.5)	80	19	1
Claude	43	57	0
Grok	40	27	33
Gemini	7	93	0

ChatGPT가 가장 편향이 심했습니다. 80%의 응답에서 좌편향 논거만 제시했고, 우편향 논거만 제시한 경우는 단 한 번뿐이었습니다. OpenAI 대변인은 "ChatGPT는 기본적으로 객관적이고 다양한 관점을 탐색하도록 만들었다"고 밝혔지만, 실험 결과와는 거리가 있습니다.

Grok의 결과가 가장 의미심장합니다. Elon Musk가 "검열에 반대하는 자유 발언 AI"로 마케팅한 모델이지만, 40%는 좌편향, 33%는 우편향이었습니다. 어느 쪽도 아닌 균형 응답은 27%에 불과했습니다. 보수적이라는 브랜드 이미지와 실제 모델 행동 사이 간극이 드러난 셈입니다.

Gemini는 가장 균형 잡힌 결과를 보였습니다. 93% 응답에서 양측 논거를 모두 담았습니다. Google은 "Gemini는 어떤 정치 이념도 편들지 않도록 설계됐다"고 밝혔습니다.

Claude는 43% 좌편향, 57% 균형이었습니다. 우편향 응답은 없었습니다.

RLHF가 편향을 만드는 메커니즘

모델이 편향을 갖는 경로는 두 단계입니다. 사전학습 데이터와 RLHF 파인튜닝입니다.

사전학습 단계에서 모델은 인터넷 텍스트를 대량 학습합니다. 연구에 따르면 영어권 인터넷 텍스트는 진보 성향 문서가 보수 성향 문서보다 2.3배에서 많게는 12배 많습니다. 뉴스, 학술 문서, 소셜 미디어 포럼 등이 진보 성향 필자 비중이 높기 때문입니다. 기반 모델은 데이터 분포를 그대로 반영합니다.

RLHF 단계에서 이 편향이 증폭됩니다. RLHF는 인간 평가자가 모델 응답에 점수를 매기고, 그 피드백으로 모델을 추가 학습시키는 방법입니다. 문제는 평가자 구성입니다. RLHF에 참여하는 평가자 상당수는 기술 업계, 대학, 교육 기관 출신으로, 평균적으로 진보 성향이 강합니다. 이들이 "유해하지 않다", "도움이 된다"고 평가하는 기준 자체에 정치적 판단이 섞이게 됩니다.

MIT 연구에 따르면, 사실과 거짓 판별을 기반으로 학습한 보상 모델(reward model)도 좌편향을 보였고, 모델 규모가 커질수록 편향이 강해졌습니다. 편향이 데이터에서만 오는 게 아니라, "옳고 그름을 판단하는 메커니즘" 자체에 내재한다는 뜻입니다.

브랜드 약속과 실제 동작

실험 결과에서 가장 눈에 띄는 점은 브랜드 이미지와 실제 모델 행동의 불일치입니다.

OpenAI는 ChatGPT를 "중립적이고 사실 기반"이라고 설명하지만, 80% 좌편향 응답은 중립과 거리가 멉니다. Elon Musk는 Grok을 "검열에 반대하는 AI"라고 포지셔닝했지만, 실험에서 Grok은 ChatGPT와 비슷한 수준의 좌편향을 보였습니다.

Google은 명시적으로 균형을 설계 목표로 내세웠고, Gemini는 실험에서 실제로 가장 균형 잡힌 결과를 냈습니다. 약속과 실제 사이 격차가 가장 작았습니다.

이 불일치가 중요한 이유는 하나입니다. 사용자 대부분은 모델이 중립적일 것이라 가정하고 AI에게 정치·사회 주제를 묻습니다. 실제로는 특정 방향의 논거만 받고 있을 수 있습니다.

한국 사용자 시사점

WaPo 실험은 미국 정치 맥락에서 설계됐습니다. 낙태권, 총기 규제, 이민 정책은 미국 특유의 정치 지형 위에 있는 이슈들입니다. 한국 정치 맥락에서 동일한 편향 패턴이 나온다고 단정할 수 없습니다.

그러나 메커니즘은 동일하게 작동합니다. 영어 데이터 편향 + 주로 영어권 평가자로 구성된 RLHF는 한국어 응답에도 영향을 줍니다. 한국의 노동 정책, 복지, 역사 인식 같은 주제에서 모델이 특정 방향으로 기울 가능성은 있습니다. 다만 그 방향이 미국의 "좌편향"과 같은지는 별개 문제입니다.

실용적으로 접근하면 이렇습니다. 정치·사회적으로 민감한 질문에서 모델 하나의 응답을 단일 진실로 받아들이지 않는 것이 맞습니다. 응답이 어느 방향의 논거를 담는지 의식하면서 읽고, 필요하면 여러 모델을 비교하거나 반대 논거를 직접 요청하는 것이 좋습니다.

이 글은 Washington Post 2026-06-24 보도를 참고하여 작성했습니다.