AI 에이전트 많이 만든다고 AX가 아니다
요즘IT가 4월 8일 채널톡 주최 AX 라운드테이블 발표 한 편을 정리해 올렸습니다. 발표자는 원티드랩 AX 사업 총괄 주형민 — 액센추어·EY에서 15년 컨설팅, 산업 현장 7년 혁신 리딩, AX 사업 3년 차. 컨설턴트와 현업과 외부 자문을 모두 거친 시선이 글의 무게중심입니다.
발표는 한 질문에서 출발합니다.
"성공적인 AX란 어떤 모습인가요? 우리 회사가 AX로 변화한 모습을 구체적으로 그려보신 적 있으세요?"
대부분 답을 못 합니다. 그게 지금 엔터프라이즈 AX의 실체에 가장 가깝습니다.
"AX 잘했더니 돈 벌었다"고 말하는 회사는 어디인가
기술 트렌드는 늘 빅테크 중심으로 형성됩니다. 클라우드, 빅데이터, RPA가 그랬고 지금 AI도 마찬가지입니다. "이렇게 변해야 합니다"라는 메시지가 먼저 만들어지고 기업이 따라갑니다.
문제는 생성형 AI가 주는 가치의 본질입니다. 분석형 AI가 풀던 예측·이상탐지·클러스터링에 획기적 기여를 하느냐 하면, 그건 아닙니다. 생성형 AI의 본질은 증강 — 결과물을 빠르게 만들어내는 능력입니다.
그런데 모두가 그 능력을 갖춘다면, AX 성공이라는 건 무엇을 뜻할까요. 차별화가 아니라 기본값이 된다는 의미에 가깝습니다.
지금 시장에서 "AX 잘했더니 돈을 엄청 벌었다"고 자신 있게 말하는 회사는 잘 보이지 않습니다. 수익을 올리는 쪽은 모델 사업자들 — Anthropic, OpenAI 같은 카지노의 주인장입니다. 적자라고는 하지만 치킨게임이 끝나고 독점 구조가 잡히면 토큰 비용이 그들에게 유리하게 재편됩니다.
AX는 해야 합니다. 다만 차별화의 강도는 생각보다 약합니다. 이걸 인정하고 시작하는 게 첫 걸음입니다.
검증을 뒤로 미룬 채 달리고 있다
가트너의 Top 10 Strategic Technology Trend를 보면 흐름이 읽힙니다. 2025년에 Agentic AI가 등장하고, 거버넌스 플랫폼 논의가 시작됐습니다. 그리고 데이터 신뢰성을 다루는 **디지털 프로비넌스(Digital Provenance)**가 본격적으로 대두됩니다.
그런데 현장 분위기는 그쪽이 아닙니다. 신규 기술 소개 기세가 너무 강해서 거버넌스·신뢰성은 뒤로 밀려 있습니다.
하이프 사이클을 떠올려 봅시다. 환멸의 골짜기는 반드시 옵니다. 그때가 되면 생성형 AI 결과물의 신뢰성 검증 요구가 폭증하는데, 그제서야 검증하려고 하면 이미 양이 너무 많습니다. 폭주가 시작된 뒤에는 더 어렵습니다.
엔터프라이즈가 챙겨야 할 건 세 가지로 압축됩니다. 보안, 지속적 혁신, 기업 최적화. 지금은 혁신 한 축으로만 기세가 쏠려 있고 나머지 둘이 뒤로 밀려 있습니다.
바이브 코딩이 엔터프라이즈에 위험한 이유
"나중에는 코드를 안 봐도 된다"는 주장이 있습니다. 대기업에서는 받아들이기 어려운 명제입니다. 감사·코드 검수가 들어왔을 때 코드의 근거를 추적할 수 없다면, 사고 발생 시 영향 범위가 통제 불가능하게 커집니다.
핵심 질문은 이겁니다. 외부에서 바이브 코딩으로 만들어진 코드를 기업 내부 IT 유지보수 담당자가 인수할 수 있는가? 문제 발생 시 보완 요청에 대응 가능한가? 이 질문에 답할 제도적 정비가 아직 없습니다.
과거에는 정확도 100%를 전제로 서비스를 제공했습니다. 지금은 "AI가 대부분 잘 해낼 거고, 약간의 실수는 소비자도 이해할 거다"라는 논리가 등장합니다. 신뢰성을 깎아 받아들이라는 요구가 시장에 맞는 접근인지는 의문입니다.
AI 네이티브 컴퍼니의 실체에 대한 회의도 있습니다. "직원이 한 명도 없다고 가정하고 에이전트로 전부 설계한 후 통제 인력 최소 몇 명이 필요한가" — 1년 전 어느 대표가 가져온 컨설팅 의제입니다. 실제 현장에서 이런 일이 벌어지고 있어요.
그런데 대기업에서는 다릅니다. AI로 효율화돼 "중요한 일에만 집중"한다고 하지만, 중요한 일이란 대부분 인지 부하가 높은 의사결정입니다. 단순 업무가 빠지면 고강도 결정만 남고, 결과는 번아웃입니다. 1인 기업의 성공 사례는 인상적이지만 엔터프라이즈에 그대로 적용하기엔 구조적으로 다른 문제가 있습니다.
결국 기존의 책임 체계는 유지될 수밖에 없습니다. 에이전트가 잘못 판단하면 누군가 책임져야 하니까요.
교육에 너무 많이 투자하고, 실행에는 너무 적게
원티드랩이 직접 부딪혀 본 결과는 흥미롭습니다. 대부분의 기업이 교육에 많이 투자하지만 정작 배운 것을 현장에 적용하지 못합니다. 부문 교육·임원 교육이 끝나면 개인 생산성만 좋아지고 퇴근만 빨라집니다.
토큰 이코노미라는 개념이 있는데, 토큰을 많이 쓸수록 수익으로 이어져야 합니다. 이 연결고리가 끊겨 있습니다. 교육 후 혼자 적용해 보다가 막히고, 무언가 만들긴 했지만 실무와 동떨어진 결과물만 쌓입니다.
원티드랩이 잡은 방향은 **"가르치는 것보다 직접 찾고 실행할 수 있는 환경"**이었습니다. 강의 자체보다 자기 업무에서 문제를 정의하고 풀어가는 것이 핵심입니다. 수료증이 AX 전문가를 만들지 않습니다.
3단계 체계로 정리됩니다.
1단계 — 도구 개방. 1인당 연간 약 100만 원의 교육비를 외부 교육에 쓰던 방식에서, 어떤 도구든 자유롭게 쓰라는 정책으로 전환. 결과는 분명했습니다. 다들 쓰기 시작했습니다. 사내 'AI줍줍' 사례 공유 채널에 3월 한 달 75건이 올라왔습니다(약 160명 직원, 하루 평균 3~4건).
2단계 — 챔피언 양성. 20명씩 두 달 집중 트레이닝. 한 곳에 모여 팀 구성하고 실제 업무 문제를 함께 푸는 방식. 격주 오프라인 모임에서 직접 발표. 1기 추천 의향 5점 만점 4.8. 비개발자가 빠른 속도로 자동화를 만들면서 개발자가 긴장하는 현상까지 등장.
3단계 — 실행 생태계. GitHub에 'Backyard' 내부 배포 공간, 스킬 허브, 보안 점검용 코드 스캐닝 스킬, 자체 디자인 시스템을 MCP로 연결. 총무 담당자가 2만 원짜리 바코드 리더기로 도서 반납 자동화를 구축한 사례가 인상적이었습니다.
여기서 전환점이 옵니다. 여러 에이전트를 만들다 보니 생성형 AI는 전통적 IT 개발·운영과 근본적으로 다르다는 걸 체감하게 됐습니다. 할루시네이션, CI/CD 속도 요구, 여러 LLM 유연 전환, 전수 로깅, 튜닝 기반. 이걸 묶어 자체 플랫폼 **엔노이아(Ennoia)**가 만들어졌습니다.
16개 딜레마 중 자주 부딪히는 것들
발표자는 정리해 둔 16가지 딜레마 중 현장에서 자주 마주치는 것들을 짚어줍니다.
혁신은 레이어로 나뉜다. AI 친화 리더는 리스크 감내하며 공격적, AX/DX 담당 리더는 양쪽 보며 리스크 관리, 현업은 99.9% 정확도 요구. 같은 조직 안에 세 레이어가 공존하므로 전사·부서·개인이 같은 교육을 받아서는 안 됩니다.
알고리즘 전문가는 하루 아침에 PM이 되지 않는다. 데이터 사이언티스트가 AI 엔지니어로 전환되며 PM·중재자 역할까지 떠안고 있는데, 깊이 있는 기술 역량과 대외 프로젝트 리딩은 다른 근육입니다. 데이터 엔지니어도 마찬가지로, 기존 DW와 벡터DB·임베딩·청킹은 전혀 다른 영역입니다. 누가 어떻게 데이터를 보낼지, DW 컬럼이 바뀌어 파이프라인이 깨지면 누가 책임질지 정리되지 않은 채 진행되는 경우가 많습니다.
기준 없이 시작하면 성과도 안 보인다. 베이스라인 없이 시작하면 "그래서 좋아진 게 뭐야?"에 답을 못 합니다. FTE 관점에서 업무를 분해하고 주기·빈도까지 측정 기준을 먼저 세운 다음 시작해야 합니다.
자동화했다고 끝이 아니다. 자동화 핵심 판단 기준은 명확합니다. 리스크 발생 확률이 낮을 때, 또는 사람 개입 비용이 총효용을 넘을 때. 그리고 자동화 후에도 5% 샘플링 검토나 CFR(Close File Review) 같은 QC 체계가 필요합니다. 이 작업을 AI에 위임하면 안 됩니다. AI는 책임을 못 지니까요.
에이전트 오너십이 필요하다. 설명 가능한 AI(XAI)를 넘어 '책임질 수 있는 AI'의 영역입니다. 이 에이전트의 소유자가 누구인지, 품질 관리·운영 책임자가 누구인지, 부서 간 크로스 펑셔널 통합을 누가 위임하고 승인하는지가 명확해야 합니다.
결국 같은 질문으로 돌아온다
원티드랩의 운영 원칙은 단순합니다. 외부 도구는 프로토타입과 시장 반응 검증용, 보안이 필요한 업무 자동화는 엔노이아 내 워크플로우 빌더로. 모든 에이전트를 외부에 맡길 수 없으니까요.
그리고 발표자가 마지막으로 던지는 질문이 글의 핵심입니다.
우리가 AX를 추진하는 이유는 결국 고객이 필요로 하는 것을 정확히 파악해서 PMF를 찾는 것이지, 에이전트를 많이 만들어 놓고 "AX 했다"고 선언하는 게 아닙니다.
AI가 짧은 시간에 다양한 서비스를 양산할 수 있게 한 것은 분명합니다. 그런데 고객이 그것을 원하느냐는 별개의 문제입니다. **"빨리 많이 출시하면 수익이 따라온다"**는 공식이 정말 성립하는지, 고객 수요 속도가 공급 속도를 따라갈 수 있는지 의문이 남습니다.
요즘 현장에서 작게 감지되는 변화도 흥미롭습니다. **"AI로 만든 장표로 발표하지 않았으면 좋겠다"**는 요청이 의외로 적지 않다고 합니다. 결국 고객의 마음을 움직이는 건 사람의 손길입니다. 기대만큼 드라마틱한 인력 감소 자동화는 일어나지 않을 수 있습니다.
AX는 해야 합니다. 잘 체험하고, 활용하고, 통제하는 구조를 만들어야 합니다. 다만 에이전트를 많이 만드는 것 자체가 목적이 되어선 안 됩니다. 속도만 빨라졌을 뿐 구조적으로 고민하지 않으면, 결국 같은 질문으로 돌아옵니다.
"그래서, 살림살이 나아졌나?"
이 질문에 명쾌하게 답하려면, 지금보다 조금 더 구조적으로 고민할 필요가 있어 보입니다. 같은 맥락의 다른 시각이 궁금하시면 에이전틱 AI, 도구에서 동료로 - 2026년 4월 기업 AI 현황 글이 잘 짝을 이룹니다.
원문은 요즘IT 매거진에서 보실 수 있습니다.