실무자가 먼저 부딪히는 문제는 인공지능(Artificial Intelligence, AI)이 일을 못한다는 사실이 아닙니다. 더 자주 나타나는 장면은 AI 에이전트가 만든 결과를 사람이 계속 붙잡고 있어야 한다는 점입니다. 이 현상을 최근 업무 AI 논의에서는 봇시팅(Botsitting)이라고 부릅니다.
봇시팅은 AI가 만든 산출물을 사람이 검수하는 정상적인 절차와 다릅니다. 업무 맥락을 반복해서 넣고, 여러 도구의 답을 비교하고, 오류를 고치느라 기대했던 절감 시간이 다시 사라지는 상태에 가깝습니다. 그래서 이 글의 질문은 “AI 에이전트를 써야 하는가”가 아니라 “어떤 업무에 맡겨도 관리 비용이 커지지 않는가”입니다.
WHAT CHANGED
- AI 활용의 중심이 답변 생성에서 업무 위임형 에이전트로 이동하고 있습니다.
- 시간 절감 수치는 커졌지만, 맥락 입력·검수·오류 수정이라는 숨은 노동이 함께 늘고 있습니다.
- AI 도입 성패는 모델 성능보다 데이터 연결, 검수 기준, 책임선에서 먼저 갈립니다.
봇시팅이란 무엇인가
봇시팅은 AI 에이전트가 자율적으로 일을 끝내지 못할 때, 사람이 옆에서 계속 관리하는 업무를 뜻합니다. 맥락을 다시 설명하고, 잘못된 결과를 고치고, 여러 도구 사이에서 산출물을 옮기며, 최종 결과가 실제 업무에 쓸 수 있는지 확인하는 시간이 여기에 들어갑니다.
이 용어가 중요해진 이유는 단순합니다. AI가 업무 시간을 줄여준다는 기대와 달리, 일부 조직에서는 AI가 만든 일을 다시 사람이 수습하는 시간이 생기고 있기 때문입니다. 자동화가 사람을 대체하기 전에, 사람이 자동화를 관리하는 단계가 먼저 온 셈입니다.
| AI 사용 시간의 구분 | 비중 | 실무 의미 |
|---|---|---|
| 봇시팅 | 37% | 맥락 재입력, 답변 비교, 오류 수정, 산출물 정리 |
| AI로 실제 작업 수행 | 36% | 초안 작성, 분석, 요약, 정보 정리 |
| 학습 및 에이전트 구축 | 27% | 도구 학습, 워크플로 설계, 새 모델 실험 |
왜 AI 에이전트가 일을 줄이기 전에 일을 늘리는가
첫 번째 이유는 업무 맥락입니다. 대규모 언어 모델(Large Language Model, LLM)은 일반 지식을 잘 다룰 수 있지만, 특정 회사의 고객명, 내부 약속, 제품 정책, 보고서 기준까지 자동으로 아는 것은 아닙니다. 그래서 직원은 일을 맡기기 전에 배경을 다시 설명해야 합니다.
두 번째 이유는 결과 검수입니다. AI 에이전트의 답은 문장만 보면 완성된 결과처럼 보입니다. 하지만 숫자 기준이 틀렸거나, 최신 정보가 빠졌거나, 내부 정책과 맞지 않을 수 있습니다. 이때 검수는 단순 확인이 아니라 사실상 재작업이 됩니다.
세 번째 이유는 도구 분산입니다. 팀이 여러 AI 도구를 동시에 쓰면 같은 맥락을 반복해서 넣고, 서로 다른 답을 비교하고, 최종 결과를 다시 한 문서로 합쳐야 합니다. 이 과정은 자동화가 아니라 조율 업무에 가깝습니다.
NOTE
모든 봇시팅이 나쁜 것은 아닙니다. 고위험 산출물을 사람이 검수하고, 업무 맥락을 보강하고, 프롬프트를 개선하는 과정은 필요한 품질 관리입니다. 문제는 이 시간이 조직 안에서 비용으로 계산되지 않을 때 생깁니다.
실제 사례가 보여준 것은 자동화 실패가 아니라 역할 배분 실패다
Business Insider는 AI 전략가 Sol Rashidi가 네 개의 AI 에이전트 중 두 개를 중단한 사례를 보도했습니다. 이유는 에이전트가 유용하지 않아서만은 아니었습니다. 계속 맥락을 교정하고 결과를 붙잡는 시간이 커지면서, 일부 업무는 사람 가상 비서에게 맡기는 편이 낫다고 판단한 것입니다.
이 사례를 “AI 에이전트는 쓸모없다”는 결론으로 읽으면 초점이 빗나갑니다. 더 정확히는 업무를 맡길 기준이 정리되지 않은 상태에서 에이전트 수를 늘리면, 관리 대상만 늘어난다는 신호입니다. 사람을 줄이는 기술이 아니라, 사람의 판단을 어디에 남길지 정해야 하는 운영 문제입니다.
생산성 수치는 왜 조직 성과로 바로 이어지지 않는가
AI 도구를 쓰는 개인은 시간을 아꼈다고 느낄 수 있습니다. 보고서 초안, 이메일 요약, 코드 수정, 자료 정리처럼 부분 작업은 분명 빨라졌습니다. 그런데 조직 성과는 다른 질문입니다. 산출물이 실제 의사결정에 쓰였는지, 재작업을 줄였는지, 고객 응답 품질이 올라갔는지를 따로 봐야 합니다.
워크 AI 인스티튜트의 2026년 보고서가 보여주는 간극도 여기에 있습니다. 디지털 근로자의 상당수가 AI를 쓰고 시간을 절약한다고 말하지만, 조직 성과가 크게 좋아졌다고 보는 비율은 낮습니다. 시간 절감이 생겼더라도 그 일부가 맥락 입력, 오류 수정, 도구 전환에 다시 쓰인다면 순효과는 작아질 수 있습니다.
| 도입 전 질문 | 봇시팅이 커지는 경우 | 운영 기준이 잡힌 경우 |
|---|---|---|
| 맥락은 어디에서 가져오는가 | 사용자가 매번 복사해 붙여넣습니다. | 문서, 고객 정보, 정책 자료의 연결 범위가 정해져 있습니다. |
| 산출물은 누가 승인하는가 | 최종 책임자가 불분명해 여러 사람이 다시 확인합니다. | 업무 유형별 검수자와 승인 기준이 분리되어 있습니다. |
| 실패는 어떻게 처리하는가 | 오답이 나오면 사용자가 처음부터 다시 시도합니다. | 실패 유형, 재시도 기준, 사람에게 넘기는 조건이 있습니다. |
AI 에이전트 도입 전에 어떤 기준을 봐야 하나
첫 기준은 반복성입니다. 같은 입력, 같은 기준, 같은 결과 형식이 반복되는 업무는 에이전트에 맡기기 좋습니다. 반대로 매번 판단 기준이 바뀌거나 조직 정치, 고객 관계, 법무 리스크가 얽히는 업무는 처음부터 완전 자동화를 목표로 잡기 어렵습니다.
두 번째 기준은 검수 비용입니다. 사람이 결과를 확인하는 데 드는 시간이 원래 업무 시간보다 길다면 자동화가 아닙니다. 특히 보고서, 광고 문구, 고객 응대, 데이터 분석처럼 외부 노출이나 의사결정에 쓰이는 산출물은 검수 시간을 별도 비용으로 잡아야 합니다.
세 번째 기준은 접근권입니다. AI 에이전트가 어떤 문서와 시스템에 접근할 수 있는지, 어떤 작업까지 실행할 수 있는지, 실패했을 때 누가 회수하는지 정하지 않으면 봇시팅은 보안 문제로 이어집니다. 승인되지 않은 AI 도구가 늘어나는 그림자 AI(Shadow AI)도 같은 맥락에서 봐야 합니다.
CHECKLIST
- 이 업무는 입력과 결과 형식이 반복되는가?
- AI가 필요한 업무 맥락을 매번 사람이 다시 넣고 있지는 않은가?
- 산출물 검수 시간이 원래 업무 시간보다 짧은가?
- 오답, 누락, 최신성 오류가 났을 때 사람에게 넘기는 기준이 있는가?
- AI 에이전트의 접근권, 실행권, 기록 관리 기준이 정해져 있는가?
다음에 볼 지표는 에이전트 수가 아니다
조직이 AI 에이전트를 몇 개 도입했는지는 좋은 지표가 아닙니다. 더 중요한 것은 에이전트 하나가 줄인 업무 시간에서 검수, 오류 수정, 맥락 입력 시간을 뺀 순절감 시간입니다. 이 숫자가 없다면 도입 성과는 사용량 지표에 머무를 가능성이 큽니다.
다음에 확인할 항목은 세 가지입니다. 첫째, 에이전트가 실제로 완료한 업무 중 재작업 없이 통과한 비율입니다. 둘째, 사람 검수(Human-in-the-loop, HITL)가 필요한 지점과 평균 소요 시간입니다. 셋째, 에이전트가 접근한 데이터와 실행한 작업의 기록입니다. 봇시팅을 줄이는 출발점은 더 많은 AI가 아니라, 더 적은 재작업입니다.
봇시팅은 AI 에이전트가 만든 결과를 사람이 계속 관리하느라 기대한 시간 절감이 줄어드는 현상입니다. 원인은 모델 성능만이 아니라 업무 맥락 부족, 검수 기준 부재, 도구 분산, 접근권 관리의 빈틈에 있습니다. 실무자는 에이전트 수보다 순절감 시간, 재작업률, 사람 검수 소요 시간, 접근권 기록을 먼저 확인해야 합니다.
FAQ
자주 묻는 질문
Q. 봇시팅이란 무엇인가요?
봇시팅은 AI 에이전트가 만든 결과를 사람이 계속 관리하고 수정하는 숨은 업무를 뜻합니다. 맥락 입력, 오류 수정, 결과 검수, 도구 간 복사 작업이 여기에 포함됩니다.
Q. 봇시팅은 AI를 쓰지 말아야 한다는 뜻인가요?
아닙니다. 필요한 검수와 품질 관리는 AI 활용의 일부입니다. 다만 이 시간이 조직에서 비용으로 계산되지 않으면, AI 도입 효과가 실제보다 크게 보일 수 있습니다.
Q. AI 에이전트 도입 전에 가장 먼저 확인할 것은 무엇인가요?
가장 먼저 볼 것은 자동화 대상 업무의 반복성과 검수 비용입니다. 같은 기준으로 반복되는 업무인지, 사람이 확인하는 시간이 얼마나 드는지, 실패했을 때 회수 기준이 있는지 확인해야 합니다.
Q. 봇시팅을 줄이려면 어떤 지표를 봐야 하나요?
순절감 시간, 재작업률, 사람 검수 소요 시간, 에이전트 접근권 기록을 함께 봐야 합니다. 사용량이나 생성 건수만 보면 관리 비용이 가려질 수 있습니다.
References
- [1] Glean Work AI Institute | Work AI Index 2026
- [2] Glean | The Work AI Index 2026: Botsitting, botshitting, and the hidden human labor of AI at work
- [3] Business Insider | An AI strategist fired half her AI agents after becoming a 'botsitter'
- [4] CIO | The hidden cost of enterprise AI: 6.4 hours a week babysitting bots
- [5] arXiv | Agentic AI in Industry: Adoption Level and Deployment Barriers
- [6] Okta | AI Agents at Work 2026: Securing the agentic enterprise

댓글
댓글 쓰기