에이전트가 온다

PART I

에이전트는 왜
토큰을 먹는가?

사람이나 동물이 음식을 섭취하듯, 에이전트는 토큰을 소비하며 작동하고 진화한다.
토큰은 단순한 연산 단위를 넘어, AI가 사고하고 실행하는 과정 전체를 구성하는 '연료'에 해당한다.

기존의 챗봇 환경에서는 사용자의 질문에 대해 단일 응답을 생성하는 구조였기 때문에, 토큰 소비는 제한적이었다. 그러나 추론 중심 모델의 등장 이후, AI는 단순 응답을 넘어 복잡한 사고 과정을 거치기 시작했으며, 이 과정에서 토큰 소비는 점진적으로 증가해왔다.

이러한 흐름은 에이전트의 등장과 함께 구조적인 전환점을 맞이하고 있다. 에이전트는 목표를 기반으로 스스로 계획을 수립하고, 이를 실행하며, 결과를 검증하고, 필요 시 재시도하는 일련의 과정을 반복한다. 즉, 하나의 요청이 다수의 단계로 분해되며, 토큰 소비는 단일 응답이 아닌 '워크플로 단위'로 확장된다.

특히 에이전트는 도구를 호출하거나 코드를 실행하고 외부 데이터를 조회하는 실행 단계가 추가되면서, 토큰은 단순 생성 비용이 아닌 '작업 수행 비용'으로 성격이 변화하고 있다.

결과적으로 토큰 수요는 더 이상 사용자 수에 비례하지 않는다. 동일한 사용자라도 에이전트를 활용할 경우, 기존 대비 수십 배 이상의 토큰을 소비하게 되며, 이는 AI 수요 구조가 근본적으로 변화하고 있음을 시사한다.

DATA

데이터로 보는 토큰 수요 구조 변화

OpenRouter · Anthropic · Gartner 데이터 기반

AGENT vs CHATBOT

에이전트 vs 챗봇 — 토큰 소비 배수 비교

에이전트 1명 = 챗봇 사용자 수십~수백 명 분 토큰

TOKEN VOLUME

에이전트 시대의 토큰 사용 구조 변화

평균 프롬프트 ~4배 · 평균 시퀀스 길이 ~3배 증가

WORKFLOW RATIO

에이전트 워크플로우 비율 변화

출처: Gartner, G2, KPMG 리서치 기반 추정

OPENROUTER

OpenRouter 구조 변화: 프로그래밍 + 추론 모델 비중

프로그래밍 카테고리 vs 추론 최적화 모델 점유율

ANTHROPIC

Anthropic 에이전트 코딩 지표 비교

챗봇 시대(2025 Q1) vs 에이전트 시대(2026 Q1)

PART II

토큰 경제학

에이전트에 있어 토큰은 필연적이다. 그리고 AI 에이전트의 실사용을 가장 직접적으로 보여주는 것은 시장 전망이 아니라 실제 트래픽 데이터다.

OpenRouter는 수백 개의 모델을 다양한 제공사로부터 라우팅하며, 수백만 사용자의 실제 API 호출을 처리하는 대표적인 AI 추론 플랫폼이다. 해당 플랫폼의 주간 토큰 사용량은 지난 1년간 약 +949% 성장하며, 2025년 3월 약 1.9T 수준에서 2026년 3월에는 약 20T까지 급증했다.

물론 개발자 중심 플랫폼이라는 점에서 전체 시장을 그대로 대변한다고 보기는 어렵지만, 에이전트 기반 사용 패턴에서 토큰 소비가 어떻게 증가하는지를 보여주는 유의미한 사례로 해석할 수 있다.

에이전트 실사용의 가장 직접적인 증거는 툴 콜(Tool Call) 비율이다. Anthropic API 호출 중 모델이 도구 호출을 요청한 비율이 1년 만에 5%에서 25%+로 폭발했으며, 에이전트 전문 모델(MiniMax M2)의 경우 80%+에 달한다.

전체 토큰이 약 10배 증가했지만, 사용자 수가 10배 늘어난 것이 아니다.
에이전트 사용자 1명이 챗봇 사용자 수십~수백 명 분의 토큰을 소비한다.

챗봇 1회 1x

~1.5K 토큰

단일 에이전트 4x

10~20회 연쇄 호출

멀티 에이전트 15x

수백 회 API 호출

🐼 = 챗봇 사용자 1명 분의 토큰 | 구조 자체가 변한 것이다.

PART III

오픈클로 - 에이전트 시대의 시작

올해 초 GitHub에서 가장 큰 화두는 OpenClaw였다. 이는 기존 챗봇 중심 AI에서 벗어나, 실제로 작업을 수행하는 에이전트 중심 패러다임으로의 전환을 이끌었다. 이후 빠르게 확산되며 에이전트 생태계가 본격적으로 형성되고 있으며, 이에 따라 토큰 소모량 또한 구조적으로 폭발하는 국면에 진입했다.

hover me

SOUL.md 사람의 성격과 가치관처럼, 에이전트의 판단 기준을 정의

AGENT.md 사람의 행동 방식과 역할처럼, 어떻게 일할지를 규정

TOOLS.md 사람의 손과 도구처럼, 실제로 일을 수행하는 수단

USER.md 사람의 관계와 취향 이해처럼, 사용자에 맞춘 정보

MEMORY.md 사람의 기억처럼, 경험과 데이터를 축적

2월 중순 이후 OpenClaw를 사용하며 확인한 점은 명확하다.
에이전트를 경험한 사용자는 기존 챗봇으로 회귀하기 어려워지며, 자연스럽게 강한 lock-in 구조가 형성된다.

이는 단순한 편의성 개선을 넘어, 정보 처리 방식 자체를 변화시키는 경험에서 기인한다. 실제 사례는 다음과 같다.

불편했던 점

해외 기업 IR·컨퍼런스콜·재무자료가 언어·파일 형식 문제로 파편화되어 정리가 어려웠다.

개선된 점

자동 수집 → 통합·가공 → 한 번에 정리로 처리 흐름이 완전히 바뀌었다.

불편했던 점

수천 건의 텔레그램 메시지를 직접 읽고 분류하기가 어려웠다.

개선된 점

핵심만 요약된 브리핑으로 자동 정리되어 바로 확인할 수 있게 되었다.

불편했던 점

매일 쏟아지는 뉴스·실적 자료를 텍스트로 직접 소화하기 어려웠다.

개선된 점

팟캐스트 형태로 자동 가공되어 출퇴근 중 음성으로 소비한다.

이처럼 OpenClaw는 기존의 불편한 정보 처리 과정을 자동화하고, 내 투자 전반에 있어 반복적인 작업을 수행하는 나만의 전문 AI 비서로 자리잡고 있다.

OPENCLAW LAUNCH

OpenClaw 출시 이후 차트

2026.02.01 출시 이후 — OpenRouter 실사용 데이터 기반

BEFORE / AFTER

OpenClaw 출시 전후 시장 영향

출시 후 6주 만에 시장 평균 대비 +119% 초과 성장

MILESTONE

OpenClaw 토큰 사용량 타임라인

베타 출시부터 현재까지 — 누적 19.4T 달성

2025-11 베타 출시 (Cluadnot) 0.1T

2025-11 말 OpenClaw 0.1 론칭 0.2T

2026-01 초 페이먼트 기능 업데이트 —

2026-01 중 OpenRouter 파트너십 1.5T

2026-02 초 GitHub Stars 지속 증가 2.7T

2026-02 말 SaaS 버전 출시 3.57T

2026-03 초 기업 고객 150사+ 달성 4.2T

2026-03-23 현재 5.37T

WEEKLY VOLUME

주간 토큰 사용량 & 시장 점유율

출시 7주 — 17% → 26% 점유율 확대

CUMULATIVE

누적 토큰 사용량 추이

7주 누적 19.4T · 가파른 가속 구간 진입

PART IV

중국 모델의 부상

'중국에서 바닷가재를 키운다'는 표현이 등장했는데, 이는 단순한 유행이 아니라 OpenClaw 기반 에이전트 열풍을 의미한다. 실제로 중국에서는 에이전트를 활용해 자동화된 작업을 수행하고 수익화하는 사례가 빠르게 확산되고 있으며, 이는 하나의 산업 초기 국면으로 해석할 수 있다. 실제 Github를 중심으로 중국 내 OpenClaw 관련 프로젝트가 빠르게 증가하고 있다.

그렇다면 왜 중국이 가장 빠를까?

진짜 일을 해주는 구조

일을 대신 해주는 AI라는 인식이 생기면서, 사람의 업무를 AI로 대체하려는 움직임이 빠르게 나타나고 있다.

'바닷가재 키우기' 밈 확산

에이전트를 지속적으로 운영해 자동화를 구현하면 실제 수익으로 이어질 수 있다는 기대감이 형성되고 있다.

중국 특유의 확산 구조

Tencent·Baidu·Alibaba 등 빅테크 주도로 OpenClaw가 빠르게 확산되고 있으며, WeChat 통합으로 일반 사용자 접근성도 크게 높아지고 있다.

마지막으로 OpenRouter 상위 모델을 살펴보면, 중국 모델의 비중이 빠르게 확대되고 있음을 확인할 수 있으며 이는 상대적으로 저렴한 비용 구조를 기반으로 한 빠른 확산이 주요 원인으로 작용하고 있다.

#	모델	제공자	주간 토큰	변화	국적
1	MiMo-V2-Pro	Xiaomi	1.49T	NEW	🇨🇳
2	Step 3.5 Flash	StepFun	1.48T	+10%	🇨🇳
3	MiniMax M2.5	MiniMax	1.3T	-26%	🇨🇳
4	DeepSeek V3.2	DeepSeek	1.14T	+10%	🇨🇳
5	Claude Sonnet 4.6	Anthropic	1.04T	+17%	🇺🇸
6	GLM 5 Turbo	Z-AI (Zhipu)	1.03T	NEW	🇨🇳
7	Claude Opus 4.6	Anthropic	976B	+19%	🇺🇸
8	Gemini 3 Flash	Google	939B	-8%	🇺🇸
9	Hunter Alpha	OpenRouter	919B	+38%	—
10	Gemini 2.5 Flash	Google	581B	+3%	🇺🇸

Source: OpenRouter Rankings · 2026-03-23 기준

[표1] 주요 모델 토큰 비용 비교 (일 10억 토큰 기준)

모델	Input 비용	Output 비용	일간 합계
Claude Sonnet 4.6	$1,500	$7,500	$9,000/일
Claude Opus 4.6	$2,500	$12,500	$15,000/일
MiniMax M2.5	$150	$600	$750/일

하루 10억 개의 토큰을 사용한다고 가정하면 (인풋:아웃풋 = 1:1 기준) Claude Sonnet 기준으로는 일 약 $9,000, Opus는 $15,000 수준에 달하는 반면, MiniMax M2.5는 약 $750으로 Claude 대비 12~20배 저렴한 수준이다. 현재 출시된 Minimax 에이전트가 24시간 가동되는 구조에서는 토큰당 비용이 핵심 의사결정 변수로 작용하며, 이러한 가격 차이가 중국 모델 확산의 직접적인 원인으로 해석된다.

에이전트 구축 관점에서는 고성능 모델을 활용해 정교하게 튜닝할 것인지, 혹은 비용 효율적인 모델을 기반으로 확장할 것인지의 선택이 가능하다. 다만 일반적인 사용자 입장에서는 고가의 모델을 지속적으로 사용하는 것이 현실적으로 부담이 크기 때문에, 상대적으로 저렴한 비용 구조를 가진 중국 모델이 빠르게 채택되고 있는 것으로 판단된다.

주요 모델 벤치마크 비교

Source: OpenRouter Benchmark · 2026-03-23 기준

중국 vs 미국 모델 주간 사용량 추이

OpenRouter 주간 토큰 사용량 (기타 제외)

Source: OpenRouter Weekly Token Usage · 2026-04 기준 (기타 제외)

PART V

회사명	역할	거래소	종목코드	투자 포인트
NVIDIA	GPU 인프라	NASDAQ	NVDA	AI 인프라 독점
Microsoft	모델+클라우드	NASDAQ	MSFT	OpenAI 최대 투자자
Alphabet	모델+클라우드	NASDAQ	GOOGL	DeepMind 자회사
Amazon	클라우드+투자	NASDAQ	AMZN	Anthropic 투자자
Meta	오픈소스 모델	NASDAQ	META	오픈소스 최대 기여
Alibaba	모델+클라우드	NYSE / HKEX	BABA / 9988	중국 AI 클라우드
Samsung	디바이스 AI	KRX	005930	온디바이스 AI
Xiaomi	디바이스 AI	HKEX	1810	IoT + AI
Baidu	모델+검색	NASDAQ	BIDU	중국 AI 검색
MiniMax	모델 #1	HKEX	0100	2026.01 IPO · 급성장
Zhipu AI	모델	HKEX	2513	2026.01 IPO

회사명	예상 밸류에이션	예상 시기	거래소	핵심 포인트
OpenAI	$500B ~ 1T	2026 H2	NASDAQ	세계 최대 AI 기업
xAI	$20B	2026	NASDAQ	Elon Musk · Grok
Anthropic	$380B	2026~2027	NASDAQ	Claude · 안전한 AI
Mistral AI	—	2026~2027	Euronext	유럽 AI 챔피언
Cohere	—	2026~2027	NASDAQ / TSX	기업용 AI
Moonshot AI	—	2026~2027	HKEX	중국 Kimi 챗봇

에이전트는 왜
토큰을 먹는가?

데이터로 보는 토큰 수요 구조 변화

에이전트 vs 챗봇 — 토큰 소비 배수 비교

에이전트 시대의 토큰 사용 구조 변화

에이전트 워크플로우 비율 변화

OpenRouter 구조 변화: 프로그래밍 + 추론 모델 비중

Anthropic 에이전트 코딩 지표 비교

토큰 경제학

시장이 말하는 것들

OpenRouter 전체 주간 토큰 사용량 추이

제공사별 주간 토큰 사용량

앱 카테고리별 토큰 점유율

제공사별 AI 모델 시장 점유율

오픈클로 - 에이전트 시대의 시작

OpenClaw 출시 이후 차트

OpenClaw 출시 전후 시장 영향

OpenClaw 토큰 사용량 타임라인

주간 토큰 사용량 & 시장 점유율

누적 토큰 사용량 추이

중국 모델의 부상

관련 기업 리스트

에이전트가 온다

에이전트는 왜토큰을 먹는가?

데이터로 보는 토큰 수요 구조 변화

에이전트 vs 챗봇 — 토큰 소비 배수 비교

에이전트 시대의 토큰 사용 구조 변화

에이전트 워크플로우 비율 변화

OpenRouter 구조 변화: 프로그래밍 + 추론 모델 비중

Anthropic 에이전트 코딩 지표 비교

토큰 경제학

시장이 말하는 것들

OpenRouter 전체 주간 토큰 사용량 추이

제공사별 주간 토큰 사용량

앱 카테고리별 토큰 점유율

제공사별 AI 모델 시장 점유율

오픈클로 - 에이전트 시대의 시작

OpenClaw 출시 이후 차트

OpenClaw 출시 전후 시장 영향

OpenClaw 토큰 사용량 타임라인

주간 토큰 사용량 & 시장 점유율

누적 토큰 사용량 추이

중국 모델의 부상

관련 기업 리스트

에이전트는 왜
토큰을 먹는가?