AI 에이전트의 시대
사람이나 동물이 음식을 섭취하듯, 에이전트는 토큰을 소비하며 작동하고 진화한다.
토큰은 단순한 연산 단위를 넘어, AI가 사고하고 실행하는 과정 전체를 구성하는 '연료'에 해당한다.
기존의 챗봇 환경에서는 사용자의 질문에 대해 단일 응답을 생성하는 구조였기 때문에, 토큰 소비는 제한적이었다. 그러나 추론 중심 모델의 등장 이후, AI는 단순 응답을 넘어 복잡한 사고 과정을 거치기 시작했으며, 이 과정에서 토큰 소비는 점진적으로 증가해왔다.
이러한 흐름은 에이전트의 등장과 함께 구조적인 전환점을 맞이하고 있다. 에이전트는 목표를 기반으로 스스로 계획을 수립하고, 이를 실행하며, 결과를 검증하고, 필요 시 재시도하는 일련의 과정을 반복한다. 즉, 하나의 요청이 다수의 단계로 분해되며, 토큰 소비는 단일 응답이 아닌 '워크플로 단위'로 확장된다.
특히 에이전트는 도구를 호출하거나 코드를 실행하고 외부 데이터를 조회하는 실행 단계가 추가되면서, 토큰은 단순 생성 비용이 아닌 '작업 수행 비용'으로 성격이 변화하고 있다.
결과적으로 토큰 수요는 더 이상 사용자 수에 비례하지 않는다. 동일한 사용자라도 에이전트를 활용할 경우, 기존 대비 수십 배 이상의 토큰을 소비하게 되며, 이는 AI 수요 구조가 근본적으로 변화하고 있음을 시사한다.
OpenRouter · Anthropic · Gartner 데이터 기반
에이전트 1명 = 챗봇 사용자 수십~수백 명 분 토큰
평균 프롬프트 ~4배 · 평균 시퀀스 길이 ~3배 증가
출처: Gartner, G2, KPMG 리서치 기반 추정
프로그래밍 카테고리 vs 추론 최적화 모델 점유율
챗봇 시대(2025 Q1) vs 에이전트 시대(2026 Q1)
에이전트에 있어 토큰은 필연적이다. 그리고 AI 에이전트의 실사용을 가장 직접적으로 보여주는 것은 시장 전망이 아니라 실제 트래픽 데이터다.
OpenRouter는 수백 개의 모델을 다양한 제공사로부터 라우팅하며, 수백만 사용자의 실제 API 호출을 처리하는 대표적인 AI 추론 플랫폼이다. 해당 플랫폼의 주간 토큰 사용량은 지난 1년간 약 +949% 성장하며, 2025년 3월 약 1.9T 수준에서 2026년 3월에는 약 20T까지 급증했다.
물론 개발자 중심 플랫폼이라는 점에서 전체 시장을 그대로 대변한다고 보기는 어렵지만, 에이전트 기반 사용 패턴에서 토큰 소비가 어떻게 증가하는지를 보여주는 유의미한 사례로 해석할 수 있다.
에이전트 실사용의 가장 직접적인 증거는 툴 콜(Tool Call) 비율이다. Anthropic API 호출 중 모델이 도구 호출을 요청한 비율이 1년 만에 5%에서 25%+로 폭발했으며, 에이전트 전문 모델(MiniMax M2)의 경우 80%+에 달한다.
전체 토큰이 약 10배 증가했지만, 사용자 수가 10배 늘어난 것이 아니다.
에이전트 사용자 1명이 챗봇 사용자 수십~수백 명 분의 토큰을 소비한다.
🐼 = 챗봇 사용자 1명 분의 토큰 | 구조 자체가 변한 것이다.
OpenRouter 실사용 데이터 기반 — 2025.03 ~ 2026.03
1년간 +949% 성장 · 2026.03 기준 주 19T 토큰
Google · Anthropic · OpenAI · DeepSeek 4강 체제 형성
생성성/에이전트 + 코딩 에이전트가 전체의 91.5%
2026-03-15 기준 · OpenRouter 트래픽 기반
올해 초 GitHub에서 가장 큰 화두는 OpenClaw였다. 이는 기존 챗봇 중심 AI에서 벗어나, 실제로 작업을 수행하는 에이전트 중심 패러다임으로의 전환을 이끌었다. 이후 빠르게 확산되며 에이전트 생태계가 본격적으로 형성되고 있으며, 이에 따라 토큰 소모량 또한 구조적으로 폭발하는 국면에 진입했다.
hover me
2월 중순 이후 OpenClaw를 사용하며 확인한 점은 명확하다.
에이전트를 경험한 사용자는 기존 챗봇으로 회귀하기 어려워지며,
자연스럽게 강한 lock-in 구조가 형성된다.
이는 단순한 편의성 개선을 넘어, 정보 처리 방식 자체를 변화시키는 경험에서 기인한다. 실제 사례는 다음과 같다.
해외 기업 IR·컨퍼런스콜·재무자료가 언어·파일 형식 문제로 파편화되어 정리가 어려웠다.
자동 수집 → 통합·가공 → 한 번에 정리로 처리 흐름이 완전히 바뀌었다.
수천 건의 텔레그램 메시지를 직접 읽고 분류하기가 어려웠다.
핵심만 요약된 브리핑으로 자동 정리되어 바로 확인할 수 있게 되었다.
매일 쏟아지는 뉴스·실적 자료를 텍스트로 직접 소화하기 어려웠다.
팟캐스트 형태로 자동 가공되어 출퇴근 중 음성으로 소비한다.
이처럼 OpenClaw는 기존의 불편한 정보 처리 과정을 자동화하고, 내 투자 전반에 있어 반복적인 작업을 수행하는 나만의 전문 AI 비서로 자리잡고 있다.
2026.02.01 출시 이후 — OpenRouter 실사용 데이터 기반
출시 후 6주 만에 시장 평균 대비 +119% 초과 성장
베타 출시부터 현재까지 — 누적 19.4T 달성
출시 7주 — 17% → 26% 점유율 확대
7주 누적 19.4T · 가파른 가속 구간 진입
'중국에서 바닷가재를 키운다'는 표현이 등장했는데, 이는 단순한 유행이 아니라 OpenClaw 기반 에이전트 열풍을 의미한다. 실제로 중국에서는 에이전트를 활용해 자동화된 작업을 수행하고 수익화하는 사례가 빠르게 확산되고 있으며, 이는 하나의 산업 초기 국면으로 해석할 수 있다. 실제 Github를 중심으로 중국 내 OpenClaw 관련 프로젝트가 빠르게 증가하고 있다.
그렇다면 왜 중국이 가장 빠를까?
진짜 일을 해주는 구조
일을 대신 해주는 AI라는 인식이 생기면서, 사람의 업무를 AI로 대체하려는 움직임이 빠르게 나타나고 있다.
'바닷가재 키우기' 밈 확산
에이전트를 지속적으로 운영해 자동화를 구현하면 실제 수익으로 이어질 수 있다는 기대감이 형성되고 있다.
중국 특유의 확산 구조
Tencent·Baidu·Alibaba 등 빅테크 주도로 OpenClaw가 빠르게 확산되고 있으며, WeChat 통합으로 일반 사용자 접근성도 크게 높아지고 있다.
마지막으로 OpenRouter 상위 모델을 살펴보면, 중국 모델의 비중이 빠르게 확대되고 있음을 확인할 수 있으며 이는 상대적으로 저렴한 비용 구조를 기반으로 한 빠른 확산이 주요 원인으로 작용하고 있다.
| # | 모델 | 제공자 | 주간 토큰 | 변화 | 국적 |
|---|---|---|---|---|---|
| 1 | MiMo-V2-Pro | Xiaomi | 1.49T | NEW | 🇨🇳 |
| 2 | Step 3.5 Flash | StepFun | 1.48T | +10% | 🇨🇳 |
| 3 | MiniMax M2.5 | MiniMax | 1.3T | -26% | 🇨🇳 |
| 4 | DeepSeek V3.2 | DeepSeek | 1.14T | +10% | 🇨🇳 |
| 5 | Claude Sonnet 4.6 | Anthropic | 1.04T | +17% | 🇺🇸 |
| 6 | GLM 5 Turbo | Z-AI (Zhipu) | 1.03T | NEW | 🇨🇳 |
| 7 | Claude Opus 4.6 | Anthropic | 976B | +19% | 🇺🇸 |
| 8 | Gemini 3 Flash | 939B | -8% | 🇺🇸 | |
| 9 | Hunter Alpha | OpenRouter | 919B | +38% | — |
| 10 | Gemini 2.5 Flash | 581B | +3% | 🇺🇸 |
Source: OpenRouter Rankings · 2026-03-23 기준
[표1] 주요 모델 토큰 비용 비교 (일 10억 토큰 기준)
| 모델 | Input 비용 | Output 비용 | 일간 합계 |
|---|---|---|---|
| Claude Sonnet 4.6 | $1,500 | $7,500 | $9,000/일 |
| Claude Opus 4.6 | $2,500 | $12,500 | $15,000/일 |
| MiniMax M2.5 | $150 | $600 | $750/일 |
하루 10억 개의 토큰을 사용한다고 가정하면 (인풋:아웃풋 = 1:1 기준) Claude Sonnet 기준으로는 일 약 $9,000, Opus는 $15,000 수준에 달하는 반면, MiniMax M2.5는 약 $750으로 Claude 대비 12~20배 저렴한 수준이다. 현재 출시된 Minimax 에이전트가 24시간 가동되는 구조에서는 토큰당 비용이 핵심 의사결정 변수로 작용하며, 이러한 가격 차이가 중국 모델 확산의 직접적인 원인으로 해석된다.
에이전트 구축 관점에서는 고성능 모델을 활용해 정교하게 튜닝할 것인지, 혹은 비용 효율적인 모델을 기반으로 확장할 것인지의 선택이 가능하다. 다만 일반적인 사용자 입장에서는 고가의 모델을 지속적으로 사용하는 것이 현실적으로 부담이 크기 때문에, 상대적으로 저렴한 비용 구조를 가진 중국 모델이 빠르게 채택되고 있는 것으로 판단된다.
주요 모델 벤치마크 비교
Source: OpenRouter Benchmark · 2026-03-23 기준
중국 vs 미국 모델 주간 사용량 추이
OpenRouter 주간 토큰 사용량 (기타 제외)
관련 기업 리스트
| 회사명 | 역할 | 거래소 | 종목코드 | 투자 포인트 |
|---|---|---|---|---|
| NVIDIA | GPU 인프라 | NASDAQ | NVDA | AI 인프라 독점 |
| Microsoft | 모델+클라우드 | NASDAQ | MSFT | OpenAI 최대 투자자 |
| Alphabet | 모델+클라우드 | NASDAQ | GOOGL | DeepMind 자회사 |
| Amazon | 클라우드+투자 | NASDAQ | AMZN | Anthropic 투자자 |
| Meta | 오픈소스 모델 | NASDAQ | META | 오픈소스 최대 기여 |
| Alibaba | 모델+클라우드 | NYSE / HKEX | BABA / 9988 | 중국 AI 클라우드 |
| Samsung | 디바이스 AI | KRX | 005930 | 온디바이스 AI |
| Xiaomi | 디바이스 AI | HKEX | 1810 | IoT + AI |
| Baidu | 모델+검색 | NASDAQ | BIDU | 중국 AI 검색 |
| MiniMax | 모델 #1 | HKEX | 0100 | 2026.01 IPO · 급성장 |
| Zhipu AI | 모델 | HKEX | 2513 | 2026.01 IPO |
IPO 파이프라인 (2026~2027 예상)
| 회사명 | 예상 밸류에이션 | 예상 시기 | 거래소 | 핵심 포인트 |
|---|---|---|---|---|
| OpenAI | $500B ~ 1T | 2026 H2 | NASDAQ | 세계 최대 AI 기업 |
| xAI | $20B | 2026 | NASDAQ | Elon Musk · Grok |
| Anthropic | $380B | 2026~2027 | NASDAQ | Claude · 안전한 AI |
| Mistral AI | — | 2026~2027 | Euronext | 유럽 AI 챔피언 |
| Cohere | — | 2026~2027 | NASDAQ / TSX | 기업용 AI |
| Moonshot AI | — | 2026~2027 | HKEX | 중국 Kimi 챗봇 |
Disclaimer
본 리포트는 공개된 데이터와 OpenRouter 플랫폼 통계를 기반으로 작성된 정보 제공 목적의 자료입니다. 투자 권유 또는 매수·매도 추천이 아니며, 실제 투자 결정에 따른 손익은 투자자 본인에게 귀속됩니다. 본 자료에 포함된 미래 전망, 예상 밸류에이션, IPO 일정 등은 현재 시점의 추정치로서 실제와 다를 수 있습니다. 투자 전 반드시 해당 기업의 공시 자료 및 전문 투자 상담을 확인하시기 바랍니다.