클로드 코드 토큰이 뭔가요? 비용 폭탄 막는 첫걸음

클로드 코드 토큰이 어느 순간 훅 사라져서 당황한 적 있으신가요? 분명히 어제 충전한 것 같은데 한두 시간 만에 한도 알림이 뜨면 솔직히 좀 억울합니다.

문제는 토큰을 줄이는 방법을 검색해봐도 /clear니 /compact니 명령어부터 쏟아진다는 점입니다. 정작 토큰이 뭐고 왜 이렇게 빨리 녹는지 짚어주는 글이 잘 없습니다.

이 글은 클로드 코드를 처음 써보는 분 기준으로 토큰의 정체와 비용 구조를 정리해 드립니다. 다음 편에서 다룰 절약 팁을 이해하려면 먼저 이 이야기가 깔려 있어야 효과가 납니다.

클로드 코드 토큰 한 줄 정의

토큰은 AI가 글을 읽고 쓸 때 쓰는 가장 작은 단위입니다. 단어 하나가 보통 약 0.75 토큰이라고 보면 됩니다. 영어 단어 100개를 입력하면 130 토큰 정도가 들어갑니다.

문제는 한국어입니다. 영어 ‘Hello’가 1 토큰이면 ‘안녕하세요’는 다섯 토큰을 잡아먹습니다. 같은 의미를 전달하는데 한글이 다섯 배쯤 비싸지는 셈입니다.

여기에 입력 토큰과 출력 토큰이 따로 계산됩니다. 사용자가 보낸 메시지, 첨부 파일, 이전 대화 기록, claude.md 같은 메모리 파일은 모두 입력 토큰으로 잡힙니다. 클로드가 답변으로 쓴 코드와 설명은 출력 토큰입니다.

컨텍스트 윈도우, 토큰을 담는 그릇

토큰을 이해했다면 그다음은 컨텍스트 윈도우입니다. 한 세션에서 클로드가 한 번에 처리할 수 있는 최대 토큰 용량을 가리킵니다.

현재 클로드 모델은 기본 20만 토큰을 지원합니다. 책 한 권 분량이라고 보면 됩니다. 베타로 100만 토큰 컨텍스트도 풀려 있어서 대형 코드베이스 전체를 한 번에 보여줄 수도 있습니다.

문제는 이 그릇이 무료가 아니라는 점입니다. 대화를 주고받을수록 입력과 출력이 누적됩니다. 결국 매 메시지마다 클로드는 처음부터 끝까지 다시 읽고 답변합니다.

토큰이 빨리 녹는 진짜 이유

여기서 초보자들이 가장 많이 놓치는 부분이 있습니다. 클로드 코드 토큰이 사라지는 속도가 사람의 직감과 다른 이유입니다.

AI는 매번 모든 이전 대화를 처음부터 끝까지 다시 읽습니다. 사람은 대화 중에 앞 내용을 자연스럽게 잊지만 AI는 매 턴마다 전체 기록을 통째로 입력합니다. 짐코딩 채널에서 이 구조를 “AI의 구조적 특징”이라고 표현했는데 정확한 진단입니다.

알린(ALINN) 채널에 인용된 개발자 아케 파리아르의 분석이 충격적입니다. 메시지가 100개를 넘어가면 전체 토큰의 98.5%가 이전 대화를 다시 읽는 데 쓰이고 실제 새 작업에는 1.5%만 들어갑니다.

거기다 활성화된 MCP 서버 하나하나가 토큰을 잡아먹습니다. 다 켜둔 채로 일하면 20만 토큰 컨텍스트가 7만 토큰까지 쪼그라들 수 있습니다. 길게 쓴 claude.md 파일도 마찬가지입니다.

모델별 가격, 어디서 비용이 갈리나

클로드 코드 비용을 결정하는 두 번째 변수는 모델 선택입니다. 같은 작업이라도 어떤 모델로 돌리느냐에 따라 청구서가 크게 달라집니다.

100만 토큰 기준 가격을 정리하면 이렇습니다.

모델	입력 토큰	출력 토큰	포지션
Haiku	$1	$5	가장 빠르고 저렴, 주니어급 작업
Sonnet 4.5	$3	$15	균형형, 코딩 작업의 80% 커버
Opus 4.5	비싸고 강력	소넷의 4~5배	설계와 깊은 추론용 시니어급

오퍼스 모델 한 번 쓰면 같은 양의 토큰이 소넷 대비 4~5배 빨리 사라집니다. 코딩 채널에서 흔히 “오퍼스=시니어, 소넷=중급, 하이쿠=주니어”라는 비유를 쓰는데 가격 체감과 정확히 일치합니다.

여기에 한 가지 숨은 요소가 더 있습니다. 사고(Thinking) 토큰입니다. 클로드는 답변 전에 깊이 생각하는 기능이 기본 활성화되어 있고 이게 한 번에 최대 31,999 토큰까지 갑니다. 간단한 수정 한 줄에도 3만 토큰을 추가로 태운다는 뜻입니다.

5시간 리셋과 주간 한도, 두 시계가 같이 돕니다

클로드 코드를 직접 결제해서 쓰는 분이라면 한도 시계가 두 개라는 점을 알아두셔야 합니다. 한 군데만 보고 있으면 다른 쪽에서 막힐 때 당황합니다.

/usage 명령어를 입력하면 현재 사용량과 리셋 시간이 한눈에 보입니다.

커런트 세션: 모델 종류와 무관하게 5시간 단위로 리셋됩니다. 첫 사용 시점부터 카운트가 시작됩니다.
주간 한도: ‘전체 모델’ 한도와 ‘소넷 전용’ 한도로 나뉩니다. 소넷을 쓰면 두 한도에서 동시에 차감됩니다.

5시간 리셋을 잘 활용하면 작업을 분산할 수 있습니다. 아침 7시에 간단한 작업을 시켜 타이머를 미리 돌려놓고, 점심에 본 작업을 몰아서 하는 식입니다. 이걸 모르면 평일 저녁에 한꺼번에 일하다 한도에 걸려서 흐름이 끊깁니다.

플랜별 공식 사용량도 참고해두면 좋습니다. 테크크런치 보도 기준 Pro 플랜(20달러)은 소넷 주당 40~80시간이고 오퍼스는 매우 제한적입니다. Max 100달러 플랜은 소넷 140~280시간 오퍼스 15~35시간입니다. Max 200달러 플랜은 소넷 240~480시간 오퍼스 20~40시간입니다.

비용 폭탄 시그널, 이럴 때 의심하세요

토큰이 빠르게 녹고 있다는 신호가 몇 가지 있습니다. 평소 흐름과 다르게 느껴지면 한 번씩 점검해보시면 좋습니다.

하루 안에 5시간 한도를 두 번 이상 칩니다. 보통은 한 번도 안 치는 게 정상입니다. 두 번 이상이면 모델이 오퍼스로 잡혀 있거나 컨텍스트가 비대해진 상태일 가능성이 높습니다.
클로드가 같은 실수를 반복합니다. 분명 앞서 알려준 규칙을 또 어기면 컨텍스트 로트(Context Rot) 신호입니다. 정보가 너무 많아져서 집중력이 흩어진 상태입니다.
간단한 수정 하나에 30초 이상 생각합니다. 사고 토큰이 매번 풀로 도는 중입니다. 작업 난이도 대비 과도하게 깊이 생각하면 비용이 폭증합니다.
context 명령어로 봤을 때 75% 이상이 차 있습니다. 이때부터는 답변 품질도 떨어지고 토큰 단가도 비싸집니다. 빠르게 정리해야 할 시점입니다.

위 신호 중 하나라도 자주 보인다면 다음 편에서 다룰 토큰 절약 팁이 곧바로 효과를 냅니다.

정리하며

클로드 코드 토큰이 빨리 사라지는 건 대부분 사용자 잘못이 아닙니다. AI가 매번 전체 대화를 다시 읽는 구조 때문이고 한국어가 영어보다 토큰을 많이 먹기 때문입니다.

오늘 정리한 핵심 세 가지만 기억해두시면 됩니다. 첫째 토큰은 단어 0.75개 정도 단위이며 한국어는 비쌉니다. 둘째 컨텍스트 윈도우 20만 토큰은 무한이 아니라 그릇 크기입니다. 셋째 모델 선택과 5시간 리셋이 비용을 가르는 두 번째 변수입니다.

다음 편에서는 이 구조 위에서 실제로 토큰을 줄이는 7가지 실전 방법을 다룹니다. settings.json 세 줄로 비용을 80% 깎는 법과 /clear /compact /context 명령어 활용 루틴까지 한 번에 정리해 드릴 예정입니다.