Claude Code 비용 80% 줄이는 settings.json 3줄 설정법과 everything-claude-code 실전 가이드
클로드 코드를 쓰다 보면 어느 순간 갑자기 같은 실수를 반복하고 규칙을 잊어버리는 현상이 생긴다. 이건 버그가 아니라 '컨텍스트 로트'라는 구조적 문제다. 앤스로픽 해커톤 우승자가 열 달 동안 다듬어 현재 14만3,000 스타를 받은 everything-claude-code 저장소는 이 문제의 해법을 통째로 담고 있다. settings.json 세 줄만 바꿔도 비용이 80% 줄어든다.
클로드 코드를 한두 시간 쓰다 보면 분명히 알려준 규칙을 잊어버리고, 시키지도 않은 파일을 건드리는 순간이 온다. 본인이 잘못 지시한 것 같아 다시 설명하고 또 반복하게 된다. 그런데 이건 사용자 잘못이 아니다. 컨텍스트 로트(Context Rot)라는 이름까지 붙은 구조적 문제다. 그리고 지금 14만 명이 즐겨찾기한 GitHub 저장소가 이 문제를 통째로 풀어놨다.
클로드 코드가 갑자기 멍청해지는 진짜 이유
컨텍스트 로트를 한국말로 풀면 '컨텍스트가 썩는다'는 뜻이다. 클로드에게 한 시간, 두 시간 계속 작업을 시키다 보면 출력 품질이 서서히 무너지는 현상을 말한다. 크래시나 에러가 뜨는 게 아니라 그냥 왠지 멍청해진다는 게 문제다. 잡기도 어렵고 본인 잘못인지 구분도 안 된다.
원인은 크게 네 가지로 정리된다.
첫째, 어텐션 희석. 문맥이 길어질수록 중간 정보를 클로드가 제대로 떠올리지 못한다. 둘째, 명령 충돌. 누적된 지시문이 서로 모순되면서 어느 쪽을 따를지 헷갈린다. 셋째, 토큰 예산 압박. 부풀어 오른 시작 파일이 정작 작업할 토큰을 다 잡아먹는다. 넷째, 관련성 미스매치. 모든 파일이 매번 다 로드되니까 지금 작업과 무관한 정보까지 전부 들어가 있다.
자동차로 비유하면 이렇다. 20만 토큰짜리 거대한 연료 탱크가 있는데, 출발할 때부터 트렁크에 짐을 가득 싣고 시작하는 것이다. 운전은 되지만 연비도 떨어지고 핸들도 무거워진다. CLAUDE.md 파일이 너무 두꺼우면 그 자체가 이미 멍청해지는 원인이 된다. 외국 가이드에서는 한 파일을 2,000~3,000 토큰, 한글 기준 약 100단어 이상이면 점검 신호로 보라고 권장한다.
settings.json 세 줄로 비용 80% 줄이는 방법
홈 디렉토리의 클로드 폴더 안에 있는 settings.json 파일을 열고 딱 세 가지를 추가하면 된다.
첫째, 모델을 Opus 대신 Sonnet으로 바꾼다. 이것 하나만으로 약 60% 비용이 절감된다. 코딩 작업의 80%는 Sonnet으로 충분하고, 깊은 아키텍처 고민이나 복잡한 디버깅이 필요할 때만 /model opus로 잠깐 바꾸면 된다.
둘째, maxThinkingTokens를 10,000으로 줄인다. 클로드에게는 사용자 눈에 보이지 않는 thinking 토큰이 있는데 기본값이 31,999다. 답변하기 전에 클로드가 내부적으로 생각하는 분량인데, 대부분의 작업에서는 이만큼 필요 없다. 10,000으로 줄이면 숨은 비용이 약 70% 줄어든다.
셋째, 서브에이전트 모델을 Haiku로 설정한다. 클로드 코드는 작업 시 보조 역할을 하는 서브에이전트를 자동으로 띄우는데, 이 보조 일꾼에까지 비싼 모델을 쓸 이유가 없다. Haiku로 바꾸면 약 80% 절감된다.
이 세 줄을 다 적용하면 기본 설정 대비 누적으로 80% 이상 절감이 가능하다. 같은 작업을 했을 때 한 번은 4달러 나오던 게 다른 한 번은 60센트로 나오는 식이다.
slash clear와 slash compact, 사람들이 모르고 같이 쓰는 차이
설정을 바꾼다고 끝이 아니다. 손가락 습관도 같이 바꿔야 한다. 클로드 코드에는 /clear와 /compact 두 가지 명령이 있는데, 대부분 차이를 모르고 쓴다.
/clear는 무관한 작업 사이에 쓰는 명령이다. 이 작업은 끝났고 완전히 다른 일을 시작할 때 무료로 즉시 컨텍스트를 통째로 비운다. /compact는 마일스톤 사이에 쓰는 명령이다. 리서치가 끝나고 구현 들어가기 직전, 디버깅이 끝나고 다음 기능 들어가기 직전처럼 자연스러운 끊김 지점에서 컨텍스트를 요약 압축한다.
구현 도중에 /compact를 치면 안 된다. 변수명, 파일 경로, 부분 상태를 다 잃어버린다. everything-claude-code의 strategy-compact 스킬은 적절한 시점에 자동으로 compact를 제안해 준다.
또 하나 함정이 있다. MCP 서버를 너무 많이 켜두지 않아야 한다. MCP 하나하나가 도구 설명을 토큰으로 잡아먹기 때문에 전부 켜두면 20만 토큰짜리 컨텍스트 윈도우가 7만 토큰까지 줄어든다. 프로젝트당 MCP는 10개 이하, 활성 도구는 80개 이하로 유지하는 것이 권장된다.
14만 명이 즐겨찾기한 저장소의 진짜 핵심, 메모리 학습 시스템
비용 절감보다 이 저장소에 사람들이 몰린 진짜 이유가 따로 있다. Continuous Learning V2, 즉 지속 학습 시스템이다.
클로드 코드가 도구를 호출하기 직전과 직후에 후크가 자동으로 발동되면서 작업 전체를 100% 관찰한다. 반복되는 패턴을 찾아서, 예를 들어 '이 사람은 새 컴포넌트를 만들 때 항상 이 폴더 구조를 쓰는구나', '이 사람은 에러 처리할 때 항상 이 라이브러리를 쓰는구나' 같은 것들을 인스팅트(instinct)라는 학습 단위로 저장한다.
각 인스팅트에는 0.33에서 0.9까지의 신뢰도 점수가 붙는다. 관련 인스팅트가 세 개 이상 모이면 /evol 명령으로 재사용 가능한 스킬 모듈로 자동 승격된다. 한 번 가르친 회사 코딩 컨벤션을 클로드가 영구히 기억하고, 신입이 들어와도 그 노하우를 그대로 넘겨줄 수 있다는 뜻이다.
/instinct export로 내가 학습한 것을 동료에게 보낼 수 있고, import로 동료가 학습한 것을 받아올 수 있다. 팀 단위로 쓰면 효과가 배가 된다.
설정 전체를 한 줄로 보안 검사하는 agent-shield
everything-claude-code를 만든 같은 사람이 agent-shield라는 보안 스캐너도 함께 만들었다. npx ecc agent-shield scan 한 줄만 치면 설치 없이 바로 동작한다.
CLAUDE.md 파일, settings.json, MCP 설정, 훅, 에이전트 정의 같은 클로드 코드 설정 전체를 다섯 가지 카테고리로 스캔한다. 시크릿 키 노출 여부, 권한이 너무 열려 있는지, 훅 인젝션 취약점, 위험한 MCP 서버 여부를 확인한다.
--opus 플래그를 붙이면 클로드 Opus 기반 에이전트 세 마리가 레드팀, 블루팀, 오디터 역할로 나뉘어 적대적으로 검증한다. 1,282개의 테스트와 102개의 보완 항목으로 굴러간다. AI 에이전트 보안이 본격적으로 화두가 되기 전에 미리 잡아둘 수 있는 도구다.
지금 당장 시작하는 순서, 한 번에 다 깔지 마라
everything-claude-code에는 전문 영역별 서브에이전트 38개, 스킬 56개, 슬래시 명령어 72개, 롤 34개, MCP 서버 연동 설정 14개가 들어 있다. 처음부터 다 깔면 오히려 역효과다.
순서대로 가는 것이 맞다.
첫째, 오늘 당장 settings.json 세 줄만 추가한다. 모델 Sonnet, maxThinkingTokens 10,000, 서브에이전트 모델 Haiku. 이것만으로도 다음 달 청구서가 눈에 띄게 줄어든다.
둘째, /plugin marketplace add 명령으로 everything-claude-code를 추가하고 /plugin install core 명령으로 플러그인을 설치한다.
셋째, 룰만 별도로 깃클론에서 inst.sh --profile full 로 설치한다.
156개 스킬을 전부 깔지 않아야 한다. search-first, TDD 워크플로, strategy-compact 같은 코어부터 시작하고 필요할 때마다 하나씩 추가하는 것이 권장 방식이다. 멀티에이전트 명령들은 별도로 CCG 워크플로 런타임을 깔아야 동작하므로 처음에는 건드리지 않아도 된다.
이 글과 관련된 상품은 kooreea에서 확인할 수 있다.