「Claude Code、便利そうだけど料金が青天井になりそうで怖い」——使う前にいちばん気になるのがコストではないでしょうか。
私は Claude Code を Max 5x プラン(月16,000円/約100ドル) で毎日使い込んでいます。そこで、使用量を可視化するツール ccusage で 1ヶ月分のトークンコストを実測してみました。
結論から言うと、API従量課金なら月20万円(約1,250ドル)を超える量を使っていました。月16,000円(約100ドル)のサブスクで、です。この記事では——
- 実際の月コスト(API換算)と内訳を実データ(スクショ)付きで公開
- なぜこれだけ使ってもサブスクで足りるのか(カギはキャッシュ)
- Pro / Max 5x / Max 20x / API、どれが得かの考え方
- さらにコストを抑える節約テクニック
を、憶測ではなく自分の実測値で解説します。
検証環境:Max 5x プラン/計測ツール ccusage v20.0.11/2026-05〜06 の実データ。料金・上限は2026年6月時点。最終更新 2026-06-14。金額は1ドル≒160円で円換算した概算です(ccusageの表示はドル建て)。
※料金体系・使用量上限は変更が入る時期です。最新は公式をご確認ください。
結論:私の1ヶ月のリアルな実測コスト
月20万円超(約1,250ドル)のAPI換算コストを、月16,000円(約100ドル)で使えている
ccusage で月次集計した結果がこちらです。

※以下の金額はプライバシー保護のため概数で示しています(実際の使い方の傾向は変えていません)。
| 月 | 総トークン | API換算コスト(概算) | Max 5x(月16,000円/100ドル)との比 |
|---|---|---|---|
| 2026-04 | 約250万 | 約480円(3ドル) | (導入直後・ほぼ未使用) |
| 2026-05 | 約12億 | 約20万円(1,250ドル) | 約12倍 |
| 2026-06(14日時点) | 約12億 | 約20万円(1,250ドル) | 半月で約12倍 |
ポイントは、2026-05 のひと月だけで約20万円(1,250ドル)分を使っていたこと。これはもし API の従量課金で同じ使い方をしたら、ざっくり20万円請求されていた、という意味です。それが Max 5x なら 月16,000円(100ドル)の定額。単純計算で約12倍お得になっていました。
しかも 6月は 14日間ですでに5月のひと月分に並ぶペース。重く使う人ほどサブスクの恩恵が大きい、というのが実測から見えた事実です。
注:
ccusageはローカルのログ(トークン数)に公開API料金を掛けてコストを推定するツールです。Max/Pro のサブスクでは/costが使えないため、この「API換算」で“どれだけ使ったか”を把握します。実際の支払いはあくまで月額16,000円(100ドル)です。
何にこれだけ使ったのか(使い方の前提)
参考までに、私がこの期間に Claude Code でやっていた主な作業は以下です。読者が自分のケースに当てはめられるよう、正直に書きます。
- 実際のシステム開発(新機能の実装)と、既存システムの修正・改修が中心
- それをほぼ毎日、実コードに対して回していた
つまり「ちょっと試してみた」ではなく、日々の開発業務でガッツリ使い込んだ結果がこのコストです。だからトークン量も多く、上で見たヘビーユーザーの数字になっています。趣味で少し触る程度なら、ここまではいきません。
公式の平均と比べてどうか
公式ドキュメントでは「平均 約2,080円/日(13ドル)、月24,000〜40,000円(150〜250ドル)、90%のユーザーは4,800円/日(30ドル)以下」とされています(出典:Claude Code公式Docs「コストを効果的に管理する」)。私の 2026-05 は月約20万円(1,250ドル)= 1日あたり約6,400円(40ドル) 相当で、平均の3倍以上。かなりのヘビーユーザーの部類です。
だからこそ、この記事の数字は「使い込んだ場合の上限に近い実例」として参考になるはずです。ライトに使えばもっと安く済みます(実際、私の別環境では月320円〜480円程度でした)。
日によってコストはどれくらい振れるか
日次で見ると、コストは作業内容で大きく上下します。実測の日次推移がこちらです。


- 重い開発日(大規模リファクタや長時間の実装):1日 約16,000円〜35,200円
- 軽い日(少し質問する程度):1日 約1,120円〜4,800円
- いちばん高かった日で 約35,200円、安い稼働日で 約1,120円
「毎日32,000円かかる」わけではなく、がっつり作る日に跳ね、軽い日は一気に下がる——この振れ幅こそが実態です。月で均すと前述の約20万円に収まります。
なぜ10億トークン使っても破産しないのか(カギはキャッシュ)
ここまでの数字を見て、こう思った人もいるはずです。「月12億トークンって、普通そんなに安く済むの?」と。
カラクリは プロンプトキャッシュ にあります。
実は9割以上が「キャッシュ読み込み」
ccusage の内訳を見ると、私が使ったトークンの 約94%が「Cache Read(キャッシュ読み込み)」 でした。
| トークンの種類 | ざっくりの割合 | 料金イメージ |
|---|---|---|
| 通常の入力(Input) | 数% | 標準価格 |
| キャッシュ作成(Cache Create) | 数% | やや高い |
| キャッシュ読み込み(Cache Read) | 約94% | 標準入力の1/10(0.1倍=約90%引き) |
| 出力(Output) | 数% | 標準価格 |
Claude Code は会話のたびに「それまでの文脈(コードやCLAUDE.md、過去のやり取り)」をモデルへ送り直します。普通ならこれが毎ターン課金され、コストが膨張します。
ところが、繰り返し送る同じ内容はキャッシュされ、2回目以降は約1/10の料金で済みます(公式の料金体系:キャッシュ読み込みはベース入力の0.1倍)。だから「トークン総量は天文学的でも、請求はその数分の一」になるのです。
補足:キャッシュは「前回とまったく同じ内容(バイト単位で一致)」のときに効きます。なので、コードや指示がコロコロ変わるとキャッシュが外れて割高に。Claude Code が会話の積み重ねでキャッシュを効かせやすいのは、この性質のおかげです。
ざっくり試算:もしキャッシュが無かったら
仮にこの94%のキャッシュ読み込みが、すべて通常価格の入力だったとしたら——単純計算で、コストは数倍に膨らんでいた計算になります。月20万円どころではありません。
つまり、Claude Code が「思ったより安い」最大の理由はキャッシュ。そして嬉しいことに、これは自分で何か設定しなくても自動で効いています(公式も「プロンプトキャッシングと自動コンパクションでコストを自動最適化する」と明記)。
補足:逆に言えば、頻繁に文脈をリセットする(毎回新しい会話を始める)とキャッシュが効きにくくなることも。この性質は後半の「節約のコツ」にもつながります。
結局どのプランが得?Pro / Max / API の損益分岐
「自分はどれを選べばいいのか」——実測コストが分かると、ここが理屈で判断できます。
プラン早見表
| プラン | 月額 | 向いている人 |
|---|---|---|
| Free | 0円(0ドル) | まず触ってみたい。すぐ上限に当たる |
| Pro | 3,200円(20ドル) | 軽い利用。1日に少し質問・小さな修正 |
| Max 5x | 16,000円(100ドル) | 毎日しっかり使う開発者(←私はこれ) |
| Max 20x | 32,000円(200ドル) | 1日中フル稼働・複数並行のヘビーユーザー |
| API 従量課金 | 使った分だけ | 利用量が読めない/ムラがある人 |
【重要・2026年6月時点】Claude Code の使用量上限の方式は変更が入るタイミングです。従来は「5時間ごとのローリングウィンドウ(直近5時間の消費量で判定)」でしたが、月次リセット+クレジット制への移行が案内されています。最新の上限方式・料金は必ず公式の料金ページで確認してください(この記事は時期により古くなる可能性あり)。
私の実測(API換算 約20万円=1,250ドル/月)で考えるとどうか
判断はシンプルで、「API従量で計算したら月いくら使うか」を、各プランの月額と比べるだけです。
- 私の使用量は API換算で 月 約20万円。
- これを Pro(3,200円) でやろうとすると、上限に何度も当たってまともに使えません。
- Max 5x(16,000円) なら定額で収まり、API比 約12倍お得。← 実際これで足りています。
- Max 20x(32,000円) は、Max 5x の上限(数時間ごとのリセット枠)に頻繁に当たって作業が止まるなら乗り換える価値あり。私はまだ 5x で回せています。
つまり損益分岐はざっくりこうです:
- API換算で 月3,200円を超えて使う → Pro より上を検討
- API換算で 月16,000円を超えて使う(=ほぼ毎日開発)→ Max 5x が確実に得
- Max 5x の制限に頻繁に当たる → Max 20x
- 利用量にムラがあり、月によっては全く使わない → API従量の方が安いことも
ポイント:
ccusageで自分のAPI換算コストを測れば、「サブスクで元が取れているか」が一発で分かります。16,000円プランで月16,000円以上使えていれば、もう元は取れています。
サブスク vs API、そして「どこで動かすか」
ここまではプランの話ですが、本格的に使い始めると次に効いてくるのが実行環境です。私は実際、作業用サーバーと手元マシンの2環境で Claude Code を動かしていて、コストも使い方も環境ごとに大きく違いました(前述の月20万円 と 月320円〜480円の差)。
- ローカルだけで完結する人 → 追加コストなし
- MCPサーバーを常時稼働させたい/チームで共有したい/重い処理を回しっぱなしにしたい 人 → VPS(仮想専用サーバー)を使うと安定します。
Claude Code を本格運用するためのサーバー選びは、別記事「Claude Code/AI運用におすすめVPS比較」で比較予定です。
各プランの上限・支払い方法の詳細は、別記事「Claude Code 料金プラン比較」で解説予定です。
実際に効いた節約テクニック
ヘビーに使う私が「これは効いた」と実感した順に紹介します。小手先より、この2つが効果大でした。
① モデルの使い分け(いちばん効いた)
Claude Code は作業に応じてモデルを選べます。私は重い作業と軽い作業でモデルを切り替えることで、無駄な高コストを避けています。
私の使い分けはシンプルです。
- 簡単な作業(メールの文面、構成案づくり、軽い下書きなど)は sonnet
- 設計や実装の難所など、頭を使うところだけ opus(上位モデル)
「とりあえず全部いちばん賢いモデルで」をやめるだけで、コストの伸びが目に見えて変わります。
実際、私の利用ログにも複数モデル(opus / sonnet / haiku 等)が混在しています。サブエージェント(調べ物などを任せる補助役)は自動で軽量モデルを使ってくれるので、意識して重い作業だけ上位モデルに回すと効率的です。
なぜ効くか:上位モデルほどトークン単価が高い(例:入力単価は Opus が Sonnet の数倍)。軽い作業まで最上位で回すと、品質はオーバースペックなのにコストだけ膨らみます。公式も「Sonnet はほとんどのコーディングタスクを Opus より低コストで処理でき、Opus は複雑な設計や多段推論に温存する」と推奨しています。
② /clear と /compact をこまめに
会話が長くなるほど、毎ターン送られる文脈が膨らみコストが増えます。だから私は区切りがついたら /clear、続けたいけど重いときは /compact を習慣にしています。
/clear:文脈をリセット。別タスクに移るときに。/compact:会話を要約して圧縮。流れは保ちつつ軽くしたいときに。
私のタイミングの目安は「コンテキスト使用率50%」です。私はステータスラインにコンテキスト使用率・セッションコスト・経過時間を常時表示しています。

この使用率が50%を超えてきたら、/compact で圧縮するか /clear で切る——を習慣にしています。数字が見えていると「そろそろ重いな」が一目で分かり、ムダにコンテキストを肥大させずに済みます。
ヒント:コストや使用率をステータスラインに出す設定は、別記事「ステータスラインにコストを表示する設定」で紹介予定です。
ただし注意:H2-2 で触れた通りキャッシュは「同じ文脈を繰り返す」ほど効くので、むやみに毎回
/clearすると逆効果なことも。「タスクが変わったら clear、続けるなら compact」が私の基準です。
その他(軽く効く)
- 必要なファイル・範囲だけ渡す(巨大ファイルの丸読みを避ける)
- CLAUDE.md にルールを集約して再説明の手戻りを減らす
- 詳しくは別記事「CLAUDE.md の書き方」で紹介予定
- サブエージェントに調べ物を任せて本筋の文脈を汚さない
私がトークンを無駄遣いした失敗談
「こうするとムダになる」を、自分の失敗で共有します。あなたの請求を守る反面教師にしてください。
失敗① エラー対応で巨大なログを丸ごと読ませた
エラーを直してもらおうとして、大量のエラー出力やログをそのまま読ませたときが要注意でした。前述のステータスラインを見ていると、こういう瞬間にコンテキスト使用率とコストが一気に跳ね上がります。「さっきまで余裕だったのに、急に数字が増えた」で気づくパターンです。
教訓:大きいログ・ファイルは全部を貼らず、エラーの該当部分だけを渡す。長い出力は要点に絞ってから渡すと、跳ね上がりを防げます。
失敗② 長時間セッションを引っ張りすぎた
調子よく作業していると、ついセッションを長く続けてしまいます。すると文脈がどんどん積み上がり、1ターンあたりが重く(=高く)なっていきます。
私の対策は H2-4 と同じで、ステータスラインのコンテキスト使用率が50%を超えたら、/compact か /clear。数字で「引っ張りすぎ」が見えるので、ダラダラ続けずに済みます。
教訓:使用率を可視化して、区切りで圧縮・リセット。重い調査は小分けにする。
失敗③ 中途半端な指示で走らせてしまい手戻り
地味にいちばん効くムダがこれでした。入力の途中でうっかりEnterを押してしまい、中途半端な指示のまま実行が始まる。そのまま走らせると、当然ながら意図とズレた結果になり、やり直し(手戻り)が発生します。
教訓:実行前にひと呼吸。送る前に指示を読み返す。曖昧な1回より、明確な1回の方が結局トークンも時間も安く済みます。
失敗④ 中途半端な指示でAIが情報を探して彷徨う
失敗③とつながっています。指示が中途半端だと、AIが足りない情報を自分で探しに行き、見つからないと分かるまであれこれ動き続けます。その間ずっとトークンを消費し、待たされた末に空振り、ということに。
教訓:探させる前に、必要な情報・対象ファイル・ゴールを最初に渡す。おかしな方向に動き出したら、待たずにすぐ中断(Esc)。自律的に動かすときほど「何をどこまでやってほしいか」を明確に。
まとめ:Claude Code のコストとの付き合い方
- 私の実測は 月 約20万円(1,250ドル)分(API換算)を Max 5x(16,000円/100ドル)で。重く使う人ほどサブスクが圧倒的に得。
- 安く済む最大の理由は キャッシュ(使ったトークンの約94%)。自動で効く。
- プラン選びは 「API換算で月いくら使うか」を月額と比べるだけ。16,000円プランで16,000円以上使えていれば元は取れている。
- さらに抑えるなら モデル使い分け と
/clear・/compactが効く。 - 反面教師:全読み・長時間・曖昧指示・暴走 がムダの4大要因。
所感として、いちばん変わったのは「コストを数字で見る習慣がついた」ことです。ステータスラインで使用率とコストを眺めながら、重い作業だけ上位モデルに回し、50%を超えたら区切る。意識し始めてから、ムダな跳ね上がりがぐっと減りました。
まずは自分のコストを npx ccusage@latest monthly で測るところから。「思ったより安い/高い」が数字で分かります。
次に読む:
・Claude Code(Opus 4.8)が重い・フリーズする問題と対処法(トラブル対処の実体験)
・Claude Code/AI運用におすすめVPS比較(本格運用のサーバー選び・公開予定)
・CLAUDE.md の書き方(手戻りを減らす設定・公開予定)
・Claude Code 使い方 完全ガイド(基本に戻って確認・公開予定)

コメント