CLAUDE.mdは本当に万能か?プロンプトキャッシュのコスト構造を定量分析してわかった意外な真実
出典: same_shark

「CLAUDE.mdに書けば優先される」という定説を検証したところ、約85トークンの固定コストが上乗せされること、そして「CLAUDE.mdが必ず勝つ」という通説がOpusでは必ずしも成り立たないことが明らかに。実測データから見えてきたプロンプト設計の新常識を解説します。
Claude Codeのプロンプト設計に潜む「見えないコスト」
Claude Codeを日常的に使っているユーザーなら、「CLAUDE.mdに設定を書いておけば優先的に反映される」という経験則をご存知でしょう。しかし、この便利な機能には実は定量的に測定可能なコストが隠れています。
今回、@same_sharkさんによる詳細な検証により、CLAUDE.mdとプロンプトの使い分けにおける具体的なトークンコストの違いが明らかになりました。この知見は、AIコーディングツールのコスト最適化を考える上で極めて重要です。
検証で明らかになった3つの事実
1. CLAUDE.mdには約85トークンの固定オーバーヘッドがある
同じ内容をCLAUDE.mdに配置した場合、プロンプトに直接記述する場合と比較して、**内容量とは無関係に約85トークンの固定コストが上乗せ**されます。これはCLAUDE.mdというファイル形式を処理するための構造的コストと考えられます。
短いルールや設定であれば、この85トークンは相対的に大きな割合を占めます。例えば50トークンのルールなら、実質的に170%のコストになる計算です。
2. プロンプトキャッシュの恩恵を受けられるかが分水嶺
CLAUDE.mdの最大の利点は、**一度読み込まれた内容がキャッシュに保存され、再利用される**点にあります。対して、毎ターンプロンプトに同じルールを貼り直す運用では、キャッシュの恩恵を受けられず、毎回定価でトークンを消費し続けます。
この差は長期的に見ると極めて大きく、同じルールを10回使うなら、初回の85トークンのオーバーヘッドは十分に回収できる計算になります。
3. 「CLAUDE.mdが必ず勝つ」はOpusでは成り立たない
最も興味深いのは、**Opusモデルでは必ずしもCLAUDE.mdが優先されるわけではない**という発見です。これは従来の「CLAUDE.mdに書けば確実」という通説を覆すものであり、モデルごとに挙動が異なる可能性を示唆しています。
編集部の視点
ChatGPT Custom Instructionsとの比較
ChatGPTにも「Custom Instructions」という類似機能がありますが、Claude CodeのCLAUDE.mdは**プロジェクト単位で設定を切り替えられる**点で優れています。一方、今回明らかになったトークンコストの構造は、ChatGPTでは明示的に公開されていません。
この透明性の違いは重要です。Claude Codeでは定量的にコストを測定し、最適化できるのに対し、ChatGPTではブラックボックスのまま運用せざるを得ません。
コスト最適化の二面性
今回の検証が示すのは、**「便利な機能=常に最適」ではない**という原則です。CLAUDE.mdは確かに強力ですが、以下のトレードオフを理解する必要があります。
**メリット:**
**注意点:**
適用範囲の考察
**CLAUDE.mdが向いているケース:**
**プロンプト直接記述が向いているケース:**
今日から試せるアクション
1. 自分のCLAUDE.mdを監査する
現在CLAUDE.mdに記述している内容をトークンカウンターで測定してください。50トークン以下の項目があれば、プロンプト側に移行することでコスト削減できる可能性があります。
2. セッション頻度で使い分ける
同じルールを何度も使うプロジェクトではCLAUDE.md、単発のタスクではプロンプト直接記述という基準を設けましょう。具体的には、**3回以上使う見込みがあればCLAUDE.md**という判断基準が妥当です。
3. モデル別の挙動を確認する
Opusを使用している場合は、重要な指示が本当に反映されているか検証してください。必要に応じてプロンプト側にも同じ内容を記述する冗長性を持たせることも検討すべきです。
プロンプトエンジニアリングの新段階へ
今回の検証は、プロンプトエンジニアリングが「何を書くか」から「どこに書くか」まで含めた最適化の時代に入ったことを示しています。単なる経験則ではなく、定量的なデータに基づいた設計判断が求められるようになったのです。
AIツールのコストは、単なる金額だけでなく、レスポンス速度やキャッシュヒット率など多面的な要素で構成されます。今後はこうした「見えないコスト」を可視化し、測定し、最適化するスキルが、AI時代のエンジニアに不可欠になるでしょう。
この情報は @same_shark さんの投稿を参考にしています。
出典: same_shark


