claude codeの脳内流出4.6万star、設計図は丸見えに

GitHubの「system_prompts_leaks」リポジトリが4万6千スターを突破した。Claude、ChatGPT、Gemini、Grokなど主要AIの内部システムプロンプトを抜き出してまとめたもので、claude codeを含む各社の「脳の設計図」が衆目に晒されている。この事実が示すのは、モデルの賢さの源泉が想像以上に素朴な指示文に依存していたという現実だ。

何が起きたか

asgeirtj氏が公開する「system_prompts_leaks」が、わずか短期間で46,597スターを記録した。中身はAnthropic Claude Fable 5、Opus 4.8、Claude Code、Claude Design、OpenAIのChatGPT 5.5系列など、商用LLMの裏側で動くシステムプロンプトを抽出・整理した資料集である。プロンプトインジェクションや巧妙な引き出し手法によって露出した文字列を、有志がまとめて公開する形だ。プロンプト設計者たちはこれを「お手本」として読み込み、自社のAIエージェント設計に逆輸入している。Anthropicの月間検索ボリューム34,000、claude codeに至っては202,000という数字を見ても、その注目度は明らかだ。各社が秘匿してきた「振る舞いのレシピ」が、事実上のパブリックドメインに移行しつつある。

なぜこのニュースが重要か

エンジニア視点で言えば、これは「モデルの能力」と「プロンプトの能力」を切り分けて再評価する契機である。リーク内容を読むと、各社の指示文は驚くほど素朴だ。役割定義、禁止事項の列挙、ツール呼び出しのスキーマ説明、フォーマット指定──いずれも構造化されたMarkdownや疑似XMLで書かれており、特殊な魔法は存在しない。claude codeのシステムプロンプトも、ファイル操作・Bash実行・コードレビューの作法を泥臭く明文化したものに過ぎない。

ここから導かれる結論は二つある。第一に、ベースモデルの素の性能が想像以上に高く、システムプロンプトは「ガードレールと様式美」を与える役割に留まっている。第二に、競合各社のプロンプトが似通っているということは、差別化の主戦場がモデル層からアプリケーション層へ完全に移ったことを意味する。検索ボリューム202,000を集めるclaude codeでさえ、コア指示の骨格は他社と大差ない。差を生むのは、ユーザー固有のコンテキスト注入とツール接続設計である。

技術的な深掘り

リークされたプロンプト群を仕様書として読むと、興味深いパターンが浮かび上がる。claude codeでは「ユーザーの指示に忠実であれ」「不要な前置きを省け」「ファイル編集前に必ず読め」といった、いわゆる「ハルシネーション抑制」と「破壊的操作の防止」に大量のトークンが割かれている。Opus 4.8系では、推論プロセスを内部で完結させ、ユーザーには結論のみを返すよう厳格に指示されている──これは出力トークン削減によるコスト最適化と直結する設計だ。

注目すべきは「extracted（抽出された）」という単語が示すように、これらが完全な仕様書ではなく断片である点だ。ツール定義スキーマやRAG層のシステムメッセージは含まれていない可能性が高い。つまり読者が見ているのは氷山の一角であり、本当の差別化要因は依然としてAPIゲートウェイの裏側にある、と推定する。それでも、Anthropicがclaude codeで採用している「TODOリストを内部維持しながらタスク分解する」パターンは、自社エージェント構築の即戦力テンプレートになる。コピーすべきは文言ではなく、思考の骨格である。

経営者として次に取るべき動き

第一に、自社で運用中のAIエージェントのシステムプロンプトを、claude codeなどリーク資料と並べて棚卸しせよ。「素朴さの水準」が他社と同等かを点検し、無駄な装飾文を削ってトークンコストを下げる。第二に、社内プロンプト資産を正式なリポジトリで版管理し、ドメイン知識・業務手順・禁則事項を文書化する。これが他社が真似できない唯一の堀になる。第三に、プロンプトは流出前提で設計せよ。APIキー、顧客個人情報、内部URLをプロンプトに直接埋め込まず、実行時にツール呼び出しで動的注入する構成へ移行する。「中身は丸見え、使い方で勝つ」が今後5年の鉄則だ。