GitHubで『system_prompts_leaks』というリポジトリが47,102スターを記録した。ChatGPT、Claude(claude codeを含む)、Gemini、Grokといった主要AIの内部システムプロンプトを抽出して並べた、いわば現代AIの『設計図カタログ』だ。エンジニアが写経する教材として爆発的に拡散しているが、本質はもっと深い。プロンプトという無形資産が、コードと同じくリバースエンジニアリングの対象になった瞬間である。

何が起きたか

asgeirtj/system_prompts_leaks というGitHubリポジトリが、わずか数日で47,102スターを突破した。収録されているのはAnthropicのClaude Fable 5、Opus 4.8、Claude Code、Claude Design、OpenAIのChatGPT 5.5系など、主要LLMプロダクトの「システムプロンプト」と呼ばれる内部指示文だ。これらは通常、ユーザーには見えない領域で、モデルの振る舞い・トーン・禁止事項・ツール呼び出しのルールを定義している。抽出方法は明示されていないが、巧妙なプロンプトインジェクションや会話の漏洩を通じて引き出されたと推定される。AnthropicやOpenAIは一部のシステムプロンプトを公開しているが、claude codeのようなエージェント系プロダクトの内部指示まで網羅的に並んだ点が、開発者コミュニティの一斉ブックマークを誘発した。

なぜこのニュースが重要か

このリポジトリの価値は「リーク」そのものではなく、プロンプト設計の業界ベンチマークが事実上公開されたことにある。特に注目すべきはclaude codeだ。月間検索ボリューム202,000という数字が示すとおり、コーディングエージェント市場の中心はすでにAnthropic製品に傾いている。そのclaude codeが、どのような優先順位で「ファイルを読む前にls」「破壊的操作の前に確認」「テストを書く前に既存テストを観察」といったエージェント動作を制御しているのか――その実装上のヒューリスティクスがそのまま読める状態になった。

エンジニア視点で言えば、これは「Linuxカーネルのコメント付きソースを初めて読んだとき」に近い体験だ。AIアプリを作る側にとって、自分のシステムプロンプトが数百行で散らかっているのに対し、Anthropicの本物は驚くほど短く、命令の順序と否定形の使い方が緻密に設計されている。差は「センス」ではなく「型」だったと露呈した。47kスターの正体は、世界中のAIエンジニアの「答え合わせ需要」である。

技術的な深掘り

claude codeのシステムプロンプトを読むと、Anthropicの設計思想がはっきり浮かぶ。第一に、ツール呼び出しの前提条件をプロンプト側で縛っている点だ。モデル本体のRLHFで「安全に振る舞え」と教えるのではなく、システムプロンプトで「Editする前に必ずReadする」と手続き的に書く。これは、モデル能力(Opus 4.8など)と運用ロジックを分離するアーキテクチャ判断であり、モデル差し替え時の再現性を担保する設計だ。

第二に、否定命令の最小化が徹底されている。LLMは「〜するな」より「代わりに〜せよ」のほうが追従率が高いという経験則を、Anthropicは構造的に守っている。第三に、トークン効率。冗長なロールプレイ指示は皆無で、XMLタグでセクションを区切る一貫した記法が使われている。

ここから導かれる結論は明確だ。自社AIを組むなら、システムプロンプトに機密データやAPI仕様を直書きするのは設計ミスである。抜かれる前提で、機密はツール側に隠蔽し、プロンプトには「振る舞いの型」だけを残す。claude code自身がそうなっているのは偶然ではなく、リーク耐性を織り込んだ設計だからだ。

経営者として次に取るべき動き

第一に、プロンプトを「資産」としてバージョン管理せよ。社内のAI案件で書かれたシステムプロンプトをGitで管理し、レビュー対象に含める。コードレビューと同等の品質ゲートを敷くだけで、出力精度は体感で2〜3倍変わる。

第二に、機密の置き場所を再設計せよ。顧客データ・価格表・内部APIキーをシステムプロンプトに直書きしている実装は、即時にツール呼び出し(Function Calling / MCP)側へ退避する。リーク事例が47kスターで称賛される時代に、「抜かれない前提」は経営リスクだ。

第三に、写経会を制度化せよ。週1時間、claude codeやOpus 4.8のシステムプロンプトを読み解く社内勉強会を設置する。教材コストはゼロ、効果は人材の底上げに直結する。真似ぶ文化を持つ組織だけが、AI活用の指数関数カーブに乗れる。