asgeirtj/system_prompts_leaksというGitHubリポジトリが、わずか3週間で4万スターを突破した。anthropicのClaude Opus 4.7、OpenAIのChatGPT 5.5、GoogleのGemini 3.1 Proといった主要LLMの内部システムプロンプトを抽出してまとめたもので、各社が秘匿してきた「AIを動かす作法」が事実上の業界標準として外部に流出した形になる。

何が起きたか

リポジトリ asgeirtj/system_prompts_leaks は、現時点で40,716スターを記録している。収録されているのはanthropicのOpus 4.7、Opus 4.6、Sonnet 4.6、そしてOpenAIのChatGPT 5.5 Thinking、GPT 5.5 Instantなど、2026年5月時点のフロンティアモデルの内部システムプロンプトだ。3週間で4万スターという伸び率は、開発者コミュニティの飢餓感を端的に示している。スターを付けているのはプロンプトエンジニア、生成AIアプリ開発者、そして自社プロダクトに組み込むためのリファレンスを探しているエンタープライズ層と推定される。ナレーションで触れられているとおり、これらの命令文は「各社最先端AIをどう動かすか」の暗黙知が凝縮されたものであり、論文では絶対に公開されない実装層のノウハウだ。

なぜこのニュースが重要か

エンジニア視点でこのリークの本質を読むと、ポイントは「モデルの重みではなく、運用層のコンテキスト設計が競争優位の中核に移った」ことの可視化にある。anthropic Opus 4.7やGPT 5.5の素のモデル性能は、ベンチマーク上では数ポイントの差しかない。実際のユーザー体験を決めているのは、ツール呼び出しの順序制御、ハルシネーション抑制のためのガードレール文言、思考連鎖の出し方、refusal境界の定義といったシステムプロンプト層だ。これが今回まとめて流出した意味は重い。第一に、後追いのオープンモデル陣営が「Claudeっぽい応答」「GPTっぽい推論」を高速に模倣できるようになる。第二に、自社プロダクトでLLMをラップしている企業は、自分たちのプロンプトもいずれ抽出されるという前提でアーキテクチャを組み直す必要がある。プロンプトインジェクションによるシステムプロンプト抽出は2023年頃から知られていた問題だが、4万スターという規模で「抽出されたものが流通する」段階に入ったことが新しい。

技術的な深掘り

コードと仕様書から本質を読むという視点で、このリポジトリの中身が示唆するものを整理したい。anthropicのシステムプロンプトは過去のリーク事例から見ても数千〜1万トークン規模に達することが知られており、Opus 4.7世代ではさらに長大化していると推定される。注目すべきは、システムプロンプトに書かれている「やってはいけないこと」のリストだ。これはAnthropicやOpenAIが実運用で踏んだ地雷の記録そのもので、各社のレッドチーム結果が間接的に逆算できる。たとえばコード生成時の挙動指示、ツール使用時の引数フォーマット、ユーザー意図の解釈ヒエラルキーなど、APIドキュメントには載らない設計思想がそこにある。一方で、流出したプロンプトをそのまま自社のオープンモデルに貼り付けても同じ挙動はしない。なぜならClaudeやGPTのファインチューニングとRLHFが、それらの命令文に最適化された応答分布を学習しているからだ。プロンプトは触媒であって、本体ではない。これを誤解して「Claudeの中身が手に入った」と判断する経営者は、半年後にコスト超過で頭を抱えることになる。

経営者として次に取るべき動き

第一に、自社で運用しているLLMアプリケーションのシステムプロンプトを「公開前提」で監査せよ。顧客情報、内部API仕様、料金体系などをプロンプトに直書きしている場合、即刻RAG層や外部関数呼び出しに退避させる必要がある。プロンプト抽出攻撃は今後さらに容易になる。第二に、流出した主要モデルのプロンプトを技術チームに読み込ませ、自社の現行プロンプトと差分を取れ。anthropicやOpenAIが実運用で到達した制御構造は、自社で半年かけて試行錯誤するより圧倒的に安い学習教材だ。第三に、プロンプトを資産として扱う社内ガバナンスを整備せよ。バージョン管理、A/Bテスト基盤、変更履歴、責任者の明確化。プロンプトはもはやエンジニアの個人芸ではなく、コード同様にレビューとCIの対象である。この三点を今週中に着手した企業が、現場生産性で半年後に差をつける。