主要LLMの中身流出、4万スター騒動の真実

GitHub上で公開された「system_prompts_leaks」が、わずか数日で4万スターを突破した。ClaudeやChatGPT、Gemini、Grokといった主要LLMの内部指示書、いわゆるシステムプロンプトが丸裸にされたのだ。世間は「学びのチャンス」と歓喜しているが、辛口評論家として言わせてもらう。これは祭りではなく、地雷原だ。

何が起きたか

asgeirtj氏のリポジトリ「system_prompts_leaks」が、Opus 4.7、Opus 4.6、Sonnet 4.6、ChatGPT 5.5 Thinking、GPT 5.5 Instantといった最前線のLLMから抽出されたシステムプロンプトをまとめて公開した。スター数は40,580。GitHubで4万スターというのは、ReactやVue級のメガプロジェクトに匹敵する異常な数値だ。それが数日で達成された事実は、開発者コミュニティの飢餓感を物語っている。AIがどう振る舞うか、なぜ特定の質問を断るのか、どんな順序で思考するのか。その「設計図」がAnthropicやOpenAIの許可なく晒された。各社は公式には沈黙しているが、内部では火がついているはずだ。流出元はジェイルブレイク経由の抽出と推定されるが、再現性が高い時点でLLM側の防御は事実上敗北している。

なぜこのニュースが重要か

このニュースの本質は「プロンプトが知的財産として守れない」ことが、4万スターという数字で証明された点にある。AnthropicやOpenAIが莫大なコストをかけて磨いたシステムプロンプトは、もはや公開ドキュメントと同義だ。これは経営者にとって死活問題である。なぜなら、自社で内製した業務AIの「指示文」も同じ運命を辿るからだ。社内の機密ロジック、コンプライアンス条項、顧客対応の禁則事項。これらをシステムプロンプトに書き込んでいる企業は、今すぐ前提を疑うべきだ。さらに深刻なのは、攻撃者がこれを学習データとして偽AIを構築するリスクである。Claude風の応答、ChatGPT風のトーンを完全模倣したフィッシングボットが量産されれば、もはや本物と偽物の区別はつかない。「公式の話し方」が攻撃ベクトルになる時代が来た。これは技術トピックではなく、ブランド毀損の危機である。

過剰評価への反論

世間は「無料で世界最高のプロンプト技術が学べる」と浮かれている。だが、私は冷や水を浴びせる。第一に、システムプロンプトを模倣しても同じ性能は出ない。プロンプトはモデル本体、ファインチューニング、強化学習のレイヤーと一体で機能する。Opus 4.7のプロンプトをローカルのオープンモデルに貼り付けても、出てくるのは劣化コピーだ。「設計手法を学べる」と言うが、楽譜だけ手に入れてオーケストラを再現できるか、という話である。第二に、4万スターという数字自体が罠だ。スターを付ける人間の大半は「ブックマーク」目的であり、実際に読み込んで業務に活かす人間は1%もいないと推定する。バズった瞬間に飛びつくのは、いつだって素人だ。第三に、この公開によってAnthropicとOpenAIは次のバージョンでプロンプトを暗号化・難読化する方向に進む。つまり、今回学べる内容は半年後には旧世代の遺物になる。歴史的資料としての価値はあるが、競争優位の源泉にはならない。祭りに乗るな、というのが私の結論だ。

経営者として次に取るべき動き

第一に、自社AIのシステムプロンプトを「公開前提」で書き直せ。機密情報や独自ロジックをプロンプトに直書きする運用は今日で終わりだ。RAGや外部ツール呼び出し、権限管理されたAPIに切り出し、プロンプト本体は「公開されても困らない骨格」だけにする設計に移行すべきだ。第二に、セキュリティ部門に「偽AI検知」のミッションを正式付与せよ。自社ブランドを騙るチャットボットが顧客接点に現れる可能性を前提に、ドメイン監視と通報フローを今週中に整える。第三に、流出プロンプトの「学習」は若手1人に限定して任せろ。全社で時間を溶かす価値はない。要点をまとめさせ、自社のプロンプト規約に反映する。それで十分である。祭りに参加するのではなく、祭りの後始末で利益を取りに行く。それが経営者の仕事だ。