日本人開発者ヤマダショウ氏のRepomixがGitHubで25,782スターを突破した。リポジトリ全体を単一テキストに圧縮し、Claude や ChatGPT に丸ごと食わせるためのツールだ。「AI-friendly file. Perfect for when you need...」というREADMEの一文が示す通り、これはコードベースをLLMの文脈窓に収める標準手順になりつつある。エンジニアの工数配分と、社外送信ポリシーの再設計が同時に迫られている。
何が起きたか
Repomixは、repomixとワンコマンド叩くだけで、対象リポジトリ配下のソースコード一式を1つのテキストファイル(XML/Markdown/プレーンテキストを選択可)にパックする、Node.js製のCLIツールである。ヤマダショウ氏個人プロジェクトとして公開され、現在25,782スターに到達。GitHubのDevelopersトレンドでも上位常連だ。
利用シーンは明確で、ClaudeやChatGPT、Gemini、ローカルLLMに「このリポジトリ全部読んで、仕様書を書いて」「アーキテクチャをレビューして」と頼むときの前処理である。.gitignoreの尊重、シークレットの自動検出(Secretlint連携)、トークンカウント表示までを1コマンドでこなす。社内導入の最初の一歩として採用するエンジニアが急増しており、25,782という数字はその実需を反映している。
なぜこのニュースが重要か
OSSのスター数は人気投票だが、Repomixの2.5万は別の意味を持つ。これは「LLMにコードを食わせる工程」が、もはや各社の自前スクリプトでは間に合わず、共通の標準ツールを欲しがっているという市場の合図である。
Cursor、Cline、Claude Code、GitHub Copilot Workspaceなど、IDE内蔵型のAIエージェントが普及している現在、なぜ依然としてRepomixのような「手動パック → 外部LLMに貼る」フローが伸びているのか。理由は3つあると推定する。第一に、IDE型エージェントの文脈把握はファイル単位で局所的であり、リポジトリ全体を俯瞰した仕様書作成やアーキテクチャレビューには弱い。第二に、最新のClaude Sonnet 4.5やGemini 2.5 Proは100万トークン級の文脈窓を持ち、中規模リポジトリなら丸ごと載る。第三に、エージェント任せでは「何を見せたか」が不透明だが、Repomixの出力は人間がlessで確認できる単一ファイルで、説明責任を満たせる。
つまりRepomixの伸びは、エージェント全盛時代における「人間が制御する明示的な前処理」への回帰を示している。
技術的な深掘り
Repomixの設計で蛙井が評価するのは、AI向け出力フォーマットの選定をユーザに委ねている点だ。デフォルトはXML風タグで、これはAnthropicが公式に推奨する構造化プロンプト形式と一致する。Claude系に食わせる場合、Markdownよりタグ区切りの方がファイル境界の認識精度が体感で明確に上がる。一方GPT系はMarkdownでも高精度を保つ。この使い分けを設定一つで切り替えられる設計は、LLMごとのトークナイザとアテンション特性を理解した上での実装で、READMEに「Perfect for when you need to feed your codebase to LLMs」と書く資格がある。
ただし、無批判に使えば事故る。トークン課金で見ると、10万トークンのリポジトリをClaude Sonnet 4.5に投げると入力だけで$0.30、出力込みで$1〜2/回。これを毎日数十回回すと、ひとり月$1,000を超えうる。--compressオプションでTree-sitterベースの関数シグネチャ抽出に圧縮できるが、これを使わない運用が蔓延すれば、AIコストが開発コストの新たなボトルネックになる。さらにSecretlintは万能ではなく、独自形式のAPIキーや顧客データを含むフィクスチャは検出漏れする。.repomixignoreの設計こそが、このツールを使いこなす本丸である。
経営者として次に取るべき動き
第一に、Repomixの社内検証チームを今週中に立ち上げること。GitHubの社内リポジトリでnpx repomixを実行させ、トークン数と機密検出結果のレポートを上げさせる。これだけで自社コードの「AI読み込み可能性」が定量化される。
第二に、外部AI送信ポリシーをコード資産に対しても明文化すること。「どのリポジトリは外部LLM送信OKか」「OSSライブラリのみOKか」「.repomixignoreの標準テンプレートは何か」を、情報セキュリティ部門とエンジニアリング部門で合意し、リポジトリのルートに置く運用にする。
第三に、Repomixで圧縮したコードベースを使った「仕様書自動生成」「アーキテクチャレビュー」「依存ライブラリのEOL監査」を、四半期ごとの定常業務として組み込むこと。これまで人月単位で計上していた重い作業が、数十秒+LLM課金数ドルに変わる。浮いた工数を新規開発に再配分する設計こそ、25,782スターのツールを経営インパクトに変える唯一の道である。
