Repomix 2.6万⭐、Perfectなコード資産化の起点

日本人開発者・yamadashy氏が手掛けるOSS『Repomix』がGitHubで2万6千スターを突破した。リポジトリ全体を1枚の『AI-friendly』なテキストに畳み込み、ClaudeやChatGPTに丸ごと読ませる——その『Perfect for』というREADMEの一節が、いまレガシーコード解析の常識を書き換えつつある。エンジニア視点で、この数字の本質を解く。

何が起きたか

GitHub上で、yamadashy/repomixのスター数が26,676に達した。Repomixは、対象リポジトリのソースコード一式を走査し、トークン数・ディレクトリ構造・依存関係のメタ情報を付与した上で、単一のテキストファイル（XML/Markdown/Plainを選択可能）に圧縮整形するCLIツールだ。出力はClaude・ChatGPT・Geminiなど主要LLMのコンテキストウィンドウに直接流し込める形式に最適化されている。READMEは「Perfect for when you need to feed your codebase to AI」と謳い、その一文が世界中のエンジニアに刺さった。日本人個人開発者発のOSSが2万スターを超える事例は依然として希少で、TypeScript製ツールとしては2026年で最も勢いのある一本に数えられる。

なぜこのニュースが重要か

Repomixの台頭は、単なる便利ツールの流行ではない。「LLMにコードベース全体を渡す」という前提が、開発フローの基底レイヤーに組み込まれ始めた証左である。従来のAIコーディング支援は、IDE上でカーソル周辺のコンテキストをRAGで補強する方式が主流だった。だが推定100万トークンを超える長文脈モデルが当たり前になった2026年、もはや「部分を切り出して渡す」より「全部を渡して読ませる」方が精度もコストも勝つケースが増えている。Repomixはこの転換点に対する最適化レイヤーだ。.gitignore準拠の除外、シークレット検出、トークン数カウント、コメント除去——LLMに食わせる前の「下ごしらえ」を標準化した点が決定的に重要で、これは10年前のwebpackやprettierがフロント開発の前提になった構図と相似形である。「Perfect for AI consumption」というポジションを最初に押さえた者が、エコシステムの中央を取る。

技術的な深掘り

Repomixの設計を読むと、思想の鋭さがわかる。第一に、出力フォーマットがXML優位である点。Anthropicが公式に推奨する通り、Claudeは<file path="...">のような構造化タグを文脈分離に利用する。Repomixはこれを既定値に据え、LLMのアテンション機構が「どこからどこまでが1ファイルか」を誤認しない設計になっている。第二に、リモートリポジトリ処理機能。repomix --remoteでクローン不要のワンショット解析が可能で、これはCI/CDパイプラインや、社外監査ツールとの接続点として極めて有効だ。第三に、MCP（Model Context Protocol）サーバー対応。Claude Desktopから直接Repomixを呼び出し、ローカルコードを動的にパックできる。ここまで来ると、Repomixは「ツール」ではなく「LLMとコードベースの間のプロトコル変換器」と定義し直すべきだろう。競合のgitingestやcode2promptと比較しても、エコシステム連携の厚みで頭一つ抜けている。

経営者として次に取るべき動き

第一に、自社リポジトリの「LLM可読性」を棚卸しすること。Repomixで自社コードを実際にパックし、出力トークン数を測れ。100万トークンを超えるなら、それはモノリスの解体か、機能単位パッケージングの設計負債が顕在化している証拠だ。コード資産の健康診断として無料で使える。

第二に、レガシー解析の外注予算を組み替えること。COBOLやPHP4世代の解析見積りは月数百万が相場だが、Repomix + Claude Opus 4の組み合わせで、初期解析フェーズは推定1/10以下に圧縮できる。RFPの前にまず社内PoCを走らせるべきだ。

第三に、社内エンジニアのOSS活動を制度として支援すること。Repomixは個人発OSSが世界標準を獲る時代の象徴だ。業務時間の10%をOSSコミットに充てる制度、スター数連動のインセンティブ——「Perfect」な仕組みを社内に実装した企業から、次のyamadashy氏が生まれる。