ユーザーが100ドル払う裏で、openaiやAnthropicは1000ドル以上のGPUコストを燃やしている――そんな試算がエンジニア界隈で議論を呼んでいる。今のAI料金は投資マネーで支えられた赤字の安売りであり、値上げは時間の問題だ。コードと請求書の両面から、この「10倍乖離」の正体と経営インパクトを読み解く。

何が起きたか

オランダのエンジニアGerben Wierda氏のブログで、AnthropicとopenaiがユーザーからAPIやサブスクリプションで受け取る100ドルに対して、裏側で1000ドル以上のコストを使っている可能性が指摘された。論点はシンプルだ。Claude 4.5やGPT系の長文・推論モードでは、1リクエストあたりのGPU消費トークン数が膨大で、H100/H200クラスのGPU時間とデータセンター電力、ネットワーク、減価償却を積み上げると、課金額の10倍規模のコストが発生している、というラフ試算である。動画ナレーションはこれを「100円課金で1000円赤字」とローカライズし、現状のAI料金が投資マネーで支えられた赤字の安売りであり、2〜3年以内の値上げか従量課金強化が前提だと整理した。同時に、これは赤字垂れ流しではなく「依存を作りに来ている戦略的ダンピング」だという見方も併記している。

なぜこのニュースが重要か

エンジニア視点で見ると、この10倍乖離は単なるユニットエコノミクスの話ではなく、推論ワークロードの設計思想そのものに直結する。直近のフロンティアモデルは「Thinking」「Extended Thinking」「o3 high」のように、隠れた推論トークン(reasoning tokens)を大量に吐き出してから最終出力を返すアーキテクチャに移行している。ユーザーには10トークンしか見えなくても、裏では1万トークンを生成してGPUを焼いている、という構造だ。openaiが2025年から推論トークン課金を本格導入したのもこの裏返しで、料金体系の側が原価構造に追いついていないことを白状している。

つまり「100ドルで1000ドル燃やしている」現象は、モデルが賢くなるほど悪化する。スケーリング則の延長で推論時計算(inference-time compute)に投資する戦略を取る限り、原価は指数的に膨らみ、サブスク定額は構造的に成立しない。Claude ProやChatGPT Plusの月20ドルが「永続的に安い」と信じて業務フローを組むのは、SaaSの原価感覚で発電所を借りているのと同じだ。

技術的な深掘り

コードと仕様書から見ると、10倍赤字を裏付ける兆候はAPIリファレンスに散らばっている。第一に、openaiのo1/o3系とAnthropicのClaude Extended Thinkingは、入力トークンより出力(reasoning含む)トークンの方が5〜10倍高い単価設定だ。これは「賢さ」がGPU時間に直結することを料金で認めている証左である。第二に、Anthropicが2025年に導入したPrompt CachingとBatch APIは最大50%割引だが、これは「フルプライスでは原価割れする」ことの裏返しに近い。キャッシュヒットを前提にしないと採算が合わない設計、という解釈ができる。

さらに踏み込めば、H100の電力消費は700W、推論1リクエストで数秒〜数十秒GPUを占有する。Semianalysisの公開推計ではGPT-4クラスの1Mトークン推論コストは数ドル〜十数ドルレンジで、これに人件費・R&D・GPU減価償却(H100一枚3万ドル超を3年償却)を載せると、ヘビーユーザーのClaude Max 200ドルプランは余裕で原価割れする。動画の「10倍」は誇張気味だが、ヘビーユースのコーディングエージェント用途に限れば4〜10倍は十分あり得る、というのが筆者の推定だ。

経営者として次に取るべき動き

第一に、AI予算を「現価格×2〜3倍」で再計上すること。openaiとAnthropicの値上げは2026〜2027年に来る前提で、3年契約の業務フローには必ず単価上昇のシナリオを織り込む。特にコーディングエージェントやRAG基盤など、トークン消費が業務量に比例する領域は要警戒だ。

第二に、推論コストを下げるアーキテクチャ側の打ち手を今のうちに仕込むこと。Prompt Caching、Batch API、出力トークン削減のためのStructured Output、軽量モデルへのルーティング(Haiku/4o-mini活用)を標準実装にする。値上げが来てから慌てても、コードベースの書き直しは間に合わない。

第三に、ベンダー依存度を定量モニタリングすること。Llama 3.3 70BやQwen 2.5、DeepSeek V3をオンプレ・自社VPCで動かせるルートを最低1本確保し、業務クリティカル処理の3割は乗り換え可能な状態にしておく。openai一本足は、来る値上げ局面で価格交渉力をゼロにする最悪手だ。