オープンソースだから安全、自社サーバーに置けるから安心。その神話が、Qwen3.5の重み解析によって今日、技術的に崩された。天安門や台湾を尋ねると話をそらすAIの「検閲」が、ファインチューニングではなく重みそのものに焼き付いていたのだ。誰の思想で自社サービスは答えているのか。経営者はもう、この問いから逃げられない。
何が起きたか
アリババが公開している大規模言語モデル Qwen3.5 の重みを解析したブログ記事が、Hacker News で話題を呼んでいる。報告によれば、天安門事件、台湾、新疆ウイグルといった中国政府にとってセンシティブな話題について質問すると、モデルが回答を拒否する、話題をそらす、あるいは公式見解に近い回答を返すという挙動が、システムプロンプトや後段のフィルタではなく、モデルの重み(パラメータ)そのものの中に組み込まれていることが可視化された。つまり、ユーザーがどれだけプロンプトを工夫しても、自社のGPUに載せて独立運用しても、その「思想的バイアス」は付いてくる。オープンソースAIに政治的検閲が技術的に焼き付いている事実が、初めて再現可能なかたちで提示された格好だ。
なぜこのニュースが重要か
ここで重要なのは「中国製AIは危ない」という単純な話ではない。問題の本質は、モデルの重みは中立な数学ではなく、作り手の価値観が物理的に埋め込まれた塊であることが、誰の目にも見えるかたちで証明されたことだ。これまで「LLMにはバイアスがある」という指摘は抽象論として流されてきた。だが今回は、特定トピックで活性化するニューロン群、回答を曲げる重みベクトルが具体的に指し示されている。
これは法務・広報の新領域を生む。たとえば日本企業がQwenを社内チャットボットや顧客対応に組み込み、ユーザーが歴史問題や地政学的トピックに触れた瞬間、自社サービスが中国政府寄りの回答を返すリスクがある。それは「AIが勝手に言ったこと」では済まされない。発信者責任は、最終的にモデルをデプロイした企業に降りかかる。OSSのライセンスは責任を肩代わりしてくれない。重みに何が焼かれているかを把握せずにデプロイすることは、内容を読まずに広告を出稿することと同義だ。
過剰評価への反論
ここで多くの論者は「だからOpenAIやAnthropicを使え」という結論に飛びつくだろう。私はその短絡を退ける。米国製モデルにも、別種の思想的バイアスが重みに焼き付いている。中絶、銃規制、特定の政治家への評価、イスラエル・パレスチナ問題──これらでAnthropicやOpenAIのモデルが「中立」だと信じているなら、それは検証していないだけだ。今回のQwenの件が衝撃的に映るのは、中国の検閲が分かりやすく「目に見える形」だったからにすぎない。西側モデルのバイアスは、より洗練され、より「リベラルな常識」として擬態しているぶん、検出が難しい。むしろタチが悪い。
さらに言えば、「複数モデル併用で監査すれば解決」という処方箋にも私は懐疑的だ。3つのモデルを並べて多数決を取っても、全モデルが類似の英語コーパスで訓練されていれば、同じ方向に偏った「合意」が出るだけだ。バイアスの分散ではなく、バイアスの相関こそが本当の問題である。監査の仕組みを売りたいコンサルがこの話を「ガバナンス案件」に変換するのは目に見えているが、表層的なチェックリストでは本質に届かない。重みレベルの解析能力を持つ人材を社内に確保できない企業は、結局のところ、誰かの思想を借りて事業を回し続けることになる。
経営者として次に取るべき動き
第一に、自社で使用中の全LLMについて「政治的・歴史的・倫理的トピックでの回答ログ」を抜き取り検査せよ。月次でいい。何が出ているかを把握していない経営は、もはや経営ではない。
第二に、調達基準に「モデル提供元の国・規制環境・トレーニングデータ開示レベル」を明記せよ。価格と性能だけで選ぶ時代は、今日で終わった。重みの出自は、原材料の産地表示と同じ重みを持つ。
第三に、自社サービスのユースケースを「政治・歴史トピックが混入し得るか」で分類し、混入リスクのある領域にはルールベースのガードレールを必ず前段に置け。LLM単体に判断を委ねるな。AIの答えはもう中立ではない。中立を演じているモデルほど、誰かの思想を静かに配信している。それを忘れた経営は、ある朝、自社の名で発信された一文によって炎上する。
