Gemini 3.5 FlashがPC操作、RPA市場を飲み込む

Googleが「Gemini 3.5 Flash」にコンピューター・ユース機能を搭載した。AIがブラウザを見て、クリックし、入力する。ホワイトカラーの定型作業をAIに丸投げする時代の号砲だ。だが現場からは「遅い、危険、コスパ悪い」との辛口評価も。経営者はこの一報をどう読むべきか、ROIの視点で整理する。

何が起きたか

GoogleはGemini 3.5 Flashに「コンピューター・ユース（PC操作）」機能を搭載した。AIがブラウザ画面を視覚的に認識し、人間と同じようにボタンをクリックし、フォームに文字を入力し、画面遷移を伴う一連の業務を自律的に進める仕組みだ。経費精算、見積入力、社内システム間の転記といった、ホワイトカラーが日々こなしている「画面を見て手で動かす」作業をAIに委譲するための技術的土台が、いよいよ商用クラスで整いつつある。

注目すべきは、これが最上位のProモデルではなく、高速・低コスト帯の「Flash」に搭載された点だ。Googleは明確に「業務での反復利用」をターゲットに据えている。一方で、Hacker Newsをはじめとする技術コミュニティからは「遅い、危険、費用対効果が悪い」という辛口の指摘も上がっており、現時点ではPoC（実証実験）の域を出ないという冷静な評価も併存する。

なぜGemini 3.5 FlashのPC操作が経営者にとって重要か

このニュースの本質は、新機能の追加ではなく「RPA市場の構造変化」にある。これまで国内企業がライセンス料と保守費で年数千万〜数億円を投じてきたRPAは、画面定義が変わるたびにスクリプトが壊れる脆弱な仕組みだった。Gemini 3.5 Flashのコンピューター・ユースは、画面を「見て理解する」アプローチであり、UI変更への耐性が原理的に高い。RPAベンダーが守ってきた堀が、汎用AIによって正面から崩されつつある。

ROIの観点で見れば、Flash版に搭載された意味は大きい。Proモデルの数分の1のトークン単価で動かせるなら、1業務あたりのランニングコストはRPAライセンスを下回る水準に到達し得る。推定だが、月100時間規模の転記業務であれば、人件費換算で年300万円超の削減余地が現実視野に入る。

ただし、辛口評価も無視できない。現状の処理速度では「即応性が必要な顧客対応」には不向きで、適用領域はバックオフィスの非同期処理に限られる。導入判断は「速度よりスループット」「同期より非同期」を見極めることから始まる。

経営判断への含意

経営者が問うべきは「AIに任せられる業務はどれか」ではなく、「自社の業務は、AIに渡せる形に整理されているか」である。ここに決定的な分岐がある。

多くの企業のホワイトカラー業務は、属人化と暗黙知の塊だ。「Aさんがこの画面を開いて、勘でこの数字を入れて、隣のシステムに転記する」という工程は、現状のままではAIにも渡せない。Gemini 3.5 Flashがいくら賢くなっても、入力すべき判断基準が言語化されていなければ、AIエージェントは止まる。つまり今回の発表は、技術投資よりも先に「業務の棚卸しと標準化」という地味な経営課題を突きつけている。

さらに、RPAベンダーとの契約を抱える企業は、今後3年間の更新判断を慎重に行うべきだ。RPA市場がAIエージェントに飲み込まれる前夜にあって、長期契約や大規模刷新に踏み切る合理性は薄い。「保守だけ継続し、新規はAIエージェントで」というハイブリッド戦略が現実解になる。Hacker Newsの「危険」という指摘も重い。承認権限を持つ画面をAIに開放する際の事故リスクは、ガバナンス設計を先行させない限り経営直撃の損失になり得る。

経営者として次に取るべき動き

第一に、向こう30日で「画面操作業務の棚卸し」に着手すること。経費精算、見積入力、社内システム転記など、月10時間以上を消費している作業をリスト化し、判断基準を文書化する。これがAIエージェント導入のROIを決める。

第二に、現行RPA契約の更新タイミングを洗い出し、2027年以降の長期コミットを一旦凍結する方針を経営会議で共有すること。Gemini 3.5 Flashを含むAIエージェント勢の成熟度を見極める時間軸を、契約戦略に組み込む。

第三に、情シスではなく経営直下で「AIエージェント・ガバナンス委員会」を設置すること。承認権限、ログ監査、誤操作時の責任所在を先に決める。技術導入より制度設計が先行した企業だけが、来期この波の恩恵を取りに行ける。動かない経営判断こそが、最大のコストになる局面に入った。