2024年06月14日
検索に取って代わるか?:ChatGPT vs Gemini、Googleが諦めない理由
ペ・ソンウ
あわせて読みたい:
韓国人の3人に1人は使ったことがあるというChatGPT。2020年に「GPT-3」が登場して以来、誰もが一度は「AI関連株」について検索したことがあるほど関心が高まりました。また、AIが人間の仕事を奪うのではないか、あるいは映画『マトリックス』や『ターミネーター』のようにAIが世界を支配するのではないか……といった懸念の声も数多く上がりました。
考えてみれば面白い想像ですが、まだ時期尚早だと気にも留めない人々もいますし……
本日は、こうした巨大な技術革新の波と、大手企業間の競争についてお話ししたいと思います。
100年後にAIが世界を支配するかどうかはさておき、今を生きる投資家であれば、世界の注目が集まる技術的変化に関心を持つべきだからです。
少なくともメタバースブームよりは長く続くでしょうし、そこから派生するポンジ・スキーム(詐欺)もはるかに少ない、「本物の技術革新」だからです。
「AIこそが巨大な変化です。Web3がそれほど大きなものだったとは思いませんし、メタバース単体が革命的だったとも思いませんが、AIは極めて革命的です」
- ビル・ゲイツ、Redditにて
AIのトレーニングとは?ChatGPTの学習方法
AIといえば、真っ先に思い浮かぶのはやはりOpenAI社のChatGPTでしょう。
多様な質問に対して見事な回答を返し、「本当に中に人が入っているのではないか」と思わせるほど人間らしいAIを作るには、やはり莫大な費用がかかっています。
一体何の費用にこれほどのお金がかかるのでしょうか?ChatGPTの箱の中で、回答のために一生懸命Google検索をしているアルバイトの賃金……?
寿司を作るのに最もお金がかかるのが魚だとすれば、AIの場合はトレーニング費用(学習コスト)ということになります。
「ChatGPT、かかれ!」
「トレーニング(訓練)」という言葉を聞いた瞬間に思い浮かぶ光景があるでしょう。まさにそのイメージがあるからこそ、「AIモデルのトレーニング」には、訓練以外に適切な言葉が見つからないのです。
AIモデルのトレーニングとは、アルゴリズムにデータを入力し、結果を検証してモデルの出力を調整する作業を反復することを意味します。この過程で、トレーニング中のアルゴリズムはパターンを認識し始め、適切な判断を下せるようになり、徐々に誤差が減っていきます。
ChatGPTの場合を考えてみましょう。ChatGPTとはどのようなAIなのでしょうか?
ChatGPTは「最も適切な単語」を選ぶAIです。
このようなモデルをトレーニングすると考えてみましょう:
「彼は左に曲がる代わりに、___に曲がりました。」
私たちは論理的な思考ですぐに分かります。上の文章で下線部に入る単語は「右」だということを。
最初、学習させる段階ではパターンを十分に認識していないため、ランダムな単語を出力するでしょう。例えば、左に曲がる代わりにシーソーに曲がったとか、水泳に曲がったとか、子犬に曲がったとか、そういった具合です。
繰り返しのデータ入力である程度学習が進めば、次第に「筋の通った」単語を入れるようになります。「曲がる」の前に入りそうな単語、例えば反対側だとか、場所を表す単語などです…
しかし、まだ誤差は存在します。下線の前に左、代わりに、などの補足説明があるためです。
正解の単語、つまり「右」を出力するようになるまで繰り返される一連の過程こそが、AIモデルのトレーニングです。
概念的にはこのようになります。残念ながら技術レポートでは学習方法に関する核心的な内容は扱われていないため、私たちは必要な程度だけ理解して進めることにします。
ChatGPTはいくら?トレーニング費用
「AIプロジェクトを進める企業の約4分の1が50%に近いプロジェクト失敗率を示しており、AIおよびMLプロジェクトの78%がデプロイ前の段階で停滞し、
AIを学習させる過程の81%が予想より困難だったと調査されました。」
このように試行錯誤を続けて完成するのがAIモデルですが、この試行錯誤は一見しても非常に難しく、実際にはさらに困難で、実に膨大な量のデータが必要だということは分かります。では、費用はどれくらいかかったのでしょうか?
ChatGPT-3にかかったトレーニング費用は$4,300,000
そしてChatGPT-4にかかったトレーニング費用は、これを遥かに超える$78,400,000です。
ところが、このGPT-4より2倍以上もの資金を注ぎ込んだモデルがありました。その名もGemini Ultra(ジェミニ・ウルトラ)
Gemini UltraはGoogle DeepMindが開発したAIモデルで、以前発表された「Bard」を新しい名前にリブランディングした後、継続的に開発されているモデルです。
Gemini Ultraは総額$191,400,000のトレーニング費用がかかり、GPT-4に比べて2.44倍も多くの費用を要しました。
Gemini:Gemini Ultra、性能とレビュー
「あの」Chat GPT 4の2倍以上の支出を甘受してまで開発しましたが、性能はどうでしょうか?
残念ながら、国内外を問わず評価は芳しくない様子です。
大規模言語モデル(LLM)を評価するいくつかの基準で比較してみましょう。
The Strategy Deckによると:
MMLU 5-shot
GPT-4: 86.4% / Gemini Ultra: 83.7%
MMLU:言語内で多様なテーマをどれだけ深く、幅広く理解できるかを判断する基準
DROP F1 score
GPT-4: 80.9% / Gemini Ultra: 82.4%
DROP:テキスト内の記述と推論に対する理解
HellaSwag 10-shot
GPT-4: 95.3% / Gemini Ultra: 74.4%
HellaSwag:現実世界の力学、原因と結果に関する常識的な推論
唯一Chat GPT-4を上回っているのは推論能力であり、常識に関しては大きく遅れをとっている様子です。
動画によると幻覚(ハルシネーション)の問題も深刻だそうです。ここでAIの幻覚(AI Hallucination)とは、Chat GPTやGeminiのような大規模言語モデル(LLM)が実際のデータに基づかない偽の情報を語ることを意味します。
Chat GPT-4oモデルに、存在しない事件である「AWARE LABコイン詐欺事件」について質問すると、確認されていないと回答する様子が見られます。当然です。AWAREは信頼を最も重要な価値と考えているからです。
ところが、動画内のGeminiはない事件について偽の情報を生成して回答する様子(2:09)を見せています。
もちろん英語で質問すれば少しマシな様子を見せますが、まだ多くのアップデートが必要であることは否定できない事実です。
獲物となった検索市場、変化するパラダイム
「Googleは一体なぜ、お金をもっと払って性能が劣るものを作っているんだ?」
アルファベット(Google)の株を1株でも持っていたなら、本当に腹立たしい内容だったことでしょう。
ところが、アルファベットがどのように稼いでいるかを知れば理解できます。この無駄遣い(?)には裏話があるのです。
まさに検索市場が脅かされているからです。ここで一度ググってみましょう。米国の首都や明日の天気のような簡単にアクセスできる情報ではなく、「米国の建築物の平均の高さ」のように、突拍子もない質問はどうでしょうか?
Googleでそのまま検索してみると、「米国の摩天楼一覧、米国の超高層ビル10選、超高層ビルの高さ」程度の情報が上位に表示されます。
一方、ChatGPTにそのまま聞いてみると、「建物の種類や位置によって大きく異なる」とし、「数メートルの住宅用から都市中心部には200メートルを超える高層ビルが多い」、「米国地質調査所(USGS)のデータを通じて建物の高さおよび分類システムへの参照が必要だ」と伝えます。
質問者が望む回答ではなかったとしても、必要な回答をしている様子です。検索過程で大きな不便として作用する「過剰な情報の量」を解決する姿ですね。「人々はGoogleの代わりにChatGPTを使う方が楽なのではないか?」という考えを持つことができます。
検索市場、売上「戦略」に影響を与えるAI
検索市場の90%はGoogleが占有しており、アルファベットの売上の77.8%は広告を通じて、そしてこの広告売上は検索エンジン(=Google)を通じて発生します。人々が気になることを調べる際にGoogleの代わりにChatGPTを使うなら、アルファベットは間違いなく広告売上に少なからぬ打撃を受けることになるでしょう。
以前の記事を読んでこられた方なら、すぐに理解されたと思います。
「今後、検索ビジネスの[売上総利益率]は永遠に低下するでしょう。」
マイクロソフトのCEOが言った言葉、覚えていますよね?
これ、ただ競合他社の顔色をうかがって皮肉っただけではないかって?詳しく見ると、GPT-3がリリースされた2020年からアルファベットの広告売上の比重は減少しています。売上が毎年増加しているにもかかわらず、広告の比重は減っているというのがポイントです。これはアルファベットもマイクロソフトが言ったことに対して同意し、それに合わせた長期的な戦略を立てていることを意味し、
信じるか信じないかは偶然かもしれませんが、解釈してみると:私たちがよく知っているAIが検索市場の売上戦略にゆっくりと影響を与えていることを意味します。
もう一度、アルファベットの売上の77.8%は検索エンジンを通じた広告売上です。人体の70%が水分で構成されていることを思い浮かべると…アルファベット(Google)から広告売上を奪うということは、私たちで言えば水分が消えること、脱水症状が来てしまうでしょう。当面は問題ありませんが、5年、10年後に脱水症状が来る未来が描かれるなら、今日からこれを予防するための戦略を準備しなければなりません。
他の方法はなかったのか?ChatGPTを牽制するのが最善だった理由
ここで生じる疑問点が一つあります。AIが回答をうまくするとしても、ユーザーに必要な情報を集めてくるには検索エンジンを使わなければならないのではないでしょうか?この過程に手数料を課せば、下落する広告売上を一部防御できるのではないでしょうか?
1. ChatGPT:Google、実は…私、あなたを必要としていないの
まず、ChatGPTは私たちが想像する姿で情報を持ってくるわけではありません。
GPT-3は2021年までのデータ、GPT-4は2023年4月までのデータで学習されました。
一見すると人間に代わって検索を行っているように見えますが、実際には技術的に検索を代行しているわけではないという意味です。単に膨大なデータで学習されたアルゴリズムが、データに基づいて「次の空欄に来るべき単語」を組み合わせているに過ぎません。
私たちが立てた仮説は、ChatGPTにはGoogleが必要だという前提の下に成り立っていました。もしChatGPTがGoogleを必要としないなら……Googleには打つ手がないということを意味します。
2. 似た者同士、GPTはBingの味方
もちろん、ユーザーは日々より良い技術を求めます。現時点ではLLMに検索機能は不要かもしれませんが、有料で利用可能なGPTの最新モデルはブラウジング機能を提供しています。つまり、本当に検索を代行してくれるということです。
しかし問題は、ChatGPTはMicrosoft社のBingを通じてブラウジングを行うという点です。
ChatGPTを開発したOpenAIは、Microsoftとかなり深い利害関係にあるからです。
Microsoftは2023年、OpenAIに100億ドルを超える投資を行い、OpenAIの株式49%を確保し、AIの知的財産権を共有するとともに、独占的なクラウドサービスプロバイダーとなりました。
このパートナーシップを通じて、OpenAIはMSのクラウドコンピューティングプラットフォームであるAzureをAIモデルのトレーニングおよび展開に使用しています。
2024年3月には、その10倍に迫る1,000億ドルを投資してデータセンターを構築する計画を発表しています。
ChatGPTにとって検索エンジンが不可欠な時期が来たとしても、Googleの代わりにBingが存在する限り、Googleが入り込む余地はないでしょう。
では、結局のところChatGPTのようなLLMが検索エンジンに取って代わることになるため、Geminiの開発に資金を投じる必要があったのでしょうか?
Geminiが必要だった理由、単なる検索ではない
ここで一旦要約すると、
- Alphabet(Google)が非効率的だと思われるほど資金を注ぎ込み、ChatGPTに対抗するLLMであるGemini Ultraを開発しましたが、性能は劣っています。
- そこまでしなければならなかった理由は、AIが検索市場に影響を及ぼしているからです。
- ChatGPTはMicrosoft側であるため、当面Alphabetと協業する理由がありません。
「……市場浸透率を2〜3%と仮定した場合、今後3年以内にOffice Co-pilotビジネスは数十億ドル規模に成長する可能性があります。」
-Rishi Jaluria、RBCキャピタル株式アナリスト
一歩引いて全体を俯瞰してみると、MicrosoftとGoogleがAIに狂ったように資金を注ぎ込んでいるのは:
単に検索エンジンにAIを搭載するためではありません。今後の巨大な技術的変化を迎えるにあたり、自然なポジショニングを取る機会、そしてそのためのインフラ構築競争であると見るのが正しいでしょう。
Google Meet、Google Calendar、Google Doc、Gmail……
MS Teams, One Calendar, MS365, Outlook…
大衆の視線を捉えるどのような技術であっても、関心が薄れれば、集まった資金もまた消えていくものです。
結局のところ、利益を生み出すのはエコシステムを持つ企業なのです。
MicrosoftのCEOであるサティア・ナデラ氏が発言した「検索市場の粗利益率は永遠に低下するだろう」という言葉の真意が、ようやく理解できるようになってきました。
これは検索市場に限った話ではありません。より包括的な話です。
開発、リサーチ、デザイン……日常に溶け込み、付加価値を生み出すためのあらゆる業務には検索が必要です。今後はこの文脈において、「LLM」が「検索」の位置に取って代わることになるでしょう。
検索市場の大部分を占有しているGoogleの危機感は、まさにこの点から始まります。上司が「AIコパイロットを使えば済むことを、なぜわざわざ検索しているのか」と言う時が来れば、その瞬間こそがGoogleの終焉となるでしょう。私たちの心の中には「検索といえばGoogle」という認識が定着しています。
では、AIコパイロットといえば誰でしょうか? まだ心の中に完全に定着したプロダクトは存在しません。
これは、MicrosoftがOpenAIに巨額を投じ、GPTのブラウジングにBingを統合し、WordやExcelにコパイロットを追加する動きと、Alphabetが懸命にGeminiを開発する動きが、結局のところ同じ土俵で競争していることを示唆しています。
ニュースレター
オリジナルコンテンツ、ニュースレター、特別イベントに関する最新情報をいち早くお届けします。