2023年12月21日
世界を驚かせたテック企業が一丸となって支援する「AI企業」
ペ・ソンウ
水面下で発展を続け、今まさに浮上し始めた技術があります。
言葉だけは私たちに馴染み深い「人工知能(AI)」と「機械学習(ML)」です。
私たちはAIでチャットボットを作成したり、盗作を検出したり、セキュリティに活用したり、顔認識でロックを解除したりしています。
また、MLによってコンテンツの推奨を受けたり、消費者の購買傾向を把握したり、不正決済を識別したりもします。
活用範囲が極めて広いこの技術は、その範囲の広さゆえに、あえて説明するまでもなく莫大な付加価値を生むことが想像できます。
AIとMLを用いて人々の関心を引く製品を作り、広告を組み込むというありふれた手法から、技術を「活用」してより良い結果を導き出せるという点まで、その技術力の凄さを垣間見ることができます。
参考:
一つの例として、8月にAmazonがロボット掃除機メーカーのiRobotを買収した件が挙げられます。
Amazonがロボット掃除機メーカーを買収した理由は何でしょうか?ロボット掃除機を製造し、Amazonを通じて販売するためでしょうか?
AmazonのAIアシスタント「ALEXA」に必要だったからです。
ALEXAは2014年11月に初めて発売されたAIスピーカーです。ALEXAは様々な音声コマンドを通じてユーザーと対話し、天気や交通情報などを教えてくれます。
現在は当該部門がAmazonの売上に大きな打撃を与えているという声も多いですが、ALEXAとロボット掃除機の結合は間違いなく期待できるものです。
「ALEXA、寝室を掃除して」
ALEXAとロボット掃除機の組み合わせといえば、おそらくこのようなイメージが思い浮かんだことでしょう。
しかし、ロボット掃除機の機能の中でALEXAにとって真に必要な機能は、掃除ではなく、部屋の構造や物を認識する機能です。
この機能により、ALEXAはその世帯に住む人の特徴、どのような生活パターンを必要としているか、趣味は何かなど、実に多様なことを把握できるようになります。
リビングに犬のおもちゃが散らかっていれば、間違いなくその家では犬を飼っているはずです。ALEXAはこの情報をアップデートし、その人に犬用品の広告を配信できるようになります。
プライバシー侵害などの懸念はありますが、本当に必要な広告を届けることで購買転換率(コンバージョン率)を高められるというのは、間違いなく素晴らしい価値です。
もう一つの例として、人工知能を活用した絵画コンテストが挙げられます。
ジェイソン・アレン(Jason Allen)氏は、米国コロラド州博覧会の美術コンテストにおいて、AIを活用してデジタルアート部門で1位を獲得しました。
AIに絵を描くよう指示し、AIが描いている間にNetflixでも見ていたのであれば問題になったでしょうが、
ジェイソン・アレン氏はAIを活用したという論争に対し、
「私はこの作品を作るために特別なプロンプトを研究し、それを用いて100枚に及ぶ画像を生成しました。数週間の微調整とキュレーションを経た後、Gigapixel AIで出力し、最も優れた3つの作品をキャンバスに印刷しました」と述べました。
彼はAIに「依存」したのではなく「活用」したことを証明し、主催者側もまた、彼がコンテストへの応募前にその事実を明かしていた点を根拠に、彼を支持しました。
AIで「特定の何かを代替した」のではなく、それを活用して「より良い何かを作り出した」ということです。
世界は実に速いスピードで発展しており、多くの企業が多方面で進化した技術力を取り入れています。
しかし、ようやく表面化してきたこの驚くべき技術は、まだ始まったばかりだということを知っておく必要があります。
あらゆる進歩を加速させる一企業
"私たちは最大規模のモデルをトレーニングするためにRayを使用しています。前例のない規模への拡張を可能にしてくれたため、非常に役立っています。"
Greg Brockman、OpenAI創業者兼CTO
最近、SNS上で多くの人々を驚かせた画像生成AIやチャットボットを開発したOpenAI社のCTOが絶賛した製品があります。それがRayです。
Rayがなければ、現在のような技術力を備えるまでには、はるかに長い時間がかかっただろうと解釈することもできます。
RayはAnyscaleが開発した、機械学習インフラの構築に使用されるフレームワークであり、
現在、IBM、Meta、Uber、Riot Gamesなど、多くの大企業がRayを使用しています。
では、このフレームワークの一体何がそれほど素晴らしいのでしょうか?
最近Ray 2.0へのアップグレードを完了し、シリーズCラウンドで9,900万ドルの追加資金調達を行ったAnyscaleが語るRayの強みは、以下の通りです。
分散コンピューティングのためのシンプルなAPI
分散コンピューティングとは、一つの問題を解決するために多数のコンピュータが協調して動作するようにすることを指します。
Facebookにアップロードされる膨大な写真や動画データを複数のコンピュータに分散して保存することは、その一例であり、
処理すべきタスクが増えた際にコンピュータを追加できる拡張性(スケーラビリティ)、一台のコンピュータに障害が発生しても稼働し続けられる可用性、リソース使用を最適化できる効率性などの利点があります。
この分散コンピューティングは、ハードウェア、ミドルウェア、ソフトウェアにまたがって複数のシステムが連携して動作するため、システム開発が難しいという欠点があります。
しかし、Rayはこのプロセスを柔軟かつシンプルにするAPIを提供することで、
ある値から別の値に対応させる「マッピング」をサポートし、多様な並列パターンを単純化することができました。
ワークロードの拡張性
ワークロードとは、リソースとコードの集合体を意味します。
AIやMLは膨大な数のワークロードを抱えており、その数に比例して管理の難易度も増していきます。
この膨大な数のワークロードは、電力や冷却の問題など、データセンターに負担をかけることもあります。
そのため、ワークロードのスケールを縮小する必要が生じることもあれば、逆に高いスペックが求められてスケールを拡大する必要が生じることもあります。
しかし、ワークロードのスケールを調整する過程で、キャッシュミスが頻繁に発生する可能性があり、
キャッシュミスが発生すると、サーバーがDBに対してデータ欠損のリクエストを送信しなければならないため、負荷が発生する可能性があります。
Rayはモデルトレーニングの規模を調整し、リソースの要求量に応じて自動でスケールアップやスケールダウンを行う機能があるとのことです。
効率的な統合性による業務処理の単純化
AIを完成させるためには、トレーニング以外にも様々な要素が必要となります。
基本的なエンジニアリングから変数の調整、データ処理といった作業が必要であり、これらはそれぞれ異なるAPIを使用しなければならないという煩わしさがありました。
特にデータ処理の過程において、一般的なデータ処理ツールは構造化データを対象としていますが、AIは画像や動画といった非構造化データに依存しているという点も、かなり厄介な部分でした。
続いて、ワークロードの幾何級数的な増加レベルは、より改善されたハードウェアを要求してもいます。
1つのアプリケーションを作成するのにA、B、Cが必要だとすれば、A、B、Cそれぞれに適したシステムを使用しなければならず、もし後でDが必要になった場合に追加でシステムDを使用しなければならないというのは、聞いただけで管理が困難であることがわかります。
Rayはライブラリの統合により、様々なフレームワークへの切り替えを不要にするプラットフォームを構築し、
統合されたツールキットを提供し、インスタンス化の際に多様なハードウェアを指定できるようにサポートすることで、開発者にとって完璧な環境を構築することに成功しました。
課題、そしてソリューション
Globe Newswireによると、過去数年間でMLに対する計算需要は18ヶ月ごとに10〜35倍ずつ増加しました。
確かに多くのAIプロジェクトは数々の問題を解決していますが、この計算需要の増加と複雑なエンジニアリングは頻繁に衝突しているようです。
AIプロジェクトを進める企業の約4分の1が50%に近いプロジェクト失敗率を示しており、AIおよびMLプロジェクトの78%がデプロイ前の段階で停滞し、
AIの学習プロセスの81%が予想以上に困難だったと調査されています。
実際、これまで大企業の多くのAIプロジェクトが問題を起こしたり、サービスを終了したりする様子が見られました。
AmazonのAI採用システムは、技術分野における性別への偏見を排除する基準を学習できず、2017年に廃止されました。
Amazonの人口統計情報解析プログラム「Amazon Rekognition」は、肌の色が濃い人々の性別を判別できない問題に加え、国会議員の顔を犯罪者の写真と一致させるという誤りも犯しました。
Googleの糖尿病網膜症診断AIは、不完全な写真に対して正確な診断を下すことに困難を抱えており、
IBMの自然言語応答システムであるWatsonは、一部のがん患者に対して危険な処方提案を行うこともありました。
Microsoftのチャットボット「Tay」は、人と気楽に冗談を言い合うことを目的に作られましたが、偏ったデータの学習により、すぐにTwitter上で攻撃的で扇動的な投稿をするようになりました。
各プロジェクトには年単位の開発期間とそれに比例する費用が費やされていますが、依然として失敗事例は多く、それ以上に多くのプロジェクトが停滞している状況です。
しかし、Rayの登場によりエンジニアリングははるかに直感的になり、他のアプリケーションに移行する過程でコードを変更する必要がほとんどなくなりました。
非構造化データの処理が容易になり、迅速かつ簡便です。
これでユーザーは、スケーラビリティについて悩むことなく、機械学習だけに集中できるようになります。
AIプロジェクトは依然として失敗する可能性があります。しかし、試行錯誤が繰り返されることで、失敗率は大幅に低下するでしょう。
Rayは、様々な企業が試行錯誤する過程でコストと時間を大幅に削減することを可能にします。削減された分だけ企業はより多くの挑戦ができ、市場は成長していくでしょう。
技術の発展速度は日々加速しています。
紙とインクから固定電話へ、固定電話から携帯電話へ、携帯電話からスマートフォンへと発展の間隔を比較してみると、技術の発展速度は右肩上がりの直線ではなく、右肩上がりの曲線であることが推測できます。
加速度をさらに一段階高める要素の一つは、やはり仕事の効率性を高めることです。例えば、信用の存在や今日の企業構造などがなければ、技術の発展は直線的だったかもしれません。
そしてRayは、仕事の効率性を高める要素です。発展の加速度を高める要素であるという意味です。
「RayはML、Python、AIワークロードを拡張するための業界標準になりつつあり、AIの潜在能力を完全に実現する上で最大の障害の一つを解決しています。」
Nick Washburn、Intel Capital シニア・マネージング・ディレクター
まるでAnyscaleのIR資料のような文章になってしまいましたが、筆者が伝えたい核心はただ一つです。
重要なものが登場したため、今後のAI & MLの発展速度は間違いなく期待できるということです。
市場がいつ頃どの程度の規模に成長するのか、正確にどの企業に投資すべきかという悩みは、現段階では意味がないかもしれませんが、
大まかなことを認知し関心を持ち続けることと、そうでないことの間には、投資において間違いなく大きな差が生まれるでしょう。特に技術の発展に関してはそうです。
3行要約:
1. AnyscaleのRayは、機械学習インフラの構築に使用されるフレームワークで、従来のエンジニアリングの複雑さを大幅に改善します。
2. これにより、試行錯誤に伴うコストを大幅に削減し、開発スピードを飛躍的に向上させることができます。
3. Rayの進化に伴い、AIおよびML市場の成長速度は倍増し、さらに加速することが期待されます。
ニュースレター
オリジナルコンテンツ、ニュースレター、特別イベントに関する最新情報をいち早くお届けします。