· 

文章・画像生成、AIの主戦場に 将来市場「14兆円」 マイクロソフト、米新興に数十億ドル

米マイクロソフトは23日、文章・画像の「生成AI」で最先端を走る米新興オープンAIに数十億ドルを追加投資すると発表した。AIが生む高度な文章や画像は仕事を効率化し、マーケティングやコンテンツ作成などの手法を一変させる可能性がある。

オープンAIは2022年11月に高度な対話AI「ChatGPT(チャットGPT)」を公開し、世界で話題を集めた。人間が質問などを投げかけると、自動で文章を生成し巧みに返答する性能を備える。一般の人も手軽に試用でき、サム・アルトマン最高経営責任者(CEO)は公開から1週間ほどで「ユーザーが100万人を超えた」と明らかにした。

「人工知能とは何か」をチャットGPTに尋ねると「人間のように思考や学習する能力を持つ技術」などと回答する。対話能力の高さについて「簡単なやりとりでは人間に近いレベルになりつつある」とAIスタートアップ、ストックマーク(東京・港)の近江崇宏執行役員は指摘する。世界中で性能の検証が進み、米ペンシルベニア大学ウォートン校では経営学修士号(MBA)の試験科目で合格するレベルの答えを書いたという。

もうひとつ、オープンAIが注目を集める理由が22年に公開した「DALL-E(ダリ)2」だ。文章による指示をもとに、内容に沿った画像やイラストを生み出す。例えば「1980年代に月でAIを研究するテディベア」という言葉を入力すると、非現実的な描写であってもその通りの画像を精巧に描く。

AIが生む高度な文章や画像は日々の報告書やメールの執筆、プレゼンテーション資料の作成などを劇的に効率化し、広告やマーケティング、娯楽分野のコンテンツ作成の手法を一変させる可能性を秘める。調査会社のグランドビューリサーチは生成AIの世界市場が年平均35%のペースで拡大し、30年に1093億ドル(約14兆円)に達すると予測する。

現在につながるAIブームは、深層学習と呼ぶ技術革新で画像認識の精度が飛躍的に向上したことを受け、12年ごろに始まった。人間に例えるとAIが優れた「目」を獲得し、車の自動運転などの開発を後押しした。「耳」にあたる音声認識も進化し、高度な文字起こしなどの機能が実現した。

ブーム開始から10年を経た現在、画像や音声の「認識」の革新に続いて台頭してきたのが言葉や画像を生成するチャットGPTのような次世代AIだ。コミュニケーションの根幹である言語や創造性の領域にAIが進出し、新たな発展の段階を迎えつつある。

オープンAIは生成AIの進化のけん引役だ。20年に発表した「GPT-3」は自然な文章を生成する能力を獲得。オープンAIの創設にも携わった米起業家、イーロン・マスク氏は将来のAIの言語能力について「最も賢い人間と見分けがつかなくなる可能性がある」と予測した。

こうした次世代AIの開発には多額の資金が不可欠だ。大量のデータを使い、スーパーコンピューターによる学習でAIの性能を高める必要がある。オープンAIは19年にもマイクロソフトから10億ドル(現在のレートで約1300億円)の投資を受け、開発環境を整備してきた。

新たな市場を巡り、テック業界の競争は激化している。米グーグルは優れた対話能力をもつ「LaMDA(ラムダ)」など、言語を扱う高度なAIを相次ぎ開発している。米メタは22年、言葉をもとに静止画ではなく動画を生成するAIを発表した。

国内勢ではLINEが韓国ネイバーと組んで日本語に対応する言語分野の高度なAIを開発してきた。ただ国家間の競争でみると、巨大テックが多額の資金を投じる米国に比べ日本は出遅れている。

生成AIの本格的な利用拡大には課題もある。米調査会社ユーラシア・グループは23年の世界の「10大リスク」の3番目に生成AIをあげた。偽情報やフェイク画像を大量に生み、混乱を招く恐れがあるためだ。倫理的な問題に対処し、適切な形で市場を育てる必要がある。

(AI量子エディター 生川暁、水口二季、シリコンバレー=佐藤浩実)