SpaceXの創設者であるElonMuskは、3月にフロリダ州ケープカナベラルのケネディ宇宙センターから国際宇宙ステーションへの無人宇宙船のテスト飛行で、クルードラゴン宇宙船を搭載したSpaceX Falcon9ロケットが打ち上げられた後の打ち上げ後のニュース会議を見ています。 2019年2月2日。
マイクブレイク| ロイター
アボカドの形をしたアームチェアとチュチュを着た大根の赤ちゃんは、サンフランシスコのイーロンマスクが支援する人工知能ラボであるOpenAIの新しいソフトウェアによって作成された風変わりな画像の1つです。
OpenAIは、短いテキストキャプションから画像を生成するために、Dall-Eと呼ばれるソフトウェアをトレーニングしました。 特に、インターネット上で見つかった120億枚の画像とそのキャプションのデータセットを使用しました。
ラボによると、スペインのシュルレアリスムアーティストであるサルバドールダリと同名のピクサー映画の小型アニメーションロボットであるウォーリーのかばん語であるDall-Eは、さまざまな概念の画像を作成する方法を学んだとのことです。
OpenAIはいくつかの結果を披露しました ブログ投稿 火曜日に公開されました。 「私たちはそれを発見しました [Dall-E] 動物やオブジェクトの擬人化されたバージョンの作成、妥当な方法での無関係な概念の組み合わせ、テキストのレンダリング、既存の画像への変換の適用など、さまざまな機能があります」と同社は書いています。
Dall-Eはニューラルネットワーク上に構築されています。ニューラルネットワークは、人間の脳から漠然とインスピレーションを得たコンピューティングシステムであり、パターンを見つけて大量のデータ間の関係を認識することができます。
ニューラルネットワークは以前に画像やビデオを生成しましたが、Dall-Eはテキスト入力に依存しているのに対し、他のネットワークは依存していないため、珍しいものです。
近年、合成ビデオや合成画像は、人間が本物とコンピューターで生成されたものを区別することが困難になるほど洗練されてきました。 たとえば、2つのニューラルネットワークを使用する一般的な敵対的ネットワーク(GAN)は、政治家の偽のビデオを作成するために使用されてきました。
OpenAIは、Dall-Eには「重大で広範な社会的影響の可能性」があることを認め、Dall-Eのようなモデルが「特定の作業プロセスや職業への経済的影響、バイアスの可能性などの社会的問題にどのように関連するかを分析する予定である」と付け加えました。モデルの出力、およびこのテクノロジーによって暗示される長期的な倫理的課題。」
GPT-3後継者
Dall-Eは、OpenAIが構築したと発表してからわずか数か月後に登場します GPT-3(Generative Pre-training)と呼ばれるテキストジェネレーター。これもニューラルネットワークによって支えられています。
言語生成ツールは、オンデマンドで人間のようなテキストを生成することができ、人々が独自の詩、ニュース記事、短編小説を書くことができることに気付いたとき、AIプログラムで比較的有名になりました。
「Dall-EはGPT-3に基づくText2Imageシステムですが、テキストと画像のトレーニングを受けています」と、ジョージア工科大学インタラクティブコンピューティングの准教授であるMarkRiedlはCNBCに語った。
「Text2imageは新しいものではありませんが、Dall-Eデモは、過去数年間に見た他のText2Imageシステムよりもはるかに一貫性のあるイラストを作成するために注目に値します。」
OpenAIは、DeepMindやFacebook AI Researchグループなどの企業と競合して、人間レベルおよびそれ以上のレベルで幅広いタスクを実行できる汎用アルゴリズムを構築してきました。
研究者たちは、チェスや囲碁の中国語ボードゲームなどの複雑なゲームをプレイしたり、ある人間の言語を別の言語に翻訳したり、マンモグラムで腫瘍を見つけたりできるAIを構築しました。 しかし、AIシステムに真の「創造性」を示すことは、業界の大きな課題です。
リードル氏は、Dall-Eの結果は、概念を首尾一貫してブレンドする方法を学んだことを示しており、「概念を首尾一貫してブレンドする能力は、人間の創造性の重要な形態と見なされている」と付け加えた。
「創造性の観点から、これは大きな前進です」とリードルは付け加えました。 「AIシステムが何かを「理解」することの意味についてはあまり合意がありませんが、新しい方法で概念を使用する能力は、創造性と知性の重要な部分です。」
アマゾンケンブリッジの機械学習の元ディレクターであるニールローレンスは、Dall-Eは「非常に印象的」に見えるとCNBCに語った。
現在ケンブリッジ大学で機械学習の教授を務めているローレンスは、「これらのモデルが私たちの世界に関する情報を保存し、人間が非常に自然に感じる方法で一般化する能力の刺激的なデモンストレーション」と説明しました。
彼は次のように述べています。「この種の技術にはあらゆる種類のアプリケーションがあると思います。想像すらできません。しかし、私たちが解決しなかった問題を解決する、もう1つの非常に驚異的な技術であるという点でも興味深いです。私たちが実際に持っていたことさえ知っています。」
「AIの状態を進めない」
ただし、誰もがDall-Eに感銘を受けているわけではありません。
2016年に機械学習の新興企業をUberに非公開の金額で売却した起業家、Gary Marcusは、CNBCに興味深いと語ったが、「AIの状態を前進させることはない」と語った。
彼はまた、それがオープンソース化されておらず、同社はまだ研究に関する学術論文を発表していないと指摘した。
マーカスは以前、ライバルラボのDeepMindが近年発表した研究の一部を「ブレークスルー」として分類すべきかどうかを疑問視していました。
OpenAIは、テスラのCEOであるElonMuskを含む創設者グループからの10億ドルの誓約を伴う非営利団体として設立されました。 2018年2月、ムスクはOpenAI理事会を去りましたが、組織への寄付と助言を続けています。
OpenAIは2019年に営利目的で設立され、その研究に資金を提供するためにMicrosoftからさらに10億ドルを調達しました。 GPT-3はOpenAIの最初の商用製品になる予定であり、Redditは最初の顧客の1つとしてサインアップしました。