Haozao

詳細分析 | OpenAI COO の最新ブルームバーグ インタビュー: Sora はまだ商用化の初期段階にありますが、AI テクノロジーが業界にデフレを起こせれば、さらに多くのものが生み出されるでしょう。

これは、OpenAI の COO である Brad Lightcap 氏とサンフランシスコの Bloomberg Tech との最新の会話であり、Lightcap 氏は OpenAI の AI の商用アプリケーションについて議論しました。

Lightcapは、AIテクノロジーが企業に差別化された価値をもたらし、顧客体験とイノベーション能力を向上させる方法を強調しました。また、LightcapはMicrosoftとの緊密なパートナーシップ、特にSoraに関する最新の開発状況についても説明しました。以下は会話の全文です。

ホスト:

ブラッドさん、2018年の初めにOpenAIのCFOに就任した当時、OpenAIにはビジネスモデルどころか、製品さえありませんでした。当時「眠い研究機関」と呼んでいた会社を、どのようにして真のビジネスへと変貌させたのか、少しお話しいただけますか?

ブラッド・ライトキャップ:

私がOpenAIに入社したのは2018年ですが、今では遠い昔のことのように感じます。当時はまだ、現代AI、つまり今ではTransformerベースアーキテクチャと呼ばれ、私たちが日常的に使っているLLMの基盤となるAIの時代に入っていませんでした。それは全く私たちの専門分野外でした。私たちは強化学習と呼ばれる、全く異なる種類のAIに注力していました。強化学習とは、エージェントを訓練して、与えられたタスクにおいて人間の能力を本質的に超えるようにする学習です。

そこで、私たちはそれをビデオゲームで人間に勝つことに応用しようとしています。実は、Dotaをご存知の方ならご存知かもしれませんが、エージェントを世界最強のDotaプレイヤーと対戦させるプロジェクトがあります。同じ原理をロボット工学の研究にも応用し、ロボットハンドにルービックキューブの操作方法を教えられるかどうかを調べています。こうして私は2018年の今、どんなビジネスを目指したいのかを模索しているのです。

おそらくゲーム会社とロボット会社の中間くらいになるでしょう。でも、リード・ホフマンは、この構想の初期段階で非常に協力的でした。AIのデジタルヒューマンのリードではなく、本物のリードのことです。

最終的にその方向を検討しましたが、まだ時期尚早だと感じました。その後、Transformerが登場し、LLMが機能し始めたとき、私たちは最初からそれが重要なものになると感じていました。

ホスト:

OpenAIの使命はAGIの構築ですよね?いつか人間の知能を超えるかもしれませんね。潜在的な顧客を含め、このことにまだ不安を感じている多くの人々に何かアドバイスはありますか?

ブラッド・ライトキャップ:

はい、AGIは明らかに野心的な目標です。AGIの完璧な定義を持っている人はいないと思います。「実際に見てみないとわからないかもしれない」と冗談を言うこともありますが、私たちは基本的にほとんどのタスクを実行できるシステムと定義しようとしています。つまり、任意の複雑または困難なタスクをAGIに与えれば、AGIはそれを解決しようと試みます。必要なツール、必要なデータ、そして追加の質問をどのように行うべきかを推論できます。まるで人間が持つ一般的な推論能力のようです。AIシステムもいずれこの能力を持つようになると私たちは信じています。恐ろしいと思いませんか?ある程度の主体性と自律性を持ち、意思決定を行い、ツールを使用し、インターネットにアクセスし、コードを記述できるシステムが世界に存在するというのは、信じられないほど大胆なことです。

そのため、OpenAIを設立した際、私たちはまさにそのような企業として形を整えました。私たちは、セキュリティと幅広い利益を事業運営の中核に据えた、非常にミッションドリブンな企業でありたいと考えていました。その理念を真に反映した組織体制を構築することで、安全だと考えていたものを安全だと考えていたものを優先させる必要がなくなりました。そのため、人々がこの技術をどのように利用しているかを理解し、早期に展開できるよう最善を尽くしています。GPT-4のようなシステムがどのように利用されているかを理解することは、次に何が起こるか、そしてセキュリティシステムと技術をどのように改善できるかを考える上で役立ちます。この反復的なアプローチを採用し、人々がこの技術に何を求めているか、それが新しいことであろうと、セキュリティが不可欠な分野であろうと、グローバルな対話を行うことができれば、目標を達成し、結果に非常に満足できると思います。

ホスト:

サムは、現在のAIモデルは未来と比べて途方もなく愚かだと言っていました。あなたは、今日のAIは1年後には笑いものになり、AIはより複雑なタスクに使われるようになるとおっしゃっていますね。では、AIはどのようにしてより賢く、より複雑になり、より優れたものになるのでしょうか?

ブラッド・ライトキャップ:

はい、私たちはシステムはより良くなると信じています。そして、今日のシステムが最も愚かだという、よく知られた愚かな主張は、次のシステムが間違いなくより良くなると信じているということです。私たちはそれが何を意味するのかを理解するべきだと思います。しかし実際には、それは現在のシステムに対する批評でもあります。よく考えてみれば、それらはそれほど有能ではない、ということですよね?これらのシステムは、質問することを可能にします。神託のようなインターフェースを持っています。答えを返すことはできますが、それが彼らの能力の限界です。もし彼らに興味を持ってもらうように頼めば、彼らはある程度の知性、感情的知性を模倣することができます。しかし、私は人々がそれらを、多くの点で世界最高の手品だと表現するのを聞いたことがあります。

現実はそうではありません。GPT-4が企業で驚くほど活用されていることに、私たちは本当に驚いています。これについては、後ほど詳しくお話ししましょう。しかし、次のシステムは、使いやすさと機能性の両面で大きなギャップを埋める必要があると考えています。つまり、実際に活用して役立ち、実際に何かをするのに役立つ、つまり真にユーザーを支援できるものでなければなりません。このAPIの目標を達成するためには、まさにその方向で取り組む必要があります。

ホスト:

将来的には、単なるチャットボットではなく、エージェントとしての役割が拡大するのでしょうか、あるいは御社の技術を他の形で活用していくことになるのでしょうか?

ブラッド・ライトキャップ:

こういったものが存在するまでは、それを説明するための語彙が不足していることが多いように思います。語彙は現在の技術に基づいて進化する傾向があります。例えば、2026年か2027年に、ヒントを微調整してより良いものにしようとする、いわゆる「ヒントエンジニア」が存在するかどうかは興味深い問題です。あなたは友達のためにヒントを微調整することはないかもしれません。子供のためにヒントを微調整することはあるかもしれませんが、あなたと私は、お互いを理解するためにヒントの草稿を交換する必要はありません。つまり、これはこの時代に特有のもののように思えます。私たちは次のシステムに注目するでしょう。そして、そのシステムが何ができるかを説明する方法は、そのシステムの機能と限界に基づいて具体的になるでしょう。

ホスト:

ChatGPTはローンチ直後から史上最速で成長したコンシューマー向けアプリの一つとなりました。社内でこの記録を塗り替えるのは至難の業ですよね?一部の人にとっては目新しさが薄れつつあると感じますか?これほど急速に広まったスタートの後、どのように成長を続けてきたのでしょうか?

ブラッド・ライトキャップ:

はい、私たちは研究第一主義で取り組んでいます。もしGPT-4という何かを開発していて、それが何かを改善する最良の選択肢だとしたら、私たちはただ座って「よし、GPT-4製品の規模を最大化する方法を考えよう」と言うでしょう。私たちは、人々がこの技術をどのように使っているかを知ることに重点を置いています。

ChatGPTの初期段階で私たちが試みた一つの課題は、典型的なビジネスオペレーションスタイルで、すべてのユースケースを定義し、次のバージョンの製品を改善するために構築できる一般的なユースケースが見つかったかどうかを把握することでした。なぜなら、この側面を改善できるからです。しかし、私たちが話を聞いた多くの人は、「ユースケースはありません。子供の誕生日パーティーの計画に役立てていると思ったら、次の瞬間にはコードを書くのに役立て、次の瞬間には高齢の両親のヘルスケアのナビゲートに役立てているのです。」と言いました。ユースケースの多様性こそが、モデルをよりスマートで優れたものにする以外に、どのように改善すればよいかを知ることを困難にしているのです。

ホスト:

わかりました。御社はエンタープライズビジネスに力を入れており、非常にエキサイティングな用途がいくつかあると承知しています。最近、Modern Pharmaceuticals社と契約を締結されたほか、他にも複数の企業との協業を進めていると伺っています。詳細についてお話ししましょう。ところで、ChatGPTの飛躍的な進歩を受けて、AIの可能性に対する期待と期待が高まっているように思います。ChatGPTのローンチから1年半が経ちましたが、AIは大きな可能性を示してきましたが、経済や人々の日常業務を完全に変えるほどには至っていません。AIが一部の人々が誇張しているような大きな影響を与えるかどうか疑問に思っている人たちに、何かアドバイスはありますか?

ブラッド・ライトキャップ:

経済を再構築する時間は1年あります。これは大変な課題です。先ほども申し上げたように、企業におけるこれらのツールの導入と有用性には、私たちは本当に驚かされています。このコメントを踏まえ、たとえ私たちが自宅に戻って活動を停止することに決めたとしても、技術系の学生として、GPT-4や類似の技術が経済に浸透していく期間は10~20年あると確信しています。いずれ、より優れたシステムが確立され、すべての人をその新しいシステムに移行させ、どのように統合していくかを考え始める必要があるでしょう。ですから、私たちはこの状況に非常に勇気づけられています。

私たちが研究しているのは、これらのシステムがどのように企業を差別化できるか、つまり顧客理解を深め、ユーザーとよりパーソナライズされた関係を築き、新しい製品体験を生み出し、これまでできなかったことを可能にするかということです。これらは、この技術を活用している人々の例です。つまり、私たちの仕事は、今日何が可能で、何が不可能で、明日何が可能になるか、そして何が不可能になるか、誰もわからない状況にいるということです。チームメンバーにはこう言っています。

ホスト:

OpenAIでは、他社とのパートナーシップを監督されていますね。メディア業界と密接に連携されているとのことで、これは非常に興味深い仕事ですね。最近では、Financial Times、Dotdash、Meredith(IAC傘下)といった企業と契約を締結されました。また、ChatGPTを自社製品に統合し、コンテンツのライセンス供与について、数十社の出版物と協議を進めています。どれくらいの契約が見込めるでしょうか?冗談半分で恐縮ですが、最終的にChatGPTエコシステムに参加する出版社はどれくらいあるとお考えですか?

ブラッド・ライトキャップ:

はい、この技術はこの分野で素晴らしい応用が期待できると考えています。つまり、出版とは、読者に情報を届け、読者が関心のあるトピックに、読者が知りたい、あるいは知るべきことを満足できる形で関わることができるようにすること、つまり、読者が関心を持つトピックに関心を持つ機会を提供することです。このように、ほぼ平易な言葉で表現すると、これらのAIシステムはまさに読者の体験を向上させるために特別に設計されていることがわかります。

どうすればトピックをより深く理解できるでしょうか?ジャーナリストの報道能力をどう高められるでしょうか?人々のデータへのアクセスとインタラクションをどう増やせるでしょうか?私たちはデータ主導の世界に生きています。これは出版業界におけるチャンスであり、私たちをワクワクさせてくれます。道のりはまだ長く、目標達成のためには、こうしたツールを構築し、業界と連携していく必要があると考えています。しかし、この取り組みへのコミットメントこそが、私たちの共同作業の基盤であり、ChatGPT体験に情報の信頼性をもたらすことの真の基盤なのです。

これらのモデルが何に使えるのか、そして何に使うべきなのかについて、ある種の誤解があります。これらは実際にはデータベースではありません。つまり、情報を保存するためのデータベースとして使用すると、100%の精度が得られず、非常に高価になります。私たちは既に、はるかに優れたデータベース技術を開発しています。これらのモデルは、事実を思い出すためのものではなく、新しい情報について推論するためのものです。

そのため、より多くの情報をパブリッシャーに提供することができます。これは、私たちがパブリッシャーとの提携を検討する際に考えていることです。つまり、人々にとってより有用と思われる情報を、より多くの人々に届けることです。最終的には、これが世界にとって有益であると信じています。

ホスト:

最近ハリウッドに行って、プロデューサー、ディレクター、クリエイターの方々とSORAについて話し合ったそうですね?テキスト動画ジェネレーターを使った会話はいかがでしたか?「AIがハリウッドへ」といった見出しで報道されたのを覚えていますが、その時の感想を教えてください。

ブラッド・ライトキャップ:

はい、非常に好評です。数ヶ月前にテキスト動画変換モデルとしてSoraをリリースしましたが、まだ正式リリースではありません。

興味深いことに、これは実際に私たちが反復的な展開についてどう考えているかを示す例です。つまり、何かを世に出し、人々にそれが何であるかを理解し始めさせ、それがどのように使用されるかについて話し合いを始めさせ、そして私たちにフィードバックを得てアプローチを改善し、本当に影響を与える人々とコミュニケーションをとる機会を与えるということです。

ここでいただいたフィードバックは非常に役に立ちました。これまで知らなかった多くのこと、特に動画コンテンツが一般の人々や業界のクリエイティブな人々のためにどのように制作されているかを学ぶことができ、それらをどのようにモデルに組み込むかを考えることができました。

実際、調査結果によると、多くのクリエイティブな人々、特に映画制作のハイエンド部門の人々は、カメラアングルが予想より5%高い、あるいは低いといった点を非常に懸念し、再撮影や微調整を望んでいることがわかりました。これは興味深い研究課題です。ですから、このような対話をすることは非常に重要だと思います。

私たちの望みは、長編映画であれ、まだ実現には至っていませんが、映画の一部であっても制作コストを削減できれば、より多くの作品が制作されるようになるということです。

そのため、多くの作品が高すぎるという理由で制作を見送られてきました。ですから、映画業界にデフレ効果をもたらすことができれば、今ではほとんど見られないような大作や西部劇など、より多くの作品が制作されるようになるでしょう。私たちは、これがテクノロジーの約束だと信じています。

ホスト:

では、これがハリウッドや他の人たちに販売できる実際の製品になるまでには、数か月か数年かかると思いますか?

ブラッド・ライトキャップ:

現状はこれで十分です。さらに改善できると信じています。ですから、引き続き研究課題として取り組みますが、共同作業を通して、その過程で皆様から創造的な意見をいただければ幸いです。

ホスト:

SORAについてですが、ご存知の通り、モデルの学習に使用された学習データについて多くの議論がありました。SORAがYouTubeデータで学習されたのかどうか、改めて明確にしていただけますか?

ブラッド・ライトキャップ:

ええ、データに関する議論は非常に重要です。データがどこから来るのかは明らかに把握しておく必要があります。実際、今週このトピックに関する記事を公開しました。これは基本的に、AIがコンテンツIDシステムのように、クリエイターが自分のコンテンツがどこに送られるのか、誰がトレーニングしているのかを把握し、トレーニングの参加・不参加、そしてコンテンツの使用の参加・不参加を選択できるようにする必要性について述べています。

さらに、一方で、コンテンツをモデルに組み込んだり、モデルにアクセスさせたりすることを積極的に許可することも可能です。これは、この側面に新たな経済的機会が存在する可能性があるためです。まさに私たちが探求しているのは、ネットワーク、クリエイター、出版社と全く異なる社会契約をどのように構築するか、そしてこれらのモデルがグローバル展開し、有用なタスクを実行する際にオンラインコンテンツを参照・統合できる程度に価値を生み出すかということです。人々がそこから利益を得られる方法があるはずです。

これについては検討中です。非常に難しい問題です。まだ全ての答えは出ていませんし、もしかしたら2026年まで出ないかもしれません。皆さんのご意見をぜひお聞かせください。しかし、これは大きな問題です。ですから、今のところYouTubeに関しては答えはありません。

ホスト:

最後にお話ししたいパートナーシップは、おそらく最も重要なものでしょう。それは、投資パートナーであるマイクロソフトとのパートナーシップですね。競合と見なされることもある一方で、貴社と同様のエンタープライズ製品を販売している企業とのパートナーシップをどのように維持しているのでしょうか?

ブラッド・ライトキャップ:

はい、彼らは素晴らしいパートナーです。マイクロソフトとのシステム構築における協業の規模に対して、これほど寛容な姿勢を示してくれる企業は世界でもそう多くないと思います。私たちは迅速に行動し、高い要求を突きつけました。彼らはこれを、マイクロソフトのシステム構築能力の向上とAIへの理解を深める機会と捉えてくれました。この市場は巨大だと考えています。

したがって、私たちは小さな会社だと考えています。私たちは技術を開発し、その技術をどのように、どこで開発し、展開したいかというビジョンを持っています。彼らもまた、独自の製品群と独自の顧客を持つ企業です。結局のところ、先ほどおっしゃったように、私たちが真の経済効果を発揮するためには、OpenAIが独立した企業として、ただボタンを押すだけでそれを実現できるとは思っていません。

パートナーシップは私たちにとって非常に重要です。そのため、マーケティングの観点から、これは私にとって重要な焦点です。他のすべてのパートナーと同様に、彼らはこの点において絶対的に重要な要素だと考えています。ですから、非常に前向きな成果が得られており、今後も取り組むべきことはたくさんあると考えています。