本日の記事を始める前に、Zhiwei編集部はSoraさんに厳粛に申し上げたいと思います。「おい、早くベータ版を開けないと、大変なことになるぞ。だって今日、待望のRunwayがついに第3世代バージョンをリリースしたんだから。この新世代バージョンでは、生成される動画の長さが4秒から10秒に延長されているんだから」 コメントをざっとスクロールしてみると、歓声と歓喜の声が目立ち、中には「これは現在入手できる最高のビデオ AI だ!」と宣言する人もいた。 Runwayの公式ツイートで紹介されている例を見る限り、Gen3版のエフェクトは実に驚異的です。多彩なカメラアングル、高精細な肌テクスチャ、そして自然なキャラクターの動き。もはや仮想世界と現実世界の区別がつかないほどです。 これを見ると、未だに市場開放の兆しを見せていないSoraのことが心配でなりません。バーチャルビデオの世界では、誰もが最高の製品をリリースしようと躍起になっているからです。PikaからLuma、そして最近海外市場を席巻したKuaishouのKeling AIまで。 かつては、快手克玲AIの試験資格を得るために、外国人は中国語で「お願いします、お願いします」と入力するほどでした。今回の滑走路Gen3の全面開通により、克玲AIへの注目が再び高まりました。 Soraはまだテストに利用できないため、Zhiwei編集チームは、国内外で広く認知されているテキストビデオモデルであるKuaishou Keling AIとRunway Gen3を比較し、Runway Gen3の効果を誰もが確認できるようにします。 テストの前に、Kuaishouが開発中のKeLing AIは料理関連のビジュアルに優れていることを明確にしておきます。一方、Runway3はリアリティ、想像力、そして優れたカメラワークを重視しています。視聴者は、両方のプラットフォームの長所を念頭に置いて視聴できます。 まず、新人の得意技である「ランウェイ Gen3」から始め、映画のような雰囲気を醸し出すキーとなるセリフ「バーで孤独な人が飲み物を飲んでいる」を与えました。 (ヒント:静止した、焦点の合ったショット、厳しいネオンライト、バーに座る一人の人物、飲み物をすすりながら空を見つめる人、薄暗い混雑したバー、孤独、物憂げ)結果が出る前から、Runwayは生成時間で既にわずかな差で勝利していました。これは、Kelingが5秒のコンテンツを生成するのに数分かかるためです。 しかし、ランウェイはケリングの2倍の長さのビデオを1分足らずで制作した。短い再生時間にもかかわらず、そのスピードはむしろ緻密な作業につながっている。男性が横を向き、目を開けるクローズアップショットに続いてカメラワークが続くシーンは、「100万ドルの制作費」をかけた作品だと言わんばかりだ。口を開けたクローズアップのやや不自然な部分がなければ、ハリウッド映画のクリップだと勘違いする人も少なくないだろう。 滑走路 Gen3↓ しかし、異人を征服した存在として、AIが生み出したケリンの演出も決して劣るものではなく、カップを見つめる主人公の表情は「孤独」というテーマにぴったり合致している。 ケリングAI ↓ まだ勝者が決まっていないので、もう一回勝負しましょう。今回のキーフレーズは「消防士が火を消火するドラマチックな感覚」です。 (キューワード: シルエットショット、燃え盛る建物の激しい炎、火災と闘う消防士、放水、人々の救助、夜に燃える建物、ドラマチック、英雄的) このラウンドでは、Runway Gen3の優位性が特に際立っていました。キャラクターのシルエットを捉えたカメラワークとオレンジ色のグラデーションが、シーン全体に荘厳さと興奮を織り交ぜた雰囲気を醸し出していました。 滑走路 Gen3 ↓ Keling で生成されるコンテンツは依然として良好で、キャラクターの動きも非常にリアルですが、ビジュアル処理はやや場当たり的で、火事のそばを通りかかった心配そうな住民が何気なく撮影したビデオのようです。非常にリアルですが、ショットの美的魅力は Runway ほどではありません。 ケリングAI ↓ ケリンは第1ラウンドでやや劣勢に立たされたため、話題を変えてケリンの得意分野である「食べる放送」に移りましょう。ところが、この場面でちょっとしたトラブルが発生しました。Zhiwei編集部は、Runwayが強くなった一方で、検閲も厳しくなっていることに気づいたのです。 昔のアニメを見てみたいと思っていました。ウィル・スミスをスクリーンに呼び戻して、また麺をすすってみたりとか。でも残念ながら、[このコンテンツは禁止されています]と言われました。有名人だけでなく、ピクサーのアニメでさえ禁止されているんです。 仕方がないので、「男性が麺を食べている」という話題に変えましょう。 (プロンプトワード:温かくて居心地の良い照明、集中した表情の人、箸やフォークを使って上手に麺をすする様子、カジュアルな食事環境、楽しくて満足できる) AIが本拠地に到着すると、安定したパフォーマンスを発揮し、誰にも止められないほどでした。効果は最初のテスト時よりもさらにリアルで、麺から立ち上る湯気が顔に伝わってくるほどでした。 ケリングAI ↓ ランウェイに関しては、AIは確かに以前の問題、麺のテレポートや口の位置ずれといった問題を抱えていました。しかし、実際にはパフォーマンスは大幅に向上し、少なくとも箸の使い方は覚えていました。ただ、モクバン(食べる放送)の女王、ケリンに遭遇してしまったのは残念でした。ランウェイ Gen3 ↓ ムクバン(食べる放送)チャレンジに挑戦した後、知微編集部は他にも様々な体感チャレンジに挑戦しました。羊に自転車に乗らせるなど、現実には存在しないものを描いてもらうこともありました。 (プロンプトワード:遊び心のある主観ショット、羊が走る様子を追う、暖かく晴れた日、ビンテージ自転車に乗ったふわふわの白い羊、熱心にペダルを漕ぎながら田園地帯を縫うように走る、野生の花が咲き誇る曲がりくねった田舎道、気まぐれで楽しい) 効果は両側ともかなり良好で、両方の羊が一生懸命ペダルをこいでいました。 滑走路 Gen3 ↓ ケリングAI ↓ しかし、Zhiwei編集チームがテストを重ねるごとに、ある事実が明らかになりました。それは、最も強力なビデオAIでさえ、現実世界の物理エンジンの限界を克服できないということです。例えば、私は彼らにバスケットボールをやるように頼みました。 (ヒント:男性の動きを追うダイナミックなトラッキングショット、バスケットボールにスポットライトを当てた高コントラストの照明、被写体:スタイリッシュな黒のオーバーオールを着た若い男性、華麗かつ正確なドリブルでバスケットボールを操る、鮮やかなグラフィティアートが描かれた屋外バスケットボールコート、エネルギッシュな動き)ランウェイでは、空中でのドリブルシュートやフットワークが目立ちます。バスケットボールなのかサッカーなのか、見分けがつきません。 (意味理解ができなかった理由は、バスケットボールのプレーに関係している可能性があります。「ドリブル」という言葉はサッカーとバスケットボールの両方で使用できるため、AIはそれを区別して理解できなかった可能性があります。) 滑走路 Gen3 ↓ ケリンAIになると、事態はさらに奇妙になった。投げたバスケットボールがその場で真っ二つに割れ、さらに3本目の手が生えたのだ。 ケリングAI ↓ バスケットボールは、少なくとも基本的な動きは正確ですが、衝突や転がりとなると、どちらの側も非常に抽象的で一貫性のある動きになります。まるで誰も割ることができないこの卵のようです。(ヒント:卵がテーブルから落ちて地面に割れる、スローモーション、クローズアップショット、窓からの自然光、サスペンスフル、期待が高まる) 滑走路 Gen3 ↓ ケリングAI ↓ どちらにも欠点はあるものの、全体的にはRuwnay3は現在人気のKeling AIよりも優れています。多くの場合、宣伝文句通りのリアリティ、スピード、安定性を実現しています。長時間駆動と相まって、どんなに想像力を掻き立てても高品質な映像を提供してくれます。視聴者にとって、現実と仮想世界の境界線を真に曖昧にしてくれるでしょう。 (ヒント:深いジャングルを進んでいくと、SF の視点で、古代の光り輝く異次元ポータルに偶然出会う。空気は神秘的で、エキゾチックな野生動物の鳴き声で満ちている。ポータルに近づくと、不気味な光が脈打ち、異世界のエネルギーに引き寄せられる。) 滑走路 Gen3 ↓ しかし、Runwayを応援するのは早計です。競争はまだ終わっていないからです。AI分野には、効果の高さに加え、避けられない課題がもう一つあります。それは商業化です。編集部が以前報じたように、国内メーカーの試算によると、2分間の動画制作には少なくとも180元かかります。 膨大なリソース消費という底なし沼により、ほとんどの動画生成速度は5秒前後にとどまっています。多くの動画生成ツールは抽象的な結果しか生成せず、大規模言語モデルがもたらした広範な成功を再現できていません。Runway Gen3は10秒の壁を突破しましたが、消費者にとって価格の上昇という代償を伴います。 前世代と比べて、支払う金額はほぼ2倍になっています。月額制のサブスクリプションプランで計算すると、基本メンバーシップは月額15ドルで、購入者は625ポイントしか獲得できません。しかし、Runway3の動画を1秒再生するには10ポイント消費するため、10秒の動画の価値は2.40ドル、約17人民元となります。 この記事で示した例だけでも、どれだけの費用がかかるか計算できます。収益性はあらゆる大規模AIモデルが直面する問題であるため、この傾向を止めることは誰にもできません。 Runway3は非常に強力で、コンテストで優勝しましたが、それでも完全に無料のCorianの方がはるかに魅力的であることは認めざるを得ません。Soraに関しては、すでにその神秘性は失われつつあり、実際に使ってみるまではただの美しい夢で、0点です。 |