Haozao

コロシアムのデジタルヒューマン: テクノロジーは交通の力を制御できるか?

なぜ中国のニューメディアプラットフォームでは、デジタルヒューマンがこれほどまでに厳しく抑圧されているのでしょうか?テクノロジーは本当にトラフィックを制御できるのでしょうか?この記事では、ショートビデオプラットフォームにおけるデジタルヒューマンのパフォーマンスを理解するためのガイドを提供します。企業や個人にもおすすめの記事です。

快手は19日に発表した声明で、AIGCを活用したデジタルヒューマンライブ配信などのコンテンツ制作に対し、追加のトラフィックサポートを提供しないことを明らかにした。同時に、快手公式デジタルヒューマン機能(Nuwa製品)を利用したECライブ配信は、追加のECトラフィックサポートを受けられなくなり、外部AIGCデジタルヒューマンを用いて生成された録画ライブ配信は、「録画コンテンツの再生」ルールに従って管理される。

動画アカウントと快手は、わずか1週間でデジタルヒューマンへの厳しい取り締まりを開始した。一見すると偶然の一致のように思えるかもしれないが、快手が「自国民を攻撃する」という行動に出たのは、プラットフォームとデジタルヒューマンの対立が表面化しているからである。

I. デジタル人間を追い詰める:左は「静安」、右は「騰快」

ビデオアカウントと快手はどちらもデジタルヒューマンを支持する姿勢を示しているが、現在の中国のインターネット環境では、プラットフォームによってデジタルヒューマンに対する態度は大きく異なっている。

より正確に言えば、WeChatチャンネルや快手(Kuaishou)といったコンテンツプラットフォームは規制を課しており、その規制はますます厳格化しています。一方、アリババやJD.comに代表される従来のeコマースプラットフォームは、これまでプラットフォームエコシステム内でのデジタルヒューマンライブストリーミングの活用を積極的に推進・支援してきただけでなく、AIを活用したプラットフォームの重要な焦点にさえ据えています。

2ヶ月前、劉強東氏のデジタルアバター「董兄」が、JD.comの調達・販売ライブ配信プラットフォームで「パーソナル」ライブ配信デビューを果たしました。その後のメディア報道によると、ライブ配信中、劉強東氏のデジタルアバターは流暢に商品を説明するだけでなく、懸賞抽選会や紅包の配布も行いました。さらに、指をこすったり、話しながら時折頷いたりといった劉氏のいつもの仕草さえも、「董兄」は完璧に再現していました。

「調達・販売 董歌」デジタルヒューマン

当時、業界アナリストは、従来のeコマースが成長のボトルネックに直面しつつあり、JD.comは現在の主流であるライブストリーミングeコマース分野で遅れをとっていると指摘していました。AIを活用した新たな生産性向上の形であるデジタルヒューマンライブストリーミングは、JD.comがライブストリーミング競争に再参入するための入り口となりました。

JD.com もデジタルヒューマンライブストリーミングの価値を証明しようと努めてきました。

快手がデジタルヒューマンライブ配信のトラフィック制限を発表する前日、JD CloudのYanxi Innovation Businessの責任者は「618 Media Open Day」で自社製品を宣伝し、デジタルヒューマンライブ配信のコストは生身の人間に比べてわずか10分の1で、その効果は「生身の人間に近い」と強調した。

遅れて参入したJD.comと比較すると、Taobaoはデジタルヒューマンライブストリーミング技術をはるかに速く開発してきた。

昨年7月、タオバオはAIを活用したライブストリーミングを初めて実験的に導入し、独自のスタイルを持つ6人のAIバーチャルホストを作成し、実際のホストと共同でライブストリーミングを配信しました。9月に開催されたアリババママサミットでは、アリババママは「AI常時ライブストリーミング機能」を発表しました。これにより、出店者は常時ライブストリーミングライブラリに収録されている数百人のAIバーチャルホストを活用し、特定のニーズに合わせて外観をカスタマイズし、多言語によるインタラクティブなライブストリーミングを実現できるようになりました。

メディアの報道によると、当時すでに500以上の販売業者がアリババのAI機能を通じてタオバオで24時間365日の「AIライブストリーミング」を実現し、ライブストリーミングのコストを実質的に90%削減していた。この数字は、JD.comの「デジタルヒューマンライブストリーミングのコストは、実際の人間によるライブストリーミングのコストのわずか10分の1である」という主張と非常に一致している。

従来のECプラットフォームが推進してきたデジタルヒューマンは、今や動画アカウントと快手によって「ブロック」されている。こうした両者の姿勢の明確な違いは、結局のところ、両者が占める立場の違いに起因している。

従来のeコマースプラットフォームの観点から見ると、ライブストリーミングトラフィックは金鉱であり、デジタルアバターはマーチャントがこの金鉱を採掘するためのツールです。eコマースプラットフォーム自体は採掘プロセスには関与せず、マーチャントにツールを販売して利益を得るだけで済みます。したがって、プラットフォームの中核的な価値は、より効率的なツールを継続的に提供することにあります。あるツールがうまく機能しない場合でも、新しいツールを開発すればよく、eコマースエコシステムへの影響は最小限に抑えられます。

しかし、動画アカウントと快手は本質的にコンテンツプラットフォームであり、ユーザーは池の中の魚のようなものです。デジタルヒューマンは、他のコンテンツと同様に、毎日餌として与えられる餌です。コンテンツプラットフォームは、より大規模で「実質的な」ユーザーベースを構築するために、十分な餌を継続的に供給する必要があります。また、異なるユーザーに好みの餌を与え、ユーザーグループをセグメント化し、異なる商品を販売する事業者に「池」を開放することで利益を上げる必要があります。

したがって、コンテンツプラットフォームはコンテンツに責任を持たなければなりません。デジタルヒューマンがテクノロジーを用いて作成したコンテンツは、ユーザーの嗜好を阻害するだけでなく、コンテンツ環境を汚染し、その健全性に継続的な影響を与えます。

II. デジタルヒューマンのライブストリーミングで何が問題になったのか?

なぜデジタルヒューマンのライブ配信はコンテンツプラットフォームに認識されないのでしょうか?この質問への答えは、プラットフォームが公開している資料に記載されています。

動画アカウントが意見公募のために公開した「動画アカウントショーケースに低品質コンテンツを公開するインフルエンサーに対する実施規則」では、「放置録画」コンテンツが「非リアルライブストリーミング」コンテンツに変更され、規則の適用範囲が拡大された。

かつて、一部のライブストリーマーは、アカウント構築、配信時間の増加、あるいは新規ストリーマー向けのプラットフォーム特典の活用を目的として、自動録画を利用していました。しかし、この種のコンテンツはライブストリーミングが持つべきインタラクティブ性を満たしていないため、「自動録画」はライブストリーミング詐欺の一種とみなされます。

協議文書では、「非リアリスティックなライブストリーミング」とは、ライブ放送中に非リアルタイムのコンテンツや小道具を用いて実際のライブストリーミングを代替する行為と定義されています。例えば、プラグイン、AI、その他のツールを使用してライブストリーミング用の仮想アバターを生成する行為などが挙げられます。この定義には、AI技術を用いた「ライブストリーミング詐欺」も具体的に含まれています。

詐欺行為が絡んでいる以上、プラットフォームが関連活動を統制するのは当然のことです。しかし、プラットフォームは自らの利益を守るだけでなく、ユーザーが潜在的なリスクを回避できるよう支援しています。

昨年5月、ディープフェイクによるAIによる顔の入れ替えと音声シミュレーションがインターネット上で激しい議論を巻き起こしました。犯罪者はAIによる顔の入れ替えを利用し、ビデオ通話でわずか10分で430万元を詐取しました。ビリビリの音楽セクションでは、あるコンテンツクリエイターがAIを使ってステファニー・サンの声を模倣し、複数のカバーバージョンを公開しました。これに対し、ステファニー・サン本人も「私のAI」と題した記事でAI技術に関する自身の見解を表明しました。

※Bilibiliの「AIステファニー・サン」

ライブストリーミングEコマース分野でもAIの急速な普及が見られます。ライブストリーミング配信者はAIを駆使して女性有名人の顔と顔を入れ替え、3歩ごとにディルラバ・ディルムラット、5歩ごとにトン・リヤーの画像を作り出し、注意深く観察しなければ見分けがつかないようにしています。こうしたAI生成の有名人ライブストリーミングルームは、小売業者に多大なトラフィックをもたらしています。

著名人による権利保護への積極的な取り組みとプラットフォームのタイムリーな介入がなければ、1セット99元のAI顔交換ソフトウェアはとっくの昔にライブ配信ルームの標準装備となり、デジタルヒューマンが今のような新たなトレンドになることもなかっただろう。プラットフォームが望まないもう一つの事態は、すべてのライブ配信ルームが「AI著名人」によって支配されてしまうことであり、それはライブ配信ルームで構成されるコンテンツエコシステムの多様性を失ってしまうことを意味する。

想像してみてください。ユーザーが仕事を終えて家に帰り、ライブストリーミングアプリを開くと、ある画面では「Dilraba」が口紅の色をデモンストレーションし、次の画面では別の「Dilraba」が日焼け止めウェアを宣伝しています。さらに2画面下にスクロールすると、GulnazarとTong Liyaがそれぞれ美容機器とヘアドライヤーを紹介している画面が表示されます。

視聴者はセレブのライブ配信を見すぎることでいずれ美的疲労を感じるだろうという事実はさておき、ライブ配信ECにおける実体験に基づく信頼は、画面いっぱいの「セレブ司会者」によって簡単に崩れ去ってしまう。視聴者はコンテンツや商品自体に疑問を抱くことさえある。トラフィックは増えたように見えるかもしれないが、実際には生計手段を失っているのだ。

同じ原則がデジタル人間にも当てはまります。

JD.comが公開した「調達営業の董歌」アバターは、AIデジタルヒューマンが実在の人間に非常によく似せて作られていることを示しており、劉強東の指をこすったり頷いたりする癖まで学習している。しかし、模倣はあくまでも模倣に過ぎない。劉強東が話している間に指をこすったり頷いたりするのは無意識の行動であり、これらの動作の生成とタイミングは本質的に非論理的であり、アルゴリズムと論理的判断に頼ってコスプレを行うデジタルヒューマンの理解を超えている。

AIの目には、話しながら指をこすったり頷いたりするデジタルヒューマンは、劉強東に「似ている」と映ります。そのため、カメラの前にいる「調達営業の董兄貴」は、生放送中に頻繁に指をこすったり頷いたりします。本来は気づかれない小さな仕草を人物の特徴の一部にしてしまうのは、AI擬人化の失敗例です。

意図的な模倣によって作られた微妙な痕跡はデジタルヒューマンのせいではないが、デジタルヒューマンのためのプラットフォームを作成し、これらの「欠陥」を商人へのセールスポイントとして増幅するという行為自体が疑問である。

III. デジタルヒューマンはどこで必要とされるのか?

電子商取引プラットフォームの視点から見ると、デジタルヒューマンは、商人がライブストリーミング電子商取引の競争に参加するための新たなツールであり、一般の商人がライブストリーミング販売分野に参入するためのハードルを下げるものでもある。

例えば、ライブ配信にデジタルヒューマンを活用することで、物理的なスタジオを建設する必要がなくなり、セットデザインや機材コストを削減できます。また、デジタルヒューマンによるライブ配信はフォーマットが標準化されているため、司会者、プランナー、ディレクター、カメラマンといった本格的なライブ配信チームも不要となり、人件費を大幅に削減できます。さらに、デジタルヒューマンの司会者は安定しており、休憩を必要とせず、24時間365日配信できるため、司会者がプラットフォームを変更する心配もありません。

解放日報の以前の報道によると、市場で主流のデジタルヒューマンライブ配信製品は年間2万元かかるため、ライブ配信の平均月額費用は2,000元未満で、24時間365日配信が可能です。一方、杭州では、本物のライブ配信者の月給は1万元からで、ライブ配信ルームには2人のライブ配信者が交代で必要で、人件費だけで月2万元に達します。一方、1日のライブ配信時間はわずか16時間です。

デジタルヒューマンライブストリーミングとリアルヒューマンライブストリーミングのコスト効率は大きく異なりますが、本当にそうなのでしょうか?

実際、昨年上半期にデジタルヒューマンライブ配信が話題になり始めた後、相当数の事業者がデジタルヒューマンライブ配信を試しました。当時、プラットフォーム上にデジタルヒューマンライブ配信ルームを制限するルールはなかったものの、多くの事業者が重複したデジタルヒューマン画像をプラットフォームに検出され、アカウント停止処分を受けました。

2万元で1年間使えるデジタルバーチャルキャラクターを購入できると思っていた業者は、わずか5分の配信開始後に2時間もアカウントを凍結され、正常な配信ができなくなりました。中には永久凍結されたアカウントもあり、これらのデジタルキャラクターに費やしたお金は完全に無駄になってしまいました。

さらに、効率性という点では、デジタルヒューマンが24時間365日配信できるという点は非常に魅力的ですが、ライブストリーミングプラットフォームのトラフィックは一日を通して均等に分散されているわけではありません。午後8時から午前1時までのゴールデンタイムはプラットフォームのトップストリーマーの独占時間であるため、デジタルヒューマンは多くのトラフィックを獲得できません。また、他の時間帯では、デジタルヒューマンは他のリアルストリーマーと競争し、例えばカリナンの破片を集めたり、隅に埋もれたトラフィックをかき集めたりといったことも必要です。

製品カテゴリーに関しても、デジタルヒューマンは大きな制約に直面しています。現在、eコマースプラットフォーム上のデジタルヒューマンライブストリーミングルームは、低価格で標準化された製品のプロモーションに適しています。これは、低価格で標準化された製品の場合、消費者は購入の意思決定にあまり時間をかけないため、デジタルヒューマンによる直接的で台本に基づいたガイダンスの方が、ユーザーに注文を促す可能性が高くなるためです。

しかし、高額で標準化されていない製品に直面した場合、消費者は意思決定に時間がかかり、購入を促進するためにタイムリーなインタラクティブなフィードバックを必要とします。デジタルヒューマンは現時点では、生身の人間と同じような自然なインタラクションを実現できず、また、タイムリーなインタラクティブなフィードバックを提供することもできません。さらに、家具や家庭用品といった製品体験に関わる分野では、デジタルヒューマンは生身の人間のように、動作を通して製品の特徴を直感的に説明することはできません。

したがって、ライブストリーミングEコマースの核心的な価値は、オンラインコミュニケーションの高い効率性、リアルなホストとの双方向性、そして主観的な交流を通して育まれる感情的な繋がりにあることは容易に理解できます。対照的に、デジタルヒューマンは効率性に優れているだけで、他の面では特に特別な点はありません。デジタルヒューマンを商品の販売に利用すること自体が、技術の無駄遣いと言えるでしょう。

ライブストリーミングeコマースのシナリオから一歩踏み出すと、デジタルヒューマンのメリットはさらに明確になります。彼らは24時間365日オンラインで、オンデマンドで対応可能であり、人間と同じように自己表現でき、コミュニケーションを標準化できます。これらのメリットを最も効果的に活用できるシナリオは、「123、リンクアップ」ではなく、パーソナライズされたサービスと感情的な価値を提供できるプライベートドメインのシナリオです。

例えば、今年の清明節に熱い議論を巻き起こした「AIで故人を蘇らせる」というトレンドは、故人の写真と音声のみを使って動画を作成し、ユーザーに特別な安らぎを与えることができるかもしれない。さらに、チャットボットと連携して進化したデジタルヒューマンは、まるで人間のような会話を実現し、『流転の地球2』で描かれたようなデジタルライフを現実のものにする可能性もある。

この基盤の上に、私たちが想像力をさらに解き放ち、さまざまな業界にわたる「デジタルヒューマンの専門家」を生み出せば、デジタル世界におけるこれらの専門家の専門知識を永久に保存し、人類がさまざまな科学研究の課題を克服するのを支援するだけでなく、AIのインテリジェントな学習とインタラクティブな機能を活用して、普遍的で包括的な教育を促進することもできます。

具体的な例を挙げると、DouyinのAIツール「Doubao(豆藏)」は、チャットボット、ライティングアシスタント、英語学習アシスタントといったAI機能を既に実装しています。英語学習アシスタントは、ユーザーとリアルタイムで会話できるだけでなく、表現における文法上の誤りを迅速に指摘してくれます。これまで、同様の英会話練習には、オフラインまたはオンラインで講師を予約し、料金を支払う必要がありました。

したがって、「豆豹」をデジタルヒューマンと組み合わせれば、誰もが24時間365日いつでも音声言語の先生に指導を受けることができるようになります。既存の応用シナリオの中で達成されたこのようなブレークスルーは、デジタルヒューマンにとって最高の未来となるでしょう。

率直に言えば、Eコマースプラットフォームがデジタルヒューマンライブストリーミングを積極的に推進する主な目的は、より多くの事業者をライブストリーミングEコマースに誘致し、プラットフォーム間の競争における新たな交渉材料を提供することです。しかし、従来のEコマース企業はある現実を見落としています。ライブストリーミング販売の基盤は、最高のコンバージョン率を達成することではなく、質の高いコンテンツを提供することにあるのです。

トップストリーマーが他のストリーマーよりも高いGMV(総取引額)を生み出せるのは、配信頻度が高いからではなく、長年にわたりファンとの信頼関係を築いてきたからです。テクノロジーでこうしたことが可能になるわけではないのですが、効率性を重視する製品戦略においては、こうした初期投資は無駄なコストとみなされます。

絶え間ない価格競争が続く今日の環境において、企業はコンテンツコストの削減を急務としています。しかし、トラフィックを生み出し、スケーラビリティによってコンバージョンを達成するための前提条件は、何よりもまず高品質なコンテンツです。結局のところ、デジタルアバターは単なる新しいツールに過ぎず、企業にとって重要なのは、目標に到達する方法を考えることよりも、目標を理解することです。

著者:バイ・ルー

WeChat公式アカウント:京浙研究所(ID:1033550)