Haozao

AI オフィスアシスタント: 労働者の負担を軽減するのか、それとも増やすのか?

AIの発展に伴い、まるで感情面で安定したアシスタントを見つけたかのように、AIを生産活動の重要な一部とみなす人もいます。しかし、AIアシスタントにも限界はあります。

張毅は北京で物理学の博士課程に在籍しています。ある日、彼はMATLABプログラミング言語をPythonに変換する必要がありました。

これは研究のための補助的な作業だった。コーディングは彼の得意分野ではなく、大抵2時間かかっていた。いつものやり方は、コードを比較しながら構文を一行ずつ修正することだった。しかし、ChatGPTのことを思い出し、試してみるのもいいかもしれないと思った。

ダイアログボックスに張毅は「MATLABコードをいくつかお渡しします。Pythonに変換してください」と入力しました。数秒後、コードが完成しました。張毅は大変驚きました。完全に正確というわけではありませんでしたが、手作業による検証だけで済み、時間もそれほどかかりませんでした。約1年間使用した後、張毅はXinmei Daybreakに「以前の80%の時間を節約できました」と語りました。

ChatGPT は AI 主導の生産変革の波を引き起こしましたが、これは起業家の単独の行為ではなく、ユーザーの証言が必要です。

AIが人間に取って代わるのではないかと懸念する人がいる一方で、十分に訓練され感情的に安定したアシスタントを無料で持つのと同じように、AIを生産の重要な部分とみなす人もいます。

学生はAIを使ってコードや論文を書き、裁判官はAIを使って法的文書を作成し、デザイナーはAIを使ってグラフィックを作成し、さらには収入を得ています。AIが仕事を終えた後、彼らはAIに感謝することを忘れません。

現時点では機械的なタスクの処理に適している AI の限界も認識していますが、AI とうまく付き合えるかどうかの鍵は、プロンプトをいかにスムーズに使用できるかにあります。

しかし、生産面における AI の影響はまだ始まったばかりであることを認めなければなりません。

1. 安定した感情を持つ仕事のアシスタント

Zhang Yi 氏は現在、ChatGPT を毎日使用しており、「これなしでは生きていけません」と述べています。

張怡氏にとって、AIは仕事の効率を向上させる強力なツールとなっています。日々の研究には、しばしば研究を支援するコードの作成が必要です。しかし、張怡氏はコンピュータサイエンスのバックグラウンドを持たないため、一部のコードの作成が非常に難しく、研究時間のかなりの部分を費やしています。

昨年、ChatGPTがAIブームを巻き起こし、友人が張易(Zhang Yi)に試してみてはどうかと提案しました。驚いたことに、張易はAIが想像以上に便利であることに気付きました。ソートアルゴリズムといった典型的なコードタスクは、AIによってほぼエラーなく完璧に処理されました。検証方法もシンプルで、計算に特定の値を使用するだけでした。

AIに基本的な物理学について質問することもできます。さらに、張毅氏はDaybreakに対し、「流暢な英語を話すことで、片言の中国語英語を上達させることもできます」と語りました。

AIは科学研究の成果に直接貢献することはできませんが、それでも張易氏は多くの機械的な作業を省き、思考に集中する時間を確保しています。張易氏は、多くの同級生がAIを活用し始めていることに気付きました。中にはChatGPTを使う人もいれば、Wenxin Yiyanを使う人もいます。

便利なツールに関する限り、AI はより幅広い用途に使用できます。

郭暁は司法補佐官であり、日々の業務には判決文の作成と調査が含まれます。通常業務以外にも、時事問題に関する考察文の作成などの依頼も受けています。

以前は、検索エンジンを使って情報を収集し、それを自分の考えと組み合わせて記事を書いていました。AIを活用することで、論理的に明確な下書きが直接生成され、郭曉は記事全体を読んで自分の意見を加えるだけで済みました。

通常、この種の作業は周辺的な作業に分類され、作業の質がパフォーマンスに大きな影響を与えることはありません。AIを活用することで、効率性が向上し、ミスの懸念も解消されます。郭暁氏はXinmei Daybreakに対し、このことをより直接的に表現し、「あまり役に立たないが、やらなければならない作業」を完了することが目的だと述べました。しかし、この種の作業は通常、月に1回しか発生しません。

コードやテキストに加え、音声や動画の分野におけるAIの可能性も探求され、検証されています。今年初め、CapCutは「Clone Voice」という新機能を追加してアップデートしました。ユーザーは、指示に従って例文を読み上げることで、自分だけの音声を生成できます。「もう自分でセリフを読む必要がありません!」と多くの人が驚きの声を上げました。繰り返しの録音や不正確な発音は、多くのブロガーにとって悩みの種となっています。

AI搭載デジタルヒューマンは商業分野にも応用されています。4月16日、劉強東氏によるAI搭載デジタルヒューマンがJD.comアプリでライブ配信デビューを果たしました。配信開始から20分で視聴者数は900万人を超えました。これは単なる販売イベントではなく、マーケティングキャンペーンでもありました。AI搭載デジタルヒューマンの、リアルな外観、スムーズなインタラクション、そして低コストといったメリットを、より多くの企業が実感することになるでしょう。

コンテンツ生成、コード生成、画像生成、バーチャルヒューマンインタラクションといった分野にとどまらず、生成型AIの応用範囲はゲーム開発、広告・マーケティング、さらには工業デザインへと徐々に拡大し、様々な業界に浸透しています。「AIって本当にすごい!」「未来はすぐそこ!」と多くの人が声を上げています。

バイトダンス副社長の朱軍氏は、豆宝の製品設計について、「一方では、大型端末の技術自体が絶えず向上しており、他方では、業界におけるアプリケーション形式やインタラクション方法の探求が徐々に成熟していくでしょう。こうして、大型端末の製品は、より多くのユーザーの生活や仕事に徐々に溶け込んでいくでしょう」と自信たっぷりに語った。

多くの人の目に見えないところで、AIの影響は広がりつつあり、その恩恵をいち早く吸収する人もいれば、ビジネスチャンスを察知する人もいる。

II. AIを収益化するのはどれくらい難しいのでしょうか?

ナナさんが AI に関わるようになったきっかけは、興味と好奇心からでしたが、コンテンツを作ることで金銭的な報酬も得られました。

ナナがAI描画ソフト「Midjourney」を初めて開いたとき、彼女は特に定義づけをしませんでした。ただ「風の中のうさぎ」という5つの単語を入力しただけです。絵が浮かび上がったとき、彼女はまず驚きました。「AIの創造性を感じました。」

これがナナのAI探求の旅の始まりでした。彼女は小紅書に「Little Nana」というアカウントを開設し、AI写真に焦点を当てています。

テキストベースの画像編集の原理はシンプルですが、より洗練されたクリエイティブな画像を作成するには、写真に関する知識と描写プロンプトの巧みな使用を組み合わせる必要があります。例えば、Nanaの画像の描写プロンプトは、「春、早朝、澄み切った光、黄色いドレスを着た女性モデルが湖畔に座り、木々は満開。魅力的な女性モデル、半身ショット、timwalker撮影」です。

ナナの本業である写真のポストプロダクションは、すぐにAIペインティングへの扉を開きました。しかし、3~4ヶ月投稿しても、トラフィックの大幅な増加は見られませんでした。ファンは彼女のファッションランウェイや服のデザイン画像に興味を持っているようでした。そこで彼女は方向転換し、AIを活用したファッションデザインへの進出を決意しました。

AIファッションデザインとAI写真はどちらもAIが生み出す芸術ですが、その比重は大きく異なります。AI写真は光、環境、感情、雰囲気の表現を重視するのに対し、AIファッションデザインはデザインスタイル、デザイン要素、スタイルのマッチング、仕立て、素材など、より詳細で具体的な側面を重視します。そのためには、写真やスタイリングの基礎知識だけでなく、異なる時代の様式的特徴や、異なるスタイルの背後にある歴史的・文化的背景への理解、そしてより多様な思考様式と美的感覚の衝突が求められます。

AIアパレル

幼い頃からファッションデザインに興味を持ち、ファッションスタイリストと仕事をしてきたナナさんは、試行錯誤を繰り返しながら、熱心に学びに取り組んできました。「AIの表現力の速さも、学ぶ意欲を強くさせてくれました」とナナさんは言います。時には、納得いくまで3、4時間も集中して取り組むこともあるそうです。

フォロワーが7,000人に達した頃、ビジネスチャンスが舞い込んできた。彼女はデイブレイク誌に「信じられませんでした」と語った。半年間の努力の甲斐なくフィードバックを得られた喜びと、数万ドル、数十万ドルの価値があるジュエリーブランドからのプレッシャーが入り混じった感情だった。依頼を受けた後、ナナはデザインとレイアウトに集中し、少しも手を抜くことはなかった。

コラボレーションを求めるブランドが増え、収益化の方法も多様化しています。ブランドプロモーションよりも手軽に、コミュニケーションが少なく、画像の著作権を販売するだけのシンプルな方法もあります。しかし、全体として、すべての収入源を合わせた収入は彼女の本業よりも少なく、安定性に欠けています。しかし、ナナにとって最も大切なのは、自分の興味と副収入から得られる達成感です。

Nanaは孤立した事例ではありません。AIに内在する商業的可能性は、複数の収益化チャネルを生み出しています。

ブロガーのMidstudioは、XiaohongshuでAIを活用した家具デザインに焦点を当て、従来のデザインのルールを打ち破り、想像力と創造性をより自由に発揮できる作品を発表しています。例えば、椅子のデザインでは、果物の要素を取り入れることで、椅子のフォルムを柔らかくし、まるで可愛いフルーツの置物のような印象を与えています。ファンはコメント欄でこのデザインを称賛するとともに、「どこで買えるの?」と質問しています。

これはブロガーにとって収益化のチャネルとなり、工場と提携して小紅書の店舗で直接商品を販売できるようになりました。さらに、蓄積されたトラフィックは、ブロガーにブランドとのコラボレーションの機会を数多くもたらしました。

AIを収益化する機会を模索する人が増えています。紅包や特注のスマホケースといった小物から、大型のアートプリントや特注のギフトボックスまで、買い手がいれば何でも通貨に換金できます。結婚式のセッティングデザインにAIを活用し、ウェディングプランニング分野に新たなビジネスチャンスを開拓する人もいれば、AIを使って教育コンテンツを作成し、フォロワーを獲得して商品を販売する人もいます。

III. AI生産の限界

AIアプリケーションはどれほど強力なのでしょうか?これは答えるのが難しい質問です。誰もがAIに大きな期待を寄せていますが、現状では依然としていくつかのハードルと限界があります。

AIは張毅氏を退屈で機械的な作業から救い、効率を向上させることができる。しかし、研究のアイデアや方向性を示すことはできない。たとえ思考のための十分な時間を確保できたとしても、科学研究の進歩を加速させることができるだろうか?張毅氏の答えは明確だ。「アウトプットはわずかに増加するだろう」

AIを活用して課題をこなす郭曉氏も同様の見解を示している。AIライティングの利点は、明確なテーマと論理的な構成にある。しかし、欠点は、あまりにも大まかで、視点の正確さに欠けることだ。郭曉氏の主要業務である、裁判所の判決文などの正式に公表される法律文書においては、厳密な論理と明確な事実が極めて重要であり、わずかな文章上の誤りでさえ、取り返しのつかない損害を引き起こす可能性がある。

さらに重要なのは、「事件の最終決定は裁判官が下し、裁判官の裁量で決定される。AIがその決定を下すことはできない」ということだ。

公式文書の作成は、AIの支援が最も有効と考えられる分野の一つです。多くのAIソフトウェアプログラムが既に公式文書作成セクションを立ち上げており、通知、発表、スピーチなどの行政文書の作成サービスを提供しています。

*バンユエ・タン*が引用した公務員によると、AIが生成した公文書は地域の状況に対する包括的かつ正確な理解が欠如しており、新たな地域の政策や策定事項への対応も不十分で、結果として記事の訴求力に欠けるものとなっている。政府文書は理論的な知識と実例の組み合わせが求められることが多く、これがAI生成公文書の能力を制限している。

AIが基本的な客観的なタスクしか実行できないテキストやコードと比較すると、絵画の分野は想像力を駆使した表現の可能性をはるかに秘めているように思われます。しかし、プロンプト(指示)は依然としてハードルであり、表現の準備には、絵画の基礎知識、熟練したアーティスト、そして技法への深い理解が必要です。そのため、現在最も収益性の高いAIアプリケーションは、コースを販売するものです。

描画分野以外でも、少しでも難しい要件を伴うタスクにおけるプロシージャル処理の適用レベルは、AIが提示する最終結果に大きな影響を与える可能性があります。多くの人がコンテストから排除されるのは、このためです。

ケビン氏はAI愛好家で、自身のXiaohongshuアカウント「Kevin's AI Practical Notes」でAIを活用した問題解決のノートを共有しています。その中には、AIを使って「Xiaohongshuの話題の投稿をワンクリックで分析する」や「1分で100点満点のポスターを作成する」といった事例が含まれています。ケビン氏は、期待通りの結果を得るために、入力時に一般的な提案ではなく、構造化された提案を使用しています。以下にいくつかの例を示します(AIソフトウェアKimiからダウンロードしたコンテンツです)。

構造化されたプロンプトはAIの処理効率を向上させ、より正確で、論理的推論を必要とする複雑なタスクも可能にすると考えられています。その根底にあるのは、大規模モデルで学習された形式でタスクを配布することです。簡単に言えば、まるであなた自身の言葉であなたとコミュニケーションを取っているかのようです。

しかし、構造化されたプロンプトの概念と使い方を理解し、習得するには時間と労力が必要です。ケビン氏の言葉を借りれば、外部フレームワークは理解しやすいものの、重要なのはプロンプトの背後にあるロジックと、AIが適切に理解し、実行できるかどうかです。

ほとんどの人にとって、AIは利便性と効率性を意味します。対話を通じて直接目的の結果を得ることが、AIを使う最初の動機です。構造化されたプロンプトは、間違いなくAIの利用プロセスを長引かせ、難易度を高めます。ケビン氏も「学ぶのは簡単だが、使いこなすのは難しい。少なくとも私はまだうまく書けていないと思う」と認めています。

AI アプリケーションは、依然として大きなブレークスルーの機会を待っています。

(インタビュー対象者の要請により、この記事では張毅と郭曉は仮名で表記されています。)