今年の618ショッピングフェスティバルの価格戦争は、大型モデルから始まりました。 バイトダンスが先頭に立って攻勢をかけ、BAT(百度、アリババ、テンセント)も追随した。主要機種は97%も値下げされ、数百万トークンが1元まで下落した。大手機種は「李時代」に突入し、無料、完全無料、そして永久無料のサービスを提供した。このような爆発的な値下げは久々で、「百人一首戦争」「O2O大乱闘」「配車補助金戦争」「クラウドプロジェクト1元入札」を彷彿とさせ、業界の戦火を一気に燃え上がらせた。 1. 大手模型メーカー8社が一斉に値下げした。バイトダンスとBAT(百度、アリババ、テンセント)の巨大企業は、大規模ソフトウェアの価格競争に共同で参入した。IT Timesの不完全な統計によると、5月以降、国内外の大規模ソフトウェア企業8社が大幅な値下げを発表しており、その中にはMagic Square Quant、Zhipu、GPT-4o、バイトダンス豆宝、アリババ同義千聞、百度文心易眼、テンセント虎元、iFlytek星火が含まれている。 5月15日、ByteDanceは主力機種「豆宝(Doubao)」の価格競争を開始し、Pro-32k版の入金額を1000トークンあたり0.0008元、Pro-128k版の入金額を1000トークンあたり0.005元に引き下げました。これは、わずか1元で豆宝の主力機種125万トークン(約200万字、三国志演義3巻分に相当)を購入できることを意味します。 大規模モデルでは通常、課金単位として「元/千トークン」が使用されるが、ByteDanceのDoubaoはコストをセント単位まで直接削減し、まさに価格競争に火をつけている。 アリババと百度も5月21日頃に追随しました。アリババの主力GPT-4モデルであるQwen-Longは、入力価格を1000トークンあたり0.0005元に引き下げ、97%の値下げとなりました。この値下げにより、GPT-4トークンの価格の約400分の1となり、世界的な価格障壁を打ち破りました。これは、1元で新華辞書5冊に相当する200万トークンを購入できることを意味します。百度の文鑫易言は、同社の2つの主力モデルであるERNIE SpeedとERNIE Lite(どちらも今年3月に発売された軽量モデル)が、8kと128kのコンテキスト長をサポートし、完全に無料で即時利用可能になったことを直接発表しました。 5月22日、テンセントはHunyuanの大規模モデルを全面的に値下げしました。主力モデルの一つであるHunyuan-liteモデルは、0.008元/千トークンから完全無料に変更されました。API入出力の総長は、現在の4kから256kにアップグレードされる予定です。Hunyuan-standard、Hunyuan-standard-256k(38万文字を超えるテキストを処理可能)、そして最高構成の兆パラメータモデルであるHunyuan-proの3つの大規模モデルのAPI入出力価格が全て値下げされ、値下げ幅は最大で87.5%に達しました。 同日、iFlytekは業界初の「永久無料」大型モデル「Spark Large Model Lite」を発表しました。最上位版となるiFlytek Spark Max APIは、1万トークンあたり0.21元という低価格です。一方、百度の「文心易眼ERNIE4.0」やアリババの「同義千文Qwen-Max」は1万トークンあたり1.2元であり、iFlytek Sparkの最上位版は百度やアリババのモデルのわずか5分の1の価格となります。 中国で大規模モデルを本当に不安にさせているのは、OpenAIが2023年初頭から4回も価格を値下げしていることだ。5月13日にリリースされたGPT-4oは、パフォーマンスの飛躍的な向上だけでなく、50%の価格引き下げも実現した。 II. 巨大企業はデータ獲得に資金を投じる「現在、大規模モデルの価格設定ではコストを賄えなくなっているのに、なぜ大規模モデルメーカーは依然として価格を下げているのでしょうか?主な目的はデータ収集です。」AIエージェントを専門とする藍馬科技のCEO、周建氏によると、GPT-4oの戦略は、一般向けに無料で公開し、開発者のコストを半減させることです。これにより、一般の人々がより多く利用し、マルチターン対話などのインタラクティブなデータを収集できるようになります。これにより、静的データよりも迅速にモデルの能力を向上させることができます。国内の大規模モデルも「データと交換するためにお金を燃やしている」段階にあります。 これまで、大規模なLLM型モデルには時間の概念が欠けていましたが、GPT-4oは短期記憶の問題を解決し、会話における感情を認識し、指示に従い、中断されることを可能にしました。また、異なる感情の声を使って物語を語ることもできますが、長期記憶と社会知能はまだ不十分です。 周建氏は、たとえGPT-4oがアインシュタインと同等の知能を持っていたとしても、上場企業のCFOを務めることはできないだろうと例えました。なぜなら、この役割には、様々なコミュニケーションに基づいて企業の組織構造や権力構造などを要約・分析するための強力な長期記憶力が必要だからです。したがって、現段階ではまだ「水槽の中の脳」に過ぎません。 OpenAIは、GPT-4oを一般向けに無料で提供するだけでなく、ハードウェアを用いてオフライン販売、ヘッドハンティング、その他顧客とのインタラクションに関するデータを収集しています。GPT-4oのリリース後、OpenAIはアメリカの著名なフォーラムであり、米国株式市場における個人投資家のハブでもあるRedditと提携し、コミュニティコンテンツを収集して大規模モデルの学習に活用しています。この現実世界の動的なデータを収集する目的は、大規模モデルをより人間らしくし、複数ターンの対話、長期記憶、そして社会的インタラクションロジックの徹底的な理解を可能にすることです。 上海人工知能研究所のシニアR&Dマネージャーである徐紅毅氏によると、大規模モデルが市場シェアを獲得するには、データも重要な要素です。現在、大規模モデルをめぐる競争は、計算能力から高品質なデータへと移行しています。高品質な中国データは極めて不足しており、動的でインタラクティブなデータの重要性はますます高まっています。 中国語の教科書には、英語の教科書の10分の1しか収録されていません。中国語の静的な知識データループは英語に比べて本質的に弱いため、量的な飛躍的進歩は動的データによってのみ達成できます。動的データは、実際に人々が使用することでのみ収集できます。さらに、世界のデータの70%は、無料で公開されているデータセットのレベルにとどまっています。大規模なモデルが専門知識を獲得できるようにするには、様々な業界の開発者を継続的に惹きつけ、垂直分野のデータセットを提供してもらう必要があります。 低価格は間違いなく顧客を引き付ける最良の方法です。もちろん、これは同等の品質、あるいはそれ以上の速度を保証することが前提です。昨年のGPT-4から今年のGPT-4oまで、最初のトークン応答速度は6倍速くなりましたが、検索価格は12倍安くなっています。海外メーカーは速度で注目を集め、国内メーカーは価格で市場を奪い合っています。しかし、業界関係者やメディアの中には、大型モデルメーカーが並列処理を考慮せずに価格を議論することが「科学的」なのかどうか疑問視する声もあります。高い並列処理をサポートできなければ、出力速度と品質は保証できません。 「大規模モデルの一括値下げは、単なる市場戦略ではなく、転換点のシグナルでもある」。中国初の時空間データに基づく信用債リスクモデルの開発を担当した北京の特任専門家、ヤン・シャオジン氏は、大規模モデルの一括値下げには3つの理由があると考えている。第一に、統一補助金などの政策により、クラウドコンピューティング、コンピューティングパワーチップなどの技術コストが低下し、技術配当がもたらされたこと。第二に、大規模モデルメーカーが自社の規模拡大に自信を持っていること。2024年初頭、中国における大規模モデル全体の1日あたりのAPI呼び出し回数は1億回を超えなかったが、年末までに100倍に増加すると予想されている。そして最後に、開発者を誘致し、数千の業界を急速にカバーすることだ。一方、AIGCの中国におけるユーザー浸透率は、現在わずか6%程度にとどまっている。 「バイトダンスは、豆宝ビッグモデルを通じてVolcano Engineとクラウドサービスを推進したいと考えています。実際、動画などのコンテンツこそが真の収益源です。」ヤン・シャオジン氏はまた、クラウド、コンピューティングパワー、ビッグモデル、コンテンツ、そしてデータは連鎖であり、それらが繋がれば、生態系の閉ループを形成できると考えています。これは、巨大企業がデータと交換するために資金を燃やすという本質的な論理でもあります。 III. 価格競争が消費者に波及する可能性がある(Cエンド)。「百機種戦争」はいよいよ実用段階に入りました。IT Timesの記者の観察によると、現在の値下げは主に開発者や企業を対象とした大型テキストモデルに影響しており、エンドユーザーにはまだ浸透していません。次の段階では、国内の大型モデルはエンドユーザーとマルチモーダルモデルの両方で値下げされ、エンドユーザーにとって手頃な価格、あるいは無料になる可能性があり、大型モデルのユーザーフレンドリー化がますます進むでしょう。 海外では、OpenAIがその性能優位性によりほぼ独占状態にあります。OpenAIの最新のマルチモーダル大規模モデルであるGPT-4oは、現在はテキストと画像のみの機能を提供していますが、将来的にはエンドユーザーに無料で完全に提供される予定です。音声とビデオの入出力もサポートしています。 GPT-4o デモ 現在、ChatGPTのPlus版を利用するには、月額19.99ドルのメンバーシップにアップグレードする必要があります。アプリ情報会社Appfiguresによると、ChatGPTの純収益はGPT-4oのリリース日に22%増加し、5月21日には90万ドルに達しました。これは、アプリの平均日次収益のほぼ2倍に相当します。 「国内大手メーカー間の競争はますます激化しています。明確な勝者が現れるまでは、価格低下の傾向は止まらず、むしろ急激に減少する可能性もあるでしょう」と周建氏は考えている。 ヤン・シャオジン氏はまた、膨大なユーザーベースと巨大な消費者市場がコスト削減をさらに加速させると確信している。 価格競争の背後には、データと応用シナリオの利益を掌握し、米国の大規模モデルの開発速度を短縮、あるいは追い越そうとする中国の思惑がある。データを核とし、応用シナリオを駆動力とすることが、モバイルインターネットと5Gにおける中国の追い越しの「勝利の方程式」である。しかし、大規模モデルの時代において、この追い越しの道は依然として実現可能なのだろうか? 2024年は大規模AIモデルの商用化元年とされています。IDCは、中国のAI大規模モデル市場が2026年までに211億ドルに達し、人工知能の大規模応用にとって重要な時期を迎えると予測しています。徐宏義氏の観察によると、中国の大規模モデルは、より詳細な応用シナリオに焦点を当て、ビジネスオペレーションを通じて基盤を構築する傾向があります。 中国と米国の大規模AIモデル開発における格差は、1年半という見方もあれば、わずか6ヶ月という見方もあり、議論の的となっている。最近、スタンフォード大学が発表した「2024 AIインデックスレポート」によると、2023年に世界で公開される149の著名な大規模AIモデルのうち、米国が61、中国が15を占め、世界第2位となり、急速に追い上げている。さらに、中国はAI特許数の60%を保有し、他国をリードしている。 大型モデル開発における中国と米国の開発格差を縮めるには、中国の大型モデルが依然として応用シナリオで勝利する必要がある。 価格引き下げは、企業にとって大規模モデルの利用を直接的に促すことになる。楊暁静氏は、信用債券リスクモデルとロボアドバイザーの開発経験に基づき、2005年から2022年にかけてA株市場に蓄積された証券会社のリサーチレポートは合計82万5000件に達すると試算した。各レポートを1万語とすると、合計約85億語となり、これは3億4000万トークンに相当する。これまで一般モデルの価格でAPIにアクセスしていた大規模ロボアドバイザーモデルの開発者は、今後はAPI呼び出し1回あたり1700元を支払うだけで済むようになる。 楊小静氏の評価によると、金融分野において、AI導入と価格引き下げの影響を最も強く受ける分野は、必須のインテリジェントカスタマーサービス分野となるだろう。システム呼び出しコストが削減されれば、サービス提供対象となるユーザー規模も急速に拡大するだろう。 さらに、中国は世界最大の産業用ロボット導入国であり、世界の導入数の50%を占めています。中国のAI大規模モデル企業は、産業の高度化がもたらすチャンスを捉えるべきです。「5Gのような飛躍的な発展を実現し、世界をリードするためには、AIサービスが水や電気のように容易に利用可能になり、5Gのようにどこにでも普及する必要があります」と楊小静氏は述べています。 |