来週から、シリコンバレーのテクノロジー大手は新たなAI戦争に突入します。OpenAI、Google、AppleはいずれもAIアシスタントに賭け、一連のメジャーアップデートをリリースする予定です。準備はできていますか? AI戦争の新たなラウンドが始まります! 来週の月曜日、OpenAI はオンライン ライブ ストリームを開催して GPT-4 のアップグレードを正式に発表する予定です。さらに、スーパー「AI アシスタント」も私たちを待っています。 OpenAI のオーディオ AGI 研究責任者 Alexis Conneau 氏は、ホームページの背景をウルトラマンに合わせて変更しました。来週、その魔法が見られるでしょう。 OpenAI の研究科学者 Bowen Cheng 氏は、これは GPT-5 よりもはるかに優れているとさえ述べています。 これらすべては、本当の「彼女」が今にも登場しようとしていることを示唆している。 OpenAIからの圧力にもかかわらず、Googleは2日目のI/Oカンファレンスでモデルの新たな進歩を発表する予定であり、Geminiを搭載した「Pixie」と呼ばれるパーソナルデジタルアシスタントもリリースすると噂されている。 これに続き、マイクロソフトは21日にBuild開発者会議を開催し、そこで最新のOpenAI機能を自社製品ラインに統合する可能性が高く、さらには最新の5000億パラメータの自社開発大規模モデルMAI-1を公開する可能性もあります。 そして、非常に期待されている Apple WWDC カンファレンスでは、生成 AI 機能を統合した iOS 18 がリリースされ、iPhone に ChatGPT も組み込まれる予定です。 一連の重大発表が市場を席巻し、他の企業に息つく余地は残されなかった。 あるネットユーザーは、「Appleは独自の『AJAX』AIシステムを放棄して、OpenAIと全面的に協力するつもりなのか?それとも、OpenAIはAppleのAI能力が追いつくまでの一時的な措置にすぎないのか?」と疑問を呈した。 Apple の社内関係者である Gurman 氏は、Apple の人工知能戦略を次のように要約しました。
明らかに、現状では、OpenAI は AI コラボレーションを通じて Microsoft、さらには Apple とも結びついており、Google は単独で戦わなければならない状況になっています。 この AI バトルに勝つのは誰でしょうか? 1. ChatGPT では電話通話が可能です。詳細は月曜日のライブ ストリームで公開されます。インターネット全体の注目は依然として OpenAI にあります。 「何を発表するのか」という話題は引き続き話題となっており、Google I/O カンファレンスについて議論する人はほとんどいない。 月曜日のリリースの予測に関して、ユーザー Anany が新たな発見をしました。
実際、この機能は次のコード内の「電話をかける」や「電話を拒否する」などのキーワードからわかります。 さらに、OpenAI はこの機能を実現するために webRTC サーバーを導入しており、これらのサーバーは最近構成されました。 当初、ネットユーザーは OpenAI が純粋な音声モード用に WebRTC サーバーを展開しているのではないかと考えていましたが、現在ではそうではないようです。 この機能は、LiveKit (リアルタイムのオーディオおよびビデオ通信を提供するソリューション) によって提供されます。 あるネットユーザーは、「これは、私が電話をかけなくても、ChatGPT が積極的に電話をかけることができるという意味ですか?」とコメントしました。 彼がこの疑問を提起したのは、映画『her』でAIアシスタントのサマンサが男性主人公に積極的に電話をかけ、いくつかのことを知らせたからだ。 ChatGPT Assistant が積極的に電話をかけて、リマインダーを送信したり、ユーザーの習慣を確認したりしたら、どれほど素晴らしいことか想像してみてください。 しかし、Anany 氏は、ユーザーがこの機能を自分で許可するかどうかを選択する必要があると述べています。 Hallid.ai の共同設立者である indigo 氏も包括的な予測/トレンド推測を行いました。 Indigo によれば、GPT-4 の新しいバージョンは、異なるパラメータスケールに基づいて複数のバージョンに分割される可能性があります。 昨日、一部のネットユーザーは、gpt4-lite、gpt4-auto、gpt4-lite-autoなどのバージョンがリリースされる可能性があると推測しました。 数日前にLMSYS Arenaに登場したgpt2-chatbotは、GPT-4の軽量版である可能性が高いです。さらに、これはGPT-3.5の使命が終わりに近づいていることを意味しており、最新の軽量版は無料で利用できるようになり、APIの価格も大幅に下がる可能性があります。 ウルトラマンが言及した「魔法」とは、より強力なメモリと計画機能を備え、エージェントのタスクを自律的に実行できる、アップグレードされた GPT-4 (gpt4-auto) のことかもしれません。 もちろん、「AIアシスタント」も彼女を現実のものにしてくれるでしょう。 出典: インディゴ 昨日、OpenAIでビデオ生成を専門とする研究者ウィル・デピュー氏が、おそらく何かを暗示する、シンギュラリティの到来を示すロゴを投稿した。 II. Google が参入し、AI アシスタント Pixie をリリースする可能性があります。Google が OpenAI および Microsoft と直接競合しているこの重要な時期に、このカンファレンスでの発表はすべて AI に関するものとなることを Google は明らかにしました。 Googleの公式サイトによると、今年のI/Oカンファレンスは5月14日午後1時(東部時間)に開催される。 Google は生成 AI を検索エンジンに統合し、ユーザーが会話型検索を行えるようにするのではないかと推測されています。 さらに、Google は、英語学習者向けの AI を活用した会話練習や、買い物中に仮想試着画像を生成するなどの新しい検索機能をテストしています。 検索エンジン以外にも、Google マップでユーザーが適切なレストラン、ショッピング モール、電気自動車の充電ステーションを見つけられるようにするなど、より多くの Google アプリが AI をより深く統合していく予定です。 カスタマー サービスへの通話の転送に時間がかかりすぎる場合はどうすればよいでしょうか? Google がテスト中の新しい AI 機能は、通話が自動的に転送されるのを待って、誰かが応答したときに通知してくれる機能も備えている。 各種アプリケーションのほか、オペレーティング システムも不可欠です。 Android 15 開発者プレビューは先月リリースされており、Google は I/O カンファレンスでさらに新しい機能を紹介する予定で、これには Gemini とのより深い統合が含まれる可能性があります。 現在、Android システムの生成 AI 機能は主に Gemini Nano によって駆動され、さまざまなソフトウェア機能で使用されています。 たとえば、Magice Compose は Google メッセージなどのアプリケーションで返信の提案を提供でき、Cinematic Wallpaper は機械学習を使用してユーザーが画面の壁紙をカスタマイズできるようにします。 AndroidがAIをさらに活用することで、どのようなパーソナライズされたユーザーエクスペリエンスを実現するのか想像してみてください。例えば、よりスマートなホーム画面、ロック画面、通知バーなどでしょうか? 昨年のI/Oカンファレンスでは、ChatGPTと競合する大規模言語モデルであるGeminiが発表されました。今年は新たなモデルが登場するでしょうか? 新しいバージョンの Gemini 以外にも、Google の大規模な画像およびビデオ モデルにも期待できます。 Redditのユーザーによると、Googleにはすでにテスト中だがまだ一般には公開されていないモデルが3つあり、2024年のI/Oカンファレンスで発表される予定だという。 これら3つのモデルは、画像生成モデルのImagen 3と、画像を最適化して補完できる2つのモデルJunoとMiroです。 Miroにはビデオ生成機能も搭載される予定とのこと。 さらに、Googleは今年のI/OでAIアシスタント「Pixie」の新バージョンをリリースする可能性があり、これが既存のGoogleアシスタントに取って代わる可能性があります。 Pixieは言語モデルGeminiを搭載しており、Google独自のハードウェアデバイスであるPixelにインストールされています。他のサードパーティ製デバイスにも公開されるかどうかは現時点では不明です。 しかし、今年のI/OカンファレンスでPixel製品のアップデート版が発表される可能性は低いでしょう。GoogleはすでにPixel 8aの新バージョンをリリースしており、すでに予約注文を受け付けています。 Pixel 9の新バージョンの外観がオンラインでリーク Pixel 9と折りたたみ式のPixel 9 Pro Foldは今秋発売される予定です。 III. アップルは命綱にしがみつく一方、OpenAI や Google による AI 音声アシスタントの猛攻に直面して、ネットユーザーは Apple に次のような要求をしている。 Apple にとって時間はなくなりつつあります! OpenAIとAppleは、ChatGPTをiPhoneに組み込み、今年のiOSシステムに新しい生成AI機能を提供することを可能にする協力協定を締結しようとしているとの報道もある。 しかし、Apple は自社の Siri を放棄するつもりはない。 ニューヨークタイムズは最近、Appleが他のチャットボットのライバルと競争するためにSiriをアップグレードし再構築する予定であると報じた。 この決定はすでになされていました。 2023年初頭、Apple幹部のクレイグ・フェデリギ氏とジョン・ジャナンドレア氏は、当時人気だったOpenAIのチャットボットChatGPTを数週間かけてテストした後、危機感を覚えた。 彼らは、生成型人工知能の出現により、Siri は時代遅れで陳腐なものになったと考えている。 2011年にApple社が導入し、すべてのiPhoneに搭載されている最初の仮想アシスタントであるSiriは、常に個々のリクエストに応えることに限定されており、ユーザーが開始した会話に対応することはできなかった。 たとえば、最初にサンフランシスコの天気について尋ね、次に「ニューヨークはどうですか?」と尋ねると、Siri はユーザーの質問を誤解することがよくあります。 しかし、ChatGPT はユーザーが 2 番目の質問への回答を求めていることを認識しています。 新たなテクノロジーがSiriを超えていることに気づいたこのテクノロジー大手は、過去10年間で最も大規模な組織再編に着手した。 テクノロジー業界の AI 競争で追いつこうと決意した Apple は、生成 AI を社内の特別なベンチマーク プロジェクトとし、10 年に一度の計画を中心に従業員を組織しました。 1. Siriの超進化Appleの関係者3人によると、Appleは6月10日の年次開発者会議で改良されたSiriをリリースする予定だという。 新バージョンには新たな生成型人工知能が組み込まれており、これにより Siri は一度に 1 つの質問に答えるのではなく、ユーザーとチャットできるようになります。 また、Siri はより会話的かつ多機能になります。 Siri のアップデートは、生成 AI を全面的に採用する Apple の主要な取り組みの 1 つです。 新しい Siri 機能をサポートするために、今年の iPhone にはさらに多くのメモリが追加されました。 さらに、Appleは、チャットボットをサポートするAIモデルへのアクセスを得るために、Google、Cohere、OpenAIを含む複数の企業と提携する可能性について話し合っている。 一方、Appleの幹部は、将来的には新興のAI技術がiOSに取って代わり主要OSとなり、世界のスマートフォン市場におけるAppleの優位性が脅かされるのではないかとも懸念している。 さらに、この新しい技術は、AI アプリケーション (AI エージェント) を中心としたエコシステムを育む可能性もあります。 これにより、年間約240億ドルの売上を生み出すAppleのApp Storeが弱体化する可能性がある。 しかし、アップルは、独自のAIシステムを開発できない場合、iPhoneが他の先進技術と比較して「機能しない携帯電話」となり、市場シェアを失う可能性があることをより懸念している。 iPhoneは現在、世界のスマートフォン市場の利益の85%を占め、2,000億ドル以上の売上高を生み出しています。この損失は計り知れないものとなり、Appleにとって受け入れ難いものとなることは容易に想像できます。 この緊急感に駆り立てられたアップルは、もう1つの大規模投資である100億ドルの自動運転車プロジェクトをキャンセルし、数百人のエンジニアをAI開発に集中させるよう再配置した。 さらに、Apple はデバイスのワークフローとツールに対する一貫したアプローチを継続し、iPhone と Mac のプロセッサを搭載したサーバーの作成を検討します。 内部からのリークによると、Apple の Siri のアップグレードは、詩の作成などのコンテンツ生成で ChatGPT と競合させるためではなく、Siri が本来のタスクに集中できるようにするためのものだという。 これには、アラームの設定、カレンダーのリマインダーの作成、買い物リストへのアイテムの追加、テキスト メッセージの内容の要約などが含まれます。 Appleは、アップグレードされたSiriは競合他社の人工知能よりもプライベートなサービスをより多く提供し、コスト効率も高くなると主張する予定だ。 Siri は iPhone 上でリクエストを処理するため、クラウドでのデータ漏洩やクラウド コンピューティングのコストを回避できます。 しかし、AppleはiPhoneに搭載されている小規模な人工知能システムに関連するリスクにも直面している。 研究によると、小規模なAIシステムは大規模なシステムよりも幻覚を起こしやすい可能性があることが判明しています。Siriの共同創設者であるトム・グルーバー氏は次のように述べています。 Siriの目標は常に、言語と文脈を理解する会話型インターフェースを作ることでしたが、それは難しい課題です。技術が進化するにつれて、私たちはより良くなることができるはずです。すべての問題を同じアプローチで解決しようとしないことで、多くの困難を回避できるでしょう。 Apple は、世界中で使用されている 20 億台以上のデバイスや、一流の半導体チームなど、人工知能の分野でいくつかの優位性を持っています。 これにより、Apple は AI 製品を宣伝し、顔認識など多くのチップを必要とする AI タスクをサポートできるようになります。 2. Appleは1ヶ月で流れを変えることができるか?しかし、Appleは過去10年間、包括的な人工知能戦略を策定したことがなく、Siriも発売以来大きなアップグレードや改善は行われていない。 同時に、同社のスマートスピーカー「HomePod」も、曲の再生リクエストに応答するなど、いくつかの単純なタスクを確実に完了できないという制限があり、魅力を減じている。 Siri チームで 2 年間働いた後、生成 AI プラットフォーム Brighten.ai を設立したジョン・バーキー氏は、次のように述べています。 Siriチームは設立以来、Apple社内の他のチームほどの注目やリソースを注がれてきませんでした。さらに、Apple社内では各部門が独立して運営されていることが多く、情報共有も限られています。しかし、AIを製品に統合してこそ成功できるというのが現実です。 さらに、Apple は優秀な AI 人材の採用と維持において大きな障害に直面しています。 Apple の秘密主義のため、研究成果が論文として出版されたり、会議で発表されたりすることはほとんどなく、これは科学者にとってほとんど耐えられない欠点です。 ここ数ヶ月、Appleは通常の戦略を若干調整し、AIに関する論文の発表数を増やしています。しかし、業界の研究者たちは依然としてこれらの論文の質に疑問を抱いており、Appleによる単なるマーケティングの誇大宣伝に過ぎないと考えています。 しかし、野心的な将来有望な研究者の中には、Apple に入社してプロジェクトのリーダーになることが選択の大きな理由となっている人もいます。 Appleは開発戦略を調整し、多くの新しい人材を吸収してきました。 しかし、この大規模で目まぐるしいAI音声アシスタントの戦いにおいて、Appleが6月の開発者会議でその不利を覆せるかどうかはまだ分からない。 AI音声アシスタントの将来はどのようなものになり、私たちの生活にどのような影響を与えるのでしょうか? この質問に対する答えはどんどん近づいてきています。 参考文献: https://x.com/ai_for_success/status/1789364452640563709 https://www.theverge.com/2024/5/11/24154219/google-io-2024-what-to-expect-where-watch-livestream-ai-android-search-gemini https://www.nytimes.com/2024/05/10/business/apple-siri-ai-chatgpt.html WeChat公式アカウント:新知源 |