Apple が、Gemini アプリを使用せずに、まったく新しい Siri を構築するために Google の基礎モデルをどのように使用したかについて話すと、セマンティクスのように聞こえ始める可能性があります。しかし、約 2 年前に約束された Siri を開発したチームについて深く掘り下げてみると、その考えはすぐに払拭されます。
「これは私たちが使用している Google アシスタントの量であり、1 つではありません」と Apple が月曜日の WWDC 2026 基調講演で 2 年前に約束していた Siri をついに発表したわずか数時間後の月曜日、Apple のソフトウェアエンジニアリング担当上級副社長、クレイグ・フェデリギ氏は月曜日に語った。
タイトなブルーのドレスシャツを着たフェデリギ氏は、Apple のソフトウェア担当副社長のセバスチャン・マリノ氏、Apple の AI 担当副社長のアマル・スブラマニア氏、そして Apple のエンジニアリング担当副社長のマイク・ロックウェル氏と並んで、広大な Apple Park リングのすぐ外にある屋外の基調講演ホールと比べると親密な雰囲気のデベロッパー センターの小さなステージに座った。
その暗い部屋で、退任する Apple CEO のティム・クック氏と後任のジョン・テラノス氏が最前列の席で見守る中、フェデリジ氏らは、Apple のエコシステム全体にまたがる、より個人的で状況に応じて深く統合された Siri を構築するための、アーキテクチャの詳細を徹底的に掘り下げました。彼らはある意味、約束の履行が遅れたことを祝ったが、同時に24か月がもたらした現実にも直面した。最後の嵐。
マクロレベルで見ると、Siri は現在、1 つの非常に強力なオンプレミス モデル、複数のモデル、さらに強力な一連のクラウドベース モデルを含む巨大で複雑なシステムとなっており、これらすべてが Apple のプライベート コンピューティング クラウドの複数のバージョンに存在しています。
モデルには、AFM Core、AFM Cloud Pro、ADM Cloud Images などの名前が含まれます。 「各モデルは、前世代のモデルと比較して、品質と操作性の点で大幅な進歩を遂げています」とサブラマニア氏は述べています。
アーキテクチャに関する講演とその後の 1 対 1 のデモの両方でデモを見た後、私は同意する傾向がありました。 Siri AI と Siri が解き放たれた Siri アプリを考えてください。
Siriが生まれ変わる
フロントエンドの Apple アプリの機能を完全に把握しているようで、単一のアプリのクエリから、たとえばメッセージから直接取得したコンテキスト情報にすばやくジャンプできます。彼は、あなたがデスクトップ上で開いた 1 か月分のサッカーの試合予定の写真が、あなたのカレンダーに追加できるスケジュールであることを知っているようです。
彼はデスクトップ上とカメラを通して画像を見ます。会話のコンテキストを記憶し、より説得力のある音声を使用して、最も複雑なタスクをガイドします。一言で言えば、この Siri は賢そうです。
しかし、Google なしでは Apple はここに到達できなかったでしょう。そして、Nvidia があったことが判明しました。
Google はどの程度関与していましたか? AppleはGoogleのGeminiファンダメンタルズモデルを使用していることを秘密にしていないが、その関与の範囲は、FedericoがSiriのアーキテクチャの内部動作を説明するために使用した概略図によってはっきりと浮き彫りになった。
コラボレーションモデル
ご覧のとおり、すべての新しいモデルとシステム コンポーネント用のボックスがあります。すべて色分けされていますが、異なる色は 2 色のみです。Apple のビルドでは青一色、Apple と Google が共同開発したモデルでは青と白の組み合わせのようなものです。すべてのモデルは共同開発されています。これらすべてを支えているのは、主に Apple の単独活動です。
Apple がこの時計について私たちに説明した方法は次のとおりです。システムは当然のことながら、クエリ テキストを生成する音声認識から始まります。その後、ガイダンスを作成してベース モデルに送信するのが、最も重要なシステム オーケストレーターの仕事です。また、Apple のシステムが、クエリを大規模モデルである 200 億パラメータの AFM Core Advanced (現在の Siri モデルの 30 億から増加) のフレームワーク内で処理するか、Apple のプライベート コンピューティングと、AFM Cloud、AFM Cloud Pro、ADM Cloud (画像の拡散モデル作成用) を含む大規模モデルの 1 つに送信するかを決定するのもこの段階です。
パラメータを分析するためのよりスマートな方法
ここでの大きな革新の 1 つ、そして Apple が iPhone にこれほど大きなモデルを搭載できる理由は、パラメーターの処理方法です。通常、各クエリにはさまざまなリクエストが含まれ、さまざまなパラメータが必要となるため、要件を満たすためにこれらのパラメータはすべて一度にメモリにロードされます。これはメモリとバッテリー寿命に大きな負担がかかり、Apple の AFM Core Advanced モデルには 200 億のパラメータがあるため、実用的ではありません。そこで彼らは「レアモデル」と呼ばれるものを作りました。
「サーバーモデルとは異なり、カーネルフォワーダーが行うことは、リクエスト全体を調べ、適切なパラメータのセットを選択し、リクエスト全体でそれらをロックすることです。そのため、トークンごとにパラメータをリロードする必要がなく、パラメータのロードコストが大幅に削減されます」とSubramania氏は述べています。
これらのモデルは最新の Gemini モデルと並行して構築されており、今後の Google Foundation モデルの作業で更新されますが、この軌跡のどの時点でも Google Gemini が主導権を握ることはありません。
代わりに、Apple は、ほとんどのイノベーション パートナーシップで採用してきたのと同じアプローチを採用しました。最良のコンポーネントまたはテクノロジーを特定し、パートナーにカスタム バージョンを構築してもらいます。この場合、Apple はこれらのモデルを共同で構築しているため、コラボレーションはおそらくより充実したものになりますが、Google の AI 機能に対する関心はアプリ クライアントにとどまります。
顧客体験は完全に暗いと感じられますし、そうあるべきです。
Apple、Google、Nvidia、完璧に連携
バックエンド、つまりクラウド側は、Apple から期待されるよりもはるかに協力的な取り組みです。プライバシーとセキュリティで名声を築いてきた同社は、Apple とその顧客の両方のプライバシー要件と期待を満たすスペースを確保するために、サードパーティのパートナーと協力してクラウド製品を削減する必要がありました。
2024 年に Apple Intelligence によって最初に導入されたプライベート クラウド コンピューティング (PPC) の概念は、オンプレミス デバイスに見られるプライバシー構造を複製しながら、オンデバイスのコンピューティングには大きすぎるモデルを収容するのに十分な大きさのクラウド スペースです。すべてのサーバーを制御するとこれは簡単になりますが、Siri AI の新しい世界では、Apple は PPC を Google と新しい Apple Intelligence パートナーである Nvidia に開放しました。
AFM Cloud Pro のようなさらに強力なモデルを実行するには、Apple は「NVIDIA の最新テクノロジーが必要だったので、プライベート クラウド コンピューティングをサードパーティ クラウドに拡張することに着手しました」と Subramania 氏は説明しました。
Nvidia はすでにシークレット コンピューティングと呼ばれるものに取り組んでいましたが、Apple の厳格な PPC 基準を満たしていませんでした。 「私たちはGoogleと共同でこれをデザインし始めました」とサブラマニー氏は語った。このソリューションには、Nvidia の GPU と Intel および Google の冗長セキュリティ コンポーネントが部分的に含まれています。
真実の瞬間
実際、Apple のプライベート クラウド コンピューティングは現在、Nvidia と Google のサーバー上に存在していますが、Apple 幹部は「Apple デバイスは Apple によって署名されたソフトウェアとのみ通信できる」と主張しています。つまり、これらのシステムに Apple によって署名および検証されたソフトウェアがなければ、Siri はそれらのデバイスに接続できないことになります。
それは確かに、現在iPhone 17 Proで使用されているSiriとは大きく異なりますが、Appleがデモンストレーションを行ったが2024年か2025年には提供されなかったものとかなり似ています。フェデリジと会社は過去24か月間すべての挫折と誤ったスタートを繰り返したわけではありませんが、エンジニアリング担当副社長のマイク・ロックスウェルは珍しい瞬間を提供しました。
「昨年、実際にオリジナルの Siri の上に増分的な最初のバージョンを構築しました…そしてそれはうまくいきましたが、それが私たちが望んでいたビジョンとエクスペリエンスを実際に提供するとは感じませんでした。そのため、より広範な変更が必要な設計もありました。そして私たちはそれを採用することにしました。そこで、戻って再構築しました」と同社のロックウェル氏は述べています。
ここからは明らかではないのは、もしこれが Apple が単独ではやっていけないと悟った瞬間だったとしたら、そのビジョンを実現するには Google とその強力な Gemini モデルが必要だったということだが、その際に何らかの方法で Gemini の経験を引き継がせる必要はないということだ。
Siri AI は、人工知能に対する Apple の当初のビジョンと、おそらく業界で最高の創造的なモデルとの融合に成功したものです。そして、すべての最高のコンシューマ ソフトウェア エクスペリエンスと同様に、ホットドッグがどのように作られるのかを知る必要はありません。ただ、それが Apple が約束した通りに動作し、あなたが望むように動作するだけで十分です。
Google ニュースで TechRadar をフォローしてください そして お気に入りのソースとして追加してください 専門的なニュース、レビュー、意見をフィードで入手するため。