
物理知能を搭載した洗濯物を折りたたむロボット
身体的知能
サンフランシスコでは、光沢のあるスチールパネルで覆われた倉庫の中で、完全にロボットによって作られた淹れたてのコーヒーが提供されます。この事実だけでは驚くべきことではありません。ロボットは 10 年以上コーヒーを作ってきました。しかし、このコーヒーを作ったロボットの頭脳は 1 匹のポニーではありません。また、ほとんどの幼児がかろうじて歩くことを覚えている間に、彼女は服をたたむ、野菜の皮をむく、キッチンを掃除するなど、他の多くの作業を実行する方法も学びました。
2024 年に設立された新興企業フィジカル インテリジェンスは、さまざまなタスクの実行方法を学習できるロボットの脳によって、近い将来、ロボットが私たちの日常生活に溶け込むようになるだろうと賭けています。同社は、テスラやボストン・ダイナミクスが製造した人型ロボットやアマゾンが使用している工場用ロボットのように、単一の機械に焦点を当てるのではなく、多くの異なる機械で多くのタスクを実行できる適応性のある制御システムを構築したいと考えています。
汎用ロボット知能は新しいアイデアではありません。多くのロボット工学者は、それが数十年にわたる長期的な目標だったと言うでしょう。しかし、1920 年代初頭に、コンピューティング能力、データ、アルゴリズムの進歩の適切な組み合わせのおかげで、AI チャットボットを強化する大規模言語モデル (LLM) のブームが起こったのと同じように、物理的インテリジェンスは、一般的なロボット工学においても同様の飛躍を呼び起こすことを期待しています。
「ほとんどの分野では、より多くの問題を解決することは物事を困難にするだけですが、AIでは実際にそれがより簡単になります。そうすれば、より多様な知識源から学ぶことができるからです」と、同社の創設者の1人であるカリフォルニア大学バークレー校のセルゲイ・レビンは言う。
LLM の成功により、視覚・言語・行動 (VLA) モデルと呼ばれる新しいタイプのロボット人工知能が誕生し、これが物理的知能研究の多くの基礎となっています。 VLA はロボットに一度に 1 つのスキルを教えるのではなく、LLM の幅広い知識を利用して一般的なリクエストを特定のアクションに変換し、ロボットが指示に従ってさまざまなタスクを実行できるようにします。 」[VLAs] これらはおそらく、大規模な言語をモデル化することで得られる興奮を最も直接的に表現したものです」とオックスフォード大学のイングマール・ポズナー氏は述べています。これらのシステムは、次の単語を予測するのではなく、特定のタスクを完了するために必要な次のロボットの動きを予測します、と彼は言います。
ロボットのトレーニングにおける大きな課題の 1 つは、現実世界ではタスクごとにほぼ無限のバリエーションがあり、ロボットが学習できるデータが非常に少ないことです。学習の自動化、つまりロボットに自ら学習させることは解決策として考えられますが、十分なデータを収集するのが難しいため、ほとんどのロボット開発者は自動化を避けてきました、とレバイン氏は言います。 「原則としてこれは自動化されるべきですが、実際には、特定のアプリケーションのデータを取得するために必要な作業量は、すべてを手作業で行う場合に必要な作業量よりも多かったです。」
Levin 氏らは、VLA を使用することで、成功するために必要なデータが大幅に削減されることを期待しています。私がレビン氏と話をした会議室の下では、作業員の集団がロボットに、シャツをたたむ、枕を棚に置く、プレゼントの箱のリボンを切るなど、ありきたりな一連の作業を行うよう教えていた。角を曲がったところに、偽のスーパーマーケット、寝室、キッチンを備えた 2 つの倉庫があり、毎週改装され、そこでロボットと物理知能 AI モデルがさまざまな設定への対処方法を学習できることがわかりました。同社はまた、ロボットを実際の住宅に導入し、現実世界の混乱にどのように対処できるかをテストした。

サンフランシスコのフィジカル インテリジェンス ビル
アレックス・ウィルキンス
この多様性は、ロボットがこれまで見たタスクを超えて一般化することを学習するなど、驚くべき量の進歩をもたらした重要な要素の 1 つです。 π0.7と呼ばれる最近のモデルは、これまでエアフライヤーを使用したことがなかったにもかかわらず、人間による段階的な口頭指示でサツマイモをエアフライヤーで調理することができました。
レビンは、この 2 年間の身体的知性の進歩の速さに驚かされました。 「実際、私たちが思っていたよりもはるかに早く過ぎました」と彼は言います。
他の企業も注目している。 Amazon や Google DeepMind などのより確立された企業だけでなく、数十億ドル規模のスタートアップ企業の多くも、独自の汎用ロボットの開発に取り組んでいます。
これまでのところ急速な進歩にもかかわらず、この分野がどの程度の速度で進歩するかを予測することは困難です。ご存知のとおり、OpenAI や Anthropic などの AI 企業の進歩は速いですが、ロボット企業の進歩は遅いことがよくあります。ロボット研究者なら誰でもモラベックのパラドックスに精通しているだろう。コンピューター科学者のハンス・モラベックは1988年に、ロボットがチェスのようなゲームをマスターしたり、IQテストで高得点を獲得したりするのは簡単だが、「知覚や運動能力に関しては1歳児のスキルをロボットに与えるのは困難または不可能である」ことに気づいた。
ポズナー氏によると、Physical Intelligence が自社のロボットを実世界で使用できるように準備するためにどれだけのデータが必要になるかはまだ明らかではないという。 「現時点では、何か興味深いことが起こるかもしれない初期の兆候にあると言えますが、これが本当に取るべき道であるかどうかは別の問題です。」
同氏は、ユーザーがロボットを限界まで追い込むこともあり、現実世界での成功はまだ遠いと考えている。 「人間は敵です。彼らはロボットをいじるのが好きです。それが楽しいからです」とポズナー氏は言う。 「これらのことが、実際に儲かるビジネスモデルで、間もなく大規模に導入されると思いますか? いいえ、絶対にそんなことはありません。それを信じるのは非常に困難でした。」
主題: