2012 年、米国国防高等研究計画局は DARPA ロボティクス チャレンジ (DRC) を発表しました。数年にわたり、数百万ドルをかけた災害ロボット競技会では、ボストン・ダイナミクス社のアトラス、第一世代の有用な人型ロボットの一つによる驚くべき瞬間、そして永遠に残る失格ビデオがもたらされました。
コンペティションのアーキテクトであるジル・プラットは、DRC がロボット工学に対して何をしようとしているのかを非常に明確に理解していました。 “理由 [for the DARPA Robotics Challenge] 実際にこの分野を前進させ、その機能を現実のものにしています」とプラット氏は語った。 IEEEスペクトル 当時、彼は、2004 年の DARPA のグランド チャレンジと 2007 年の DARPA のアーバン チャレンジの前には、複雑な環境向けの無人運転車は基本的に存在していなかった、と述べました。彼は、DRC がロボット工学に関して同じことを行っているのを見ました。
DARPA ロボットチャレンジの終了から約 10 年が経過し、業界の多くの人は、人型ロボットがプラット氏が予測したような変革の瞬間を迎えようとしていると信じています。しかし、ロボット工学ではよくあることですが、物事は見た目よりもはるかに困難になる傾向があります。 スペクトラム 彼は、現在トヨタ・リサーチ・インスティテュート(TRI)のCEOであるプラット氏と対談し、何が人間のロボット工学を妨げているのか、これらのロボットが何をすべきか(あるいはすべきでないか)、そして人間の誇大宣伝バブルをどう乗り切るかについて尋ねた。
私たちが今直面しているロボット工学の瞬間についてどう思いますか?
ギル・プラット: 変わったのは実は人間のキャラクターではありません。長い間、多くの人が人型研究ロボットを構築してきました。今違うのは体ではなく心です。私たちはロボット工学において常にこのギャップを抱えていました。そこでは、私たちが構築したメカニズムは信じられないほど有能でしたが、ロボットの実用性をその可能性に匹敵させる手段が実際にはありませんでした。今、私たちは本当にそうしています。それはここ数年で起こった AI 革命のおかげです。
10 年を振り返って、現在商用ヒューマノイドで起こっていることの多くは DRC のおかげであると直接評価したくなります。何か理由はありますか ない やりますか?
NASA の初期バージョンの Valkyrie DRC ロボットと一緒にポーズをとるギル・プラット。ギル・プラット
プラット: いや、でも謙虚でありたいと思っています。 DRC は、半分は自律性、もう半分はリアルタイムでの遠隔操作に重点を置きました。遠隔監視があり、遠隔地にいる人がロボットに何をすべきかを指示している間、リアルタイムでタスクを処理するためにその監視を強化する半自律性がありました。これらはすべて、最近の AI の躍進以前のことです。
今変わったのは、コードを書く必要のない方法で実際にロボットに何をすべきかを教え、有能にする方法があるということです。代わりに、ロボットにタスクをデモンストレーションするだけで済みます。十分なデータと新しい AI 手法があれば、ロボットはこれまでよりもはるかに優れたパフォーマンスを発揮できるようになります。
しかし、このデータがボトルネックになりますよね?何を構成すべきか、ロボットに確実に何かをさせるのに十分な量はどのくらいかをどうやって知るのでしょうか?
プラット: これは、大規模な言語モデルで進行中の議論を正確に反映しています。 [LLMs]。過去の単語に基づいて次の単語が何であるかを推測する自己回帰予測変数である LLM を使用し、幻覚を解決するためにさまざまな方法で修正すれば、最終的には AI システムを信頼できる点に到達できると信じている人もいます。他にも、ジャン・ラクンが一番有名だと思いますが、それはナンセンスであり、何か他のことが必要だと言っている人たちがいます。彼の見解は、私も同意しますが、世界的なモデルが必要だということです。 AI システムが想像し、物事を試し、実際に応答するための何らかの方法が必要です。
そして、私たちは本質的にパターン マッチング システムであるものに「理由」のような言葉を適用していることを知っています。 「ロジック」があると言うのは、私たちが構築したものすべてにステッカーを貼っているだけです。これは正しい推論ではありません。
これは一例です 「システム 1」と「システム 2」 考えていますよね?
プラット: はい。 1 つのシステムは、私たちが持つ素早い反射的思考であり、これは現在の LLM が行うパターン マッチングの一種です。 2 番目のシステムは、想像力と世界モデルを含む遅いロジックです。それは私たちがまだやっていないことです。システム 1 の進歩は目覚ましいですが、第 2 のシステムはまだありません。システム 1 を修正してシステム 2 にしようとする試みは、水で満たされた風船を絞ろうとするようなものです。片側を押すと反対側から水が出てきます。あるものを修正しても他のものが壊れ、全体的なパフォーマンスがそれほど向上しないことに常に驚かされます。
TRIではこの問題にどのように取り組みましたか?
プラット: 2 年前、私たちは拡散政策を考案し、その後、私が大規模行動モデル (LBM) と呼ぶものを考案しました。これには、多くのタスクで 1 つのモデルをトレーニングし、各タスクを追加すると実際に他のタスクに役立ち、所定のパフォーマンス レベルに達するために必要なトレーニング データの量が削減されることを示すことが含まれます。これらは驚くべきシステムの進歩でした。
画期的な進歩は、拡散をロボットの動作に適用できることに気づいたときに起こりました。私たちは、内向きの見方から外向きの行動までの行動空間での活動が驚くほどうまく機能することを発見しました。それがこの分野全体を動かし始めました。それ以来、私たちが目にしたロボット工学のデモンストレーションはすべて、その目的を達成するために何らかの形の普及政策を使用していると思います。しかし、繰り返しになりますが、これはシステムのパターン マッチングの 1 つであり、「世界をこのように見ている場合、私は世界に対してこのように行動する」というものです。このロボットは、手作業でコーディングする従来のロボット工学とは異なり、想像し、考え、計画を立てません。ただ反応しているだけです。
ただし、自動運転の困難で見てきたように、システム 1 のパターン マッチングは現実世界では頻繁に機能しません。
プラット: 10 年前、TRI が最初にスタートしたとき、ほぼ全員が自動運転はすぐそこまで来ていると言っていました。
10 年後、私はそこに到達していると思います。残りの疑問はビジネスです。ハードウェアのコスト、保険、サポートはいくらですか、経済的に合理的ですか?必ずしもそうとは限りません 解決しました 自動運転ですが、私たちのソリューションはバックアップに人間を使用しているため、十分に優れています。自動運転車両が二重駐車の車にはまってしまうと、彼は自宅に電話し、システム 2 の判断を担当者に求めます。他のロボットでもできると思います。ほとんどの場合、彼らは自分たちで仕事をしますが、時には手を挙げて手伝ってくれることもあります。
自動運転車をかろうじて適合させているのであれば、なぜ脚のような構造要素にこれほど注意を払うのでしょうか?
プラット: 私たちは身体に物理的な利点を持たせて世界を構築しました。ロボットがこの世界で成功するには、これらの利点を活用する何かが必要です。フォームが同じなので模倣学習も効きやすいです。そして脚は特定の環境に適しています。車輪で新しい支点に転がるよりも早く、障害物を乗り越えてバランスを取ることができます。そうは言っても、足が常に最も実用的なものであるとは限りません。車輪に最適な平坦な環境である工場において、脚式ロボットにこれほど注目が集まっているのは非常に奇妙だ。
人間ロボット工学の誇大宣伝に対処する
脚のあるデモイドにつぎ込まれている資金はロボット工学にとって良いことだと思いますか?
プラット: それには利点と危険性の両方があります。ロボット工学の分野にこれほど多くのリソースがあるのは素晴らしいことですし、何か特別なことが起こったと思います。物事は以前とは異なりますが、人間がロボットに物事のやり方を教えることを考えると、非常に多くの可能性があります。
東京ジブリ美術館の屋上でロボットを鑑賞するギル・プラット。ギル・プラット
人間はロボットにどのようなことを教えるべきでしょうか?
プラット: TRIでは10年間、社会と高齢化について考えてきました。それは単なる身体障害ではありません。それは孤独と目的の喪失に関するものですが、これらはより一般的な(そしてはるかに悪い)問題です。そこで問題は、人々が若く感じられるようにするために技術的に何ができるかということです。
TRIでは、人間の指導を受けるロボット「セラピストロボット」の研究を行っています。私たちは与えることが大好きで、助けることが大好きな生き物に進化してきました。デモでマシンをプログラムし、そのマシンが他の人を助けることになると、目的意識を感じます。私たちは、ロボットは物理的だけでなく心理的にも生活の質を向上させる双方向の役割を果たすことができると考えています。
10年前にTRIを始めたとき、私はあなたに何に注力するのかと尋ねました。あなたの答えは私にとても印象に残りました。「私たちには選択の余地がない」ため、高齢者のケアと答えました。
プラット: はい。日本と米国の統計は悪化の一途をたどっており、 しないでください 選択肢はあります。高齢化社会は若者に大きな影響を与えるということを忘れてはいけません。これは依存率、つまり、労働力の中で若すぎて働けない人々と、若すぎて働けない人々の両方をサポートしている若者が何人いるかを意味するためです。これらの数字はますます悪化しています。
どうやって解決しますか?
プラット: 私たちはシステム 1 でいくつかの驚くべき進歩を遂げてきましたが、誰かがシステム 2 で画期的な進歩を遂げない限り、ロボットがそれほどのことを行うわけではありません。あるいは、人間がシステム 2 のある程度の監視制御を提供するシステムがある場合。
このような人間の監視は、私たちを再びコンゴ民主共和国に連れ戻してしまいますね。
プラット: [Laughs] まさにその通りです!ほら、DRC を褒めるなとは言わないよ…「ロボットのウッドストック」って言ってる人もいたけど、心が温かくなった、すごくかっこよかった!
それで、10 年が経ち、今の人型ロボット工学の誇大宣伝の度合いについてどう思いますか?
プラット: 私たちは、人間の膨らんだ期待のピークに近づいています(そう願っています!)。それは、1 つのシステムと 2 つのシステムの問題について十分に深く考えている人がいないからです。
現在、当社の物理 AI システムはパターン マッチングのみを行っています。彼らは信じられないほど有能で、その優れた点には驚かされます。私たちはそれをとても誇りに思っています。そして、大規模な行動モデルを使用して多くのタスクからの学習を集約することは、非常に効果的であると私たちは信じています。しかし、それはまだシステム 2 ではありません。過剰な約束がたくさんあり、それが私たちを堕落へと導くので、とても悲しいことです。私が心配しているのは、その後に起こる幻滅の谷です。
人間の誇大宣伝が爆発する中、ロボット工学におけるこのクラッシュをどうやって避けることができるでしょうか?
プラット: 現時点ではバッファが必要です。制御システムでは、ダンピングを追加することで不安定なシステムを安定させます。報道機関と学術界は、私たちが人間デモイドで現在見ていることが完全に論理的ではないことを皆に思い出させることで、リード報酬を追加することができます。
また、自動運転の分野はバブル崩壊を経験しましたが、誇大宣伝と粘り強さを維持して生き残ったのはほんの少数の企業だけだったということも忘れてはなりません。ここでもそうすべきだと思います。
ウェブサイトの記事から
ウェブ上の関連記事