
学者のグループがオープンソースのロボット工学ハードウェアを作成し始めたとき、ロボット工学者の世代は何年もの人生を取り戻しました。現在、より大きな課題はロボットに思考させることであり、それもオープンソースになり始めています。
この変化はまだ初期段階にあるが、Hugging Face、Nvidia、Alibaba などの企業はいずれも、過去 2 年間でオープンソースのロボット工学に大きな賭けをしており、ロボットに応答、決定、行動させるというより高いレベルで機能することを目的としたツールやモデルをリリースしている。
他の AI アプリケーションを加速させてきたオープンソースの動きは、現在、ロボットをより賢くするという問題にも適用されています。 オープンソース プラットフォームを通じてロボット工学に人工知能を導入するこうした試みが成功すれば、有能なロボットの構築に対する障壁は、AI アプリケーションの構築に対する障壁と同じくらい急速に低くなる可能性があります。
世界が ROS を構築した
オープンソースのロボティクス ソフトウェアは 1990 年代半ばから存在しており、カーネギー メロン大学のプロセス間通信スイートや 2000 年代初頭の Player プロジェクトなどの初期プロジェクトが基礎を築きました。しかし、これらは特定の研究グループに関連付けられていることが多く、この分野は断片的なままでした。
ロボット オペレーティング システムである ROS は、2007 年に初めて登場したときにこの状況を変えました。ツールを統合し、より多くのユーザーを引き付けることにより、事実上の標準になりました。オープンソースのロボット工学の物語は、さまざまな意味でそこから始まります。
ROS はその名前にもかかわらず、実際にはオペレーティング システムではありません。代わりに、これは Linux の上に位置し、コンポーネント間のデータの受け渡し、ハードウェアとの通信、マップの構築、軌道のプロット、データのログ記録や視覚化などの開発者ツールのサポートなどのロボットの基本を処理するソフトウェア フレームワークです。 ROS が登場する前は、各ロボット工学チームがこのインフラストラクチャを自分たちで作成していました。研究室が本当に関心のある研究に着手できるようになるまでに 1 ~ 2 年かかることもよくありました。
2000 年代半ばに ROS の構築を支援したブライアン・ガーキー氏は、オープンソースがすでに世界を大きく変えているため、このプロジェクトに惹かれたと述べ、インターネットのほぼ全体がオープンソース上に構築されていると指摘しました。
「私はツールを構築していますが、できる限りオープンにすべてを共有したいと考えています。構築したものから最も大きな影響が得られるのはそこだと思うからです」と、Open Robotics 取締役会長であり、現在は Google のロボット工学および人工知能部門である Intrinsic で CTO を務める Gerky 氏は述べています。
開発中、AI コミュニティはほぼ同じアプローチを採用し、研究、モデル、データをオープンに共有し、この分野はほとんど誰もが予測していたよりも速く加速しました。現在、その進歩の一部はロボット工学にもたらされています。
ロボティクス向けのオープンソース AI
Nvidia のロボット製品マネージャーの Spencer Huang 氏は、かつては難しい問題だったコンピューター ビジョンが、わずか数年で劇的に進歩したと語ります。かつては高度な専門知識が必要であった作業が、数行のコードで実行できるようになりました。シミュレーション ツールはトレーニングに役立つほど正確になり、かつては専門の研究室が必要だったツールへのアクセスが、現在では広く利用可能になり、その多くはオープンソースになっています。
「ロボット工学に携わるのに、もはや博士号は必要ありません」と彼は言います。その結果、貢献できる人々のプールがはるかに大きくなり、この分野は専門分野というよりも、誰でも構築できるプラットフォームのように見え始めます。
Nvidia は、開発パイプライン全体をカバーするオープンソースのロボティクス スタックを構築しました。コスモス ワールド モデルは合成トレーニング データを生成し、物理環境をシミュレートします。 GR00T モデルは、ロボットに複雑なタスクを推論して実行する能力を与えます。そして、彼女の Yitzhak フレームワークは、トレーニング、シミュレーション、展開を結び付けるオーケストレーションを処理します。誰もがロボットを一から訓練する必要があるわけではなく、おそらくほとんどの人はそうではない、とフアン氏は言う。
「事前トレーニングを想定していると、この分野は決して成長しません」と彼は言います。 「誰もが利用して自分の目的に合わせて調整できる、事前にトレーニングされた高品質のモデルを提供できるはずです。」
Nvidia のすべてのオープンソース モデルは、モデルとデータセットを共有するためのデフォルトの場所となっているオープンソース AI プラットフォームである Hugging Face 上に存在します。ハギング フェイスは、2024 年 5 月に人工知能ロボットのコミュニティ プラットフォームである LeRobot を立ち上げました。その立ち上げ以来、プラットフォーム上のロボット データセットの数は、2024 年末の 1,145 から現在では 58,000 以上に増加し、センター内で最大のデータ カテゴリとなっています。
ハグ・フェイスはハードウェア分野にも参入し、ロボット工学会社ポーレン・ロボティクスを買収した。 Hugging Face の CEO である Clement Delange 氏によると、この購入はソフトウェアだけでは十分ではないという理解から来ました。ソフトウェアの場合と同様、目標はより多くの人を呼び込むことでした。
LeRobot への貢献者には、業界の著名人、学術研究機関、余暇にロボットを製作する趣味人などが含まれます。たとえば、アリババは今年初めに、物理人工知能のオープンソースの基本モデルである LynnBrain をリリースしました。これは、同社がベンチマークで Google や Nvidia の同様の製品よりも優れていると主張しています。デラング氏は、このようなさまざまなプロジェクトが重要であると述べています。
「それは単なる 1 つのモデル、1 つのデータセット、または 1 つのハードウェアではありません」と彼は言います。 「誰もが参加できる小さな貢献がたくさんあるのです。」
商業的インセンティブが現場を混乱させる
デラング氏は、その利害は利便性を超えていると言う。少数の独自システムだけが家庭内のロボットを制御している世界は憂慮すべき世界です。 「自分がよく理解していない、実際には制御できない、シリコンバレーの一部の人々が制御しているロボットが家の中にあるというのは、恐ろしいことです」と彼は言う。 「オープンソースは代替手段を提供します。」
しかし、そこに到達するのは簡単ではありません。オープンソース現象は現在、ROS を生み出したものとは異なっているように見えます。ROS は主に、結果に商業的な利害関係を持たずに研究者が自分たちの研究をプールすることから生じました。現在、最も貢献しているのは、より多くの人に自社のプラットフォームを構築してもらいたいという明確なビジネス上の理由がある企業です。それは必ずしも悪いことではない、とオレゴン州立大学コーバリス校のビル・スマート教授は言う。彼は初期のオープンソースロボット工学コミュニティの一員だった。ただし、インセンティブについては注意する必要があります。
同氏はまた、参入障壁の低さにはマイナス面があるのではないかと懸念している。ロボット工学の背景がない AI 出身の研究者が、その分野ですでに解決されている問題を解決することがあります。初心者は、数十年前の技術を使用すれば、同じタスクを数行のコードで実行できることを知らずに、ロボットの手をある点から別の点に移動させるニューラル ネットワークのトレーニングに 1 週間を費やすかもしれません。インセンティブは、常に同じ進歩の方向を向いているわけではありません。
しかし、賢者は絶望的なわけではありません。オープンソースの背後にある動機が何であれ、その影響は本物だと彼は言います。これまでよりも多くの人々がこの分野に携わっており、ツールは非常に使いやすくなり、コミュニティは ROS が始まったときに存在していたものよりも大きく、より多様性に富んでいます。
「今では誰でもロボットを動かすことができるようになりました」と彼は言います。 「ベテランの技術者として、私はもう特別ではないので、嬉しくもあり、悲しくもあります。」
ウェブサイトの記事から
ウェブ上の関連記事