私たちの多くはここ数日、大統領が「文明全体」を終わらせるのではないかと心配しているが、あるシリコンバレーのテクノロジー企業は、警告なしに誤って社会を混乱させる可能性があると警告した。 全て 私たちが知っている文明。
サンフランシスコのテクノロジー企業アンスロフィックが火曜日に発表した。 そうではなかった Claude AI のスーパーブレインの新バージョンをリリースします。これは非常に強力なので、たとえ安全であっても、数時間ではなく数日でほぼすべてのコンピューター システムをハッキングする能力を備えています。
「経済、公共の安全、国家安全保障への影響は深刻になる可能性がある」とアントロピック氏は声明で述べた。
AI への懸念は新しいものではありません。私たちは、人工知能が仕事を得るのではないか、子供たちにとって本物すぎるおもちゃについて、そして私たちの一挙手一投足が大量に監視されるのではないかと心配しています。しかし、Anthropic の自社製品に関する警告は、これらの特有の問題よりも重大です。それは災害がすぐそこまで迫っているという自宅からの電話だ。それはひどいし、行き過ぎているように聞こえます、私は知っています。しかし、問題はそうではありません。
覚えているかもしれないが、アントロピック社は、米国「戦争」長官ピート・ヘグセスが取引している会社である。彼女は、クロードが監督なしで戦闘に参加し、学校で少女たちを誤爆するようなことをする可能性を望まなかったからだ。
さて、その会社は次のような恐ろしい警告を発した。この混乱を引き起こした既存のクロードは時代遅れであり、リリースしないように懸命に努力している新しいクロードよりも驚くほど強力ではない――ただし、クロード・ミトス・プレビューと呼ばれるこの新しいクロードは、すでに少なくとも一度は単独で機能しなくなっている。ちょっと待ってください。人間が対処できる実存的恐怖には限界があります。
「私たち全員が懸念すべきです」とローマン・ヤンポルスキーは、確実に人類の進路を変えるであろうテクノロジーの最新の進歩について私に語った。彼は米国を代表する AI 安全性研究者の 1 人であり、ケンタッキー州ルイビル大学の教授です。
「私たちは超汎用知能を創造しようとしている。それは全人類を脅かす」とヤンポルスキー氏は語った。
「それ以外のことはすべて無関係です」と彼は付け加え、この議論のテクノロジーに重点を置いた部分を理解していない自分を愚か者と呼ぶのはやめるよう提案した。私の単純化したアプローチは「それを説明する合理的な方法」だと彼は断言した。
それでは、どうぞ。
これは、「本当に賢いコンピューターの天才がこれを悪用する可能性がある」というシナリオでも、「全員が失業するだろう」というシナリオでも、「誤って子供たちを爆撃するかもしれない」という本当に恐ろしいシナリオでもありません。
それは、「あなたの10代の息子がそれを使って地元の学校システムをハッキングし、最小限の知識で教室を変え、誤ってカリフォルニアの電力網を破壊する可能性がある」というものだ。
あるいは、もしかしたら、私たちのことを好まない国が、アメリカ国民全員の銀行口座を流出させ、刑務所の自動ロックをクリックして開け、下水処理場を停止し、空気制御システムを乗っ取るかもしれない。それともクロード・ミトスが自分でやっているだけなのかもしれない。
たとえば、Anthropic 社は、Netflix や Sony を含む数千の企業が使用している人気のあるオペレーティング システムの 1 つをテストしたところ、Claude Mithos 氏が 17 年間検出されずに存在していた欠陥を発見したと述べました。そして、人間の指導や助けを借りずに、この欠陥を利用して、世界中のどこにいても、どのコンピュータを使用しても、オペレーティング システムを実行しているあらゆるサーバーを乗っ取る方法を独力で発見しました。
ここはちょっといじっただけですが、安全なセキュリティ システムがほとんどない場合、社会的、経済的、一般的な混乱が発生する可能性は本当に無限です。そして率直に言って、セキュリティの専門家なら誰でも、サイバーセキュリティに関して米国の最大の脆弱性の一部は地方自治体や州政府にあると言うだろう。なぜなら、奇妙なことにトップの専門家はグレートプレーンズの都市で5桁の仕事をしていないからだ。
Anthropic は独自のテストに基づいて、「1,000 を超える重大なハードウェアの脆弱性と、さらに数千の重大度の高い脆弱性」を発見できると予測しています。
これは、クラウド神話があらゆる場所で私たちのインフラストラクチャを危険にさらしていることを意味します。なぜなら、私たちのほとんどが考えたこともないようなバックドアの方法で非常に多くのことが関与しており、たった 1 つの脆弱なシステムだけで他の数百のシステムに扉を開くことができるからです。しかし、この種の AI から保護するために、これらすべてのシステムを迅速かつ強力に保護し、パッチを適用することはほぼ不可能です。
そして、それは単なるサイバーセキュリティのリスクである、とヤンポルスキー氏は言う。クロード・ミトスの能力を持つ AI を使用すれば、さらに多くの方法で飛躍を遂げることができるでしょう。
「私たちは合成生物学でも同じことが起こっているのを目の当たりにしている。化学兵器でも同じことが起こるだろう。おそらく大量破壊兵器という点では革新的なことだろう」と彼は語った。
Anthropic の名誉のために言っておきますが、この作品はその作成について警告を発し、解決策ではないにせよ、ある種のゲームプランを作成しました – プロジェクト グラスウィングと呼ばれるものだと思います。なぜなら、どんなにひどいことになっても、エキサイティングな結末を伴うスリラーのように聞こえるようにするからです。
「プロジェクト グラスウィング」は、「プロジェクト ヘッドスタート」と呼ばれたほうがよかったかもしれません。 Anthropic は Mythos を一般公開する前に、Apple、Google、Nvidia を含む約 40 社のハイテク企業に公開し、見つかった脆弱性を一般の人々が入手する前に共同で修正できるかどうかを確認しています。映画で殺人犯が被害者に15秒の猶予を与えるのと同じようなものだ。
つまり、15 秒をとって、それが本物であることを祈ります。しかし、アンスロピックも声明で述べたように、「世界のサイバーインフラを保護する作業には何年もかかる可能性がある。フロンティアAIの能力は今後数カ月間で大幅に進歩すると予想される。サイバー防御者が先を行くには、今すぐ行動する必要がある。」
そして、本当に 15 秒ありますか?クロード・ミトスさんの上司の一人は最近、インターネットにアクセスできないはずだったにも関わらず、ミトスさんからメールが届いたとき、公園で昼食を食べていたとソーシャルメディアに投稿した。研究者らはミトスに、切断された「サンドボックス」から抜け出そうとする任務を課し、それは成功した。
これは Mythos や他の AI のもう 1 つの問題です。彼らは私たちが期待することをほとんど実行せず、ルールを回避する卑劣な方法を見つけます。これまでに作成されたほぼすべての人工知能スーパーマインドは、適切な条件下に置かれると、嘘をついたり、不正行為をしたり、一般に不穏で非倫理的な方法で行動したりすることが証明されています。
最も道徳的な AI スーパーマインドの 1 つと考えられているクロードでさえ、悪い行為を行っています。 Anthropic は、これまでに作成した「最も調整されたモデル」を誇っています。これは、人間の価値観と意図を追跡するための技術ですが、「おそらく調整に関連する最大のリスクを引き起こす」ことも認めており、それは、おそらくそうではないための技術です。
したがって、少なくとも現時点では、最も倫理的な AI スーパーマインドであることは、最も倫理的な連続殺人犯であることに少し似ています。走れ、人々、走れ。
繰り返しになりますが、警告なしに私たちを世界的な混乱に陥らせなかった Anthropic (そして、その価値が何であれ、その作成物の危険性を頻繁に警告している CEO のダリオ・アモデイ) に感謝します。なぜなら、他の企業の中にはスーパー AI を社会に投げつけて、破壊が起こるかもしれないところに放置したかもしれないからです。 Mythos と同じくらい有能な AI マインドがさらに多く登場することは間違いなく、間もなく – Anthropic がこのレベルの機能を備えた最初の企業でしたが、競合他社よりも 15 秒で先を行っているだけです。
しかし、テクノロジー業界がこれらの問題を独自に解決しようとしている、あるいは解決すべきだという考えは、国民を守るために大小の政府に代わって、ばかばかしい、義務と常識の甚だしい放棄です。これはトランプ大統領が言うような支配権をめぐる競争ではない。それは自分たち自身から、そして一貫して社会的利益よりもビジネスや商業を優先しているように見える産業界のほとんどの裕福な巨人たちから自分たちを守るための競争です。
AI がすべてを変えるまで、残り 15 秒まで迫っています。今すぐ監視と規制を要求するか、テクノロジー企業に世界の運命を決めさせるかのどちらかです。