大規模な導入では、導入されたコンピューティングの量ではなく、データがどのように管理されるかによって、AI が持続的なビジネス価値を提供できるかどうかが決まります。近年、AI インフラストラクチャは、GPU、CPU、メモリ、パフォーマンスなどのコンピューティングによって定義されています。
目標が単純にモデルを大規模に動作させることだった初期の段階では、これは理にかなっていました。しかし、AI システムが本番環境に移行するにつれ、その見方は変わり始めています。
WD の EMEAI 向けプラットフォームのビジネス マネージャー。
変化は処理能力の向上だけではありません。重要なのはデータの規模であり、さらに重要なのは、そのデータが時間の経過とともにどのように動作するかです。再利用可能なコンピューティングインフラとは異なり、データはリセットされません。これは複雑であり、トレーニングの実行、推論、相互作用のたびに増大し、時間の経過とともにシステム自体を定義し始めます。
この変更は重要な意味を持ちます。製造業における AI 環境の進化を見ると、AI 環境はもはやコンピューティング システムのように動作しません。これらはデータ システムのように動作するため、設計、運用、拡張の方法が変わります。
コンピューティングサイクルからデータライフサイクルまで
AI システムが実験を超えて移行すると、明らかな違いが現れ始めます。コンピューティングは一時的なものである一方で、データは継続的に増加しています。トレーニングの負荷は拡大したり減少したりしています。インフラストラクチャはさまざまなタスクで再利用されます。時間の経過とともに効率が向上し、同じコンピューティング リソースでより多くの出力を提供できるようになります。
ただし、データの動作は大きく異なります。
各推論では、ログ、メタデータ、中間出力などの新しいデータが作成され、多くの場合、これらのデータを保存する必要があります。 AI によって生成された単一の出力であっても、出力自体と同様のサイズの運用データが生成される可能性があります。大規模になると、この蓄積は偶然ではなく構造的になります。
従来のシステムは、どのデータを保持するかを人間の判断に依存していました。 AI システムはその逆を行います。データは将来の価値を伴うため、保持されます。シグナルとコンテキストの組み合わせにより、継続的な改善がもたらされ、システムが過去のインタラクションから学習できるようになります。
その結果、かつてインフラストラクチャーを定義していた絆が壊れてしまいます。波のスケールの計算;データは常に増加しています。それはまた、挑戦の性質を変えます。もはやモデルを効率的に実行するだけではなく、モデルの周囲のすべてを維持しています。
コンピューティングはインテリジェンスの瞬間を生み出しますが、それを長期にわたって耐久性と再利用可能にするのはデータです。
収納するものにも変化があります。トレーニング データセットを超えて、システムに組み込まれたデータ出力、実装、ログ、組織的知識の層が急速に成長しています。この層は見落とされがちですが、実稼働環境におけるスケーリングの主な課題になりつつあります。
ここでストレージが重要になります。最新の AI インフラストラクチャは本質的に多層構造になっています。高パフォーマンス層はリアルタイムのワークロードをサポートし、容量が最適化された層は増大する保存データを保存します。大規模化すると、単一層ストレージのアプローチはすぐに非効率になります。レイヤード設計は、パフォーマンス、コスト、耐久性のバランスをとるために不可欠です。
インフラストラクチャ モデルが破綻する場所
AI インフラストラクチャ設計における一般的な前提は、ストレージはコンピューティングに比例して拡張する必要があるということです。導入の初期段階では機能しますが、運用環境では信頼性がますます低くなります。
その理由は、根本的に異なる成長パターンにあります。コンピューティングへの投資は一時的なものであり、さらなる効率化を妨げます。一方、ストレージは、データの増加、保持ポリシー、ガバナンスの要件に応じて継続的に拡張します。時間が経つにつれて、それが主要なコスト要因になります。ストレージを二次的なものとして扱う場合、2 つの課題が生じます。
まず、建築上のギャップ。ストレージは下流にありますが、耐久性と長期的な可用性を担っています。二つ目は、経済格差です。コストはハードウェアの更新サイクルではなくデータの蓄積に応じて増加するため、規模が大きくなると総所有コストが主要な懸念事項になります。
これらの問題は、多くの場合、徐々に現れます。システムは最初はうまく動作するかもしれませんが、データ量が増加するにつれてストレスが生じ始めます。これは、コンピューティングの制限によるものではなく、データ層が拡張するように設計されていないためです。
この時点で、パフォーマンスの定義が変わり始めます。
大規模なデータに対応した設計
AI 環境では、パフォーマンスはもはや速度だけではありません。可用性、耐久性、回復力が重要です。データに確実にアクセスできない場合、利用可能なコンピューティング能力の量に関係なく、システムは機能できません。
したがって、耐久性と堅牢性が重要な設計要件になります。 AI の規模では、失敗は例外ではなく、継続的な状態です。システムは、パフォーマンスや信頼性に影響を与えることなく、継続的な外乱を吸収するように設計する必要があります。
それはパフォーマンスそのものの理解の仕方を変えます。単一のコンポーネントに関連付けられることはなくなりました。むしろ、それは分散アーキテクチャ全体でデータが保存、送信、管理される方法に由来します。
業界が現在目の当たりにしているのは、より広範な移行です。人工知能は実験環境から継続的な運用システムに移行しつつあります。この段階での仮定が長期的な結果を形成します。
この移行をうまく乗り越えた組織は、AI データセンターがコンピューティングだけでなくデータによって拡張されることを認識するでしょう。彼らは、データの作成から保存までのライフサイクル全体を中心にインフラストラクチャを設計し、システムが成長、コスト効率、長期的な信頼性をサポートできることを保証します。
前向きなアプローチも必要です。インフラストラクチャの決定は、現在の要件だけでなく、3 ~ 5 年後のデータ資産の状況を反映する必要があります。システムが大規模に展開されると、基本的な選択を再検討することは複雑になり、費用もかかります。
コンピューティングは今後も AI の画期的な瞬間を定義し続けます。しかし、これらの瞬間を保存し、構築できるかどうかはデータによって決まります。この意味で、成功する AI インフラストラクチャの決定的な特徴は、コンピューティングのパフォーマンスだけではありません。
これは、長期にわたってデータを効率的に管理する能力であり、データセンター内のストレージを基本的なものとして扱い、アーキテクチャを本質的に階層化したものとして扱い、データの保存、アクセス、使用の範囲に応じてスケールを扱います。
最適なAIツールを導入しました。
この記事は年に作成されました TechRadar プロの視点今日のテクノロジー業界で最も優秀な人材を紹介するチャンネルです。
ここで表明されている見解は著者の見解であり、必ずしも TechRadarPro または Future plc の見解ではありません。寄付に興味がある場合は、こちらで詳細をご覧ください: https://www.techradar.com/pro/perspectives-how-to-submit