AIトレーニングはなぜストレージを再考すべきか：AskAIs Mini SSDの製品の起点と技術ロードマップ

人工知能のインフラと聞くと、まず思い浮かぶのはGPU、計算チップ、モデルのパラメータでしょう。ストレージは、容量が不足したり、トレーニングが中断したり、GPUがデータを待ち始めたときに、はじめて突然注目されがちです。

しかしAIシステムの速度は、計算能力だけで決まるものではありません。モデルのトレーニングはデータセットを継続的に読み込む必要があり、データパイプラインはサンプルをアクセラレータへ送り、システムは障害後の復旧のために定期的にチェックポイントを書き込む必要があります。

ストレージが十分に安定したスループットとレイテンシでこれらをこなせなければ、どれほど高価なGPUでも待たされることになります。

これこそが、Stellar AGI LabsがAskAIs Mini SSDを開発した出発点です。

同社初の公開AIハードウェア製品として、AskAIs Mini SSDはM.2 NVMe 2280規格を採用し、128GB、256GB、512GB、1TB、2TB、4TBの容量を計画しています。LLMトレーニング向けの大容量・高スループットストレージとして位置づけられ、製品は研究開発を完了し、年末に香港での発売を予定しているとしています。

ただし、「AI SSD」は名称だけで成立する製品カテゴリではありません。M.2はフォームファクタを、NVMeはプロトコルとインターフェースの方向性を、容量は保存できるデータ量を示します。AIトレーニングに本当に適しているかを決めるのは、コントローラー、NAND、ファームウェア、キャッシュ、持続性能、レイテンシ、書き込み耐久性、放熱、消費電力、互換性などです。

AIトレーニングのストレージ問題はどこで起きるのか？

大規模モデルのトレーニングは、データセット全体を一度にGPUへ入れて計算が終わるのを待つものではありません。データはストレージ、CPUメモリ、GPUメモリ、異なるノードの間を継続的に流れます。

最初の問題は、トレーニングデータをいかにGPUへ供給し続けるかです。

トレーニングでは通常、データセットを多数のサンプルやシャードに分割し、データローダーが読み込み・デコード・前処理を行い、バッチを構成してGPUへ送ります。

ストレージの供給速度が足りなければ、データローダーは次のバッチを間に合わせられません。GPUは現在の計算を終えても処理する新しいデータがなく、待機が発生します。

MLCommonsのMLPerf Storageベンチマークは、ストレージがどれだけ速くトレーニングデータを供給し、アクセラレータを少なくとも90%稼働させ続けられるかを測定します。AIストレージの価値は美しいMB/sを出すことではなく、高価な計算リソースを働かせ続けることにあると示しています。

チェックポイントも巨大なストレージ作業

モデルのトレーニングは数時間、数日、あるいはそれ以上続くことがあります。ハードウェア障害やソフトウェアエラーですべての進捗を失わないために、システムは定期的にチェックポイントを保存します。

チェックポイントにはモデルの重みだけでなく、オプティマイザの状態、学習率、乱数状態、分散トレーニング情報が含まれることもあります。モデルが大きいほどチェックポイントも大きくなります。

MLPerf Storageの公開データによれば、Llama 3のチェックポイントワークロードは8Bモデルで約105GB、1Tモデルで約18TBに及びます。

これは1枚のM.2 SSDが18TBのチェックポイントを単独で担う必要があるという意味ではなく、モデルが大きくなるほど、トレーニング進捗の保存と復旧自体が重要なストレージエンジニアリングの課題になることを示しています。

チェックポイントの書き込みでは、瞬間的なピーク速度だけでなく、安定した持続書き込みが必要です。SSDの高速キャッシュが尽きた後に速度が大きく低下すると、トレーニングノードは保存完了まで長く待つことになります。

ストレージとGPUの間のデータ経路

従来のデータ経路では通常、まずストレージからCPUのシステムメモリへデータを読み込み、その後GPUメモリへコピーします。これはCPU、メモリ帯域、PCIeリソースを消費します。

NVIDIA GPUDirect Storageは、ストレージとGPUメモリの間の直接データ経路を提供し、CPUのバウンスバッファを経由するデータを減らし、CPU負荷・レイテンシ・システム帯域のボトルネックを下げられます。

しかしNVMe SSDを購入しても、自動的にGPUDirect Storageに対応するわけではありません。互換性のあるGPU、ドライバ、CUDA、ファイルシステム、システムトポロジ、アプリケーションも必要です。

SSDはAIデータパイプライン全体の一部であり、エンドツーエンドの性能を単独で決める唯一のコンポーネントではありません。

M.2 NVMe 2280とは何か？

M.2 2280は、幅約22mm、長さ約80mmのモジュールを意味し、デスクトップ、ワークステーション、一部サーバーで一般的なコンパクトなSSDフォームファクタです。

NVMeは不揮発性ストレージ向けに設計されたプロトコルで、通常PCIe経由でホストに接続し、高い並列性と低いソフトウェアオーバーヘッドをサポートします。

しかし同じM.2 NVMe 2280のSSDでも、実際の性能はまったく異なり得ます。

SSDは通常、コントローラー、DRAMまたはホストメモリバッファ、NAND、PCB、ファームウェアで構成されます。コントローラーはFlash Translation Layer、ガベージコレクション、ウェアレベリング、データスケジューリングを担い、NAND・キャッシュ・バックエンドチャネル・電力・放熱が共に性能に影響します。

したがって、AskAIs Mini SSDの正式発表時には、PCIe世代、コントローラープラットフォーム、NANDの種類、専用DRAMの有無、各容量の完全な性能をさらに公表する必要があります。

ピーク速度はAIトレーニング速度と等しくない

多くのSSDは、NANDの一部を一時的に高速書き込み領域として使います。短時間の書き込みではテスト結果が非常に良く見えますが、キャッシュが尽きると速度はNAND本来の水準まで落ちることがあります。

通常のファイルコピーはキャッシュが尽きる前に終わるかもしれませんが、チェックポイント、データセットの整理、長時間のトレーニングログは数百GBを連続して書き込むことがあります。

そのためAIトレーニングでは、キャッシュ外の持続書き込み速度や、ドライブが50%・80%埋まった後の挙動により注目する必要があります。

AskAIs Mini SSDの正式レビューでは、空ドライブのピーク、キャッシュ容量、キャッシュ枯渇後の速度、長時間の定常性能、書き込み回復時間を併せて公表すべきです。

耐久性は短時間のベンチより重要

NANDの書き込み・消去回数には限りがあります。SSDは通常、劣化したセルを置き換え信頼性を高めるために、一部の生容量を予約します。

SSDの耐久性は一般にTBWまたはDWPDで表されます。製品が長時間のAIトレーニング向けなら、TBW、保証期間、ワークロード条件のほうが、「持続的に安定」という一言より説得力があります。

容量ごとにNAND数や書き込み分布が異なるため、128GB・1TB・4TBの各版はそれぞれTBWを公表すべきで、全シリーズで一つの数字を使うべきではありません。

M.2の利点はコンパクトさ、課題もコンパクトさ

M.2は小型で取り付けやすく、AIワークステーション、開発PC、エッジデバイスに適しています。しかし面積が限られるため、放熱と電力の余裕も制約されます。

長時間の連続読み書きはコントローラーとNANDを発熱させます。温度の閾値に達すると、SSDはハードウェア保護のために速度を落とすことがあります。

短時間のベンチではサーマルスロットリングが見えないかもしれませんが、数時間のトレーニングとチェックポイントの繰り返しでは問題が露呈し得ます。

そのためAskAIs Mini SSDは、動作温度、最大消費電力、推奨される放熱方法、持続負荷下でのスロットリングの有無を公表する必要があります。

6つの容量は異なるAIシーンに対応すべき

128GBと256GBは、OS、開発環境、モデルキャッシュ、エッジデバイスにより適しており、大規模LLMトレーニングストレージと大雑把に説明すべきではありません。

512GBと1TBは、AI学習、推論、ファインチューニング実験、ローカルのデータ前処理、中小規模のチェックポイントに向きます。

2TBと4TBは、AIワークステーション、ローカルデータセット、モデルファイル、キャッシュ、チェックポイントの一時保存により適しています。

4TBでも、大規模トレーニングクラスタのすべてのニーズを単独でカバーすることはできません。大規模システムでは通常、複数のローカルSSD、ネットワークストレージ、並列ファイルシステム、オブジェクトストレージの連携が必要です。

より正確な位置づけは、AskAIs Mini SSDをAIストレージアーキテクチャにおけるローカルの高速層として捉えることです。

AI SSDはどうテストすべきか？

最大シーケンシャル読み書きに加え、正式なテストには、ランダムIOPS、異なるキューデプス、平均レイテンシ、P95・P99のテールレイテンシ、キャッシュ枯渇後の持続書き込み、TBW、電力、温度、スロットリングを含めるべきです。

AIワークロードのテストには、PyTorchのデータローディング、異なるファイルサイズ、マルチワーカー並列、GPU使用率、チェックポイント書き込み、チェックポイント復元、複数GPUの同時アクセスを含めるべきです。

テストでは、プロセッサ、GPU、マザーボード、OS、ドライバ、フレームワークのバージョン、データ規模、ドライブの充填率、環境温度も明記すべきです。

テスト条件が完全に公開されて初めて、結果は顧客が再現し比較できます。

香港研究開発、深圳製造

AskAIs Mini SSDは香港の研究開発本部が設計を主導し、深圳市星問芯片科技有限公司が製造します。

このモデルは、香港の製品・研究開発・国際市場の能力と、深圳の成熟した電子サプライチェーンおよび製造リソースを結びつけます。

しかし「香港研究開発、深圳製造」が真のブランド資産となるには、具体的な役割分担——製品定義、PCB、信号品質、放熱、コントローラーとNANDの選定、ファームウェア調整、量産テスト、バーンインテスト、品質サンプリングを誰が担うか——を説明する必要があります。

顧客はすべての部品を同じ会社が作ることを求めてはいません。本当に重要なのは、ブランドが製品定義、品質基準、検証データ、アフターサービスの責任を掌握できるかです。

StellarはなぜAIソフトウェアからSSDへ進むのか？

Stellar AGI Labsは当初、AskAIs AIアプリ、モデル、APIから始まりました。これらのサービスを開発する過程で、チームはデータセット、モデルファイル、キャッシュ、チェックポイント、トレーニングインフラに直接触れてきました。

そのためMini SSDは、既存事業から完全に切り離された消費者向け電子機器の試みではなく、Stellarがアプリ層からモデル・API・基盤ハードウェアへ進む流れの一部です。

このルートがループを形成できれば、ソフトウェアチームが実際のAIワークロードを提供し、ハードウェアチームがそれに基づき製品を最適化し、新しいSSDが再びAskAIsのトレーニングや顧客環境で検証されます。

このソフトウェア・ハードウェアのコデザインは、汎用ベンチだけよりも差別化を生む可能性があります。

正式発表前に答えるべき問い

AskAIs Mini SSDはなお、コントローラー、NAND、PCIe世代、NVMeバージョン、DRAM、SLCキャッシュ戦略、シーケンシャルとランダムの性能、持続書き込み、TBW、温度、電力、保証を公表する必要があります。

同時に、電源喪失保護、SMART監視、ファームウェア更新、RMAの仕組みの有無、そしてどのマザーボード、ワークステーション、OSが互換性テストを完了したかも示す必要があります。

「自社開発」について、専門市場はStellarが具体的にどの部分を担い、どの部分がパートナーのソリューションを使うかにも注目します。技術の境界を明確に説明することはブランドを弱めるのではなく、信頼性を築きます。

結び：AIハードウェアは最終的にワークロードで証明される

AskAIs Mini SSDは、Stellar AGI LabsがAIアプリ、モデル、APIから基盤ハードウェアへ進む第一歩です。

その背後の判断は正しいものです。AIインフラはGPUだけではなく、ストレージも同様にデータ供給、チェックポイント、復旧時間、全体のアクセラレータ使用率に影響します。

M.2 NVMe 2280は普及した、コンパクトな製品の土台を提供し、128GB〜4TBは異なるコストと容量のニーズをカバーします。香港の研究開発と深圳の製造は、迅速な反復のための組織的条件を提供します。

しかしAI SSDはパッケージ上の3文字であってはなりません。具体的な問いに答えられなければなりません——モデルがデータを読み、進捗を保存し、障害から復旧するとき、このSSDは待機を安定して減らし、計算リソースを働かせ続けられるか？

その答えが、公開され、透明で、再現可能なテストによって証明されたとき、AskAIs Mini SSDはStellarの自立した計算・ストレージのエコシステムの真の最初の礎となります。