Agentic AIでGPU一強時代は終わる？再注目されるCPUとメモリ・ストレージ・サーバーの新相場

Contents

1 なぜ今「CPU」が再評価されているのか
2 Agentic AIとは何者か（ざっくり整理）
3 GPUだけでは回らない理由：CPUの3つの役割
4 1. オーケストレーション（エージェントの司令塔）
5 2. データ前処理・後処理・RAGの土台
6 3. 大容量メモリ（DRAM）とKVキャッシュの管理
7 「CPU：GPU = 1：4」から「1：1、あるいはCPU優位」へ？
8 メモリ・ストレージ・ネットワークにも波及する
9 DRAM：コンテキスト長と「記憶」の拡大
10 NANDフラッシュ（SSD）：RAGとログの吹き上がり
11 ネットワーク：エージェントがクラスタ全体を飛び回る
12 サーバーベンダーのターン：DELLがなぜ注目されるのか
13 AIサーバー売上が急拡大
14 なぜDELLなのか（個人的な視点）
15 投資家としてどう付き合うか（あくまでスタンスの話）
16 おわりに：AIはますます「総合格闘技」に

なぜ今「CPU」が再評価されているのか

少し前まで、「AI相場＝GPU相場＝NVIDIA一強」というシンプルな図式でした。
ところが、2026年に入ってからは「Agentic AI（エージェント型AI）」というキーワードとともに、CPU需要が最大4倍に膨らむ可能性があると指摘するレポートが次々と出てきています。

ポイントはここです。

旧来：チャットボット中心の「一問一答AI」
これから：自律的に情報を集め、ツールを叩き、タスクを完了させる「Agentic AI」

前者は、ほぼ 行列演算＝GPUの独壇場 でしたが、後者は
「考える（LLM）」＋「動く（ツール実行・APIコール・ファイル操作）」のセットになり、後半の「動く」部分はどうしてもCPUが担当せざるを得ません。

Agentic AIとは何者か（ざっくり整理）

ここで一度、Agentic AIをざっくり定義しておきます。

LLMが自分で「計画を立てる」
必要に応じてWeb検索・DBクエリ・コード実行・外部APIを呼ぶ
結果を読み、タスクを分解しながらゴールに向かって粘り強く動く

例えば、

「この企業の決算書を読み込んで要約して、株価チャートと合わせてブログ草案を書いて」と頼む
→ LLMが決算PDFをダウンロード
→ RAGで重要部分を検索
→ Pythonで簡単なチャートを描画
→ それらを組み合わせて文章を生成

この一連の流れの中で、「GPUが必要なのは“LLMで文章を生成している部分”だけ」で、それ以外の ファイルI/O、HTTPリクエスト、プロセス管理、エラー処理 などは全部CPU側で回ります。

エンジニアの感覚で言うと、

「GPUはカーネルの中だけが仕事。
それ以外のホスト側の仕事が、一気に太った」

という感じに近いと思います。

GPUだけでは回らない理由：CPUの3つの役割

Agentic AI時代にCPUが担う役割は、大きく分けて3つあります。

1. オーケストレーション（エージェントの司令塔）

マルチエージェント間のメッセージング
ワークフローエンジン（どの順番で何を呼ぶか）
リトライ・タイムアウト・エラーリカバリ

これは全部「制御フロー中心」の処理で、GPUの得意なSIMD型の並列演算とは真逆の世界です。
OSのスケジューラに近い仕事なので、必然的にCPUが担当することになります。

2. データ前処理・後処理・RAGの土台

テキスト前処理・トークナイズ
Embeddingの検索（ベクトルDBへの問い合わせ）
PDF・ログ・コードベースなどのインデックス更新

RAG（検索拡張生成）を本格的に使い始めると、LLM本体の前後にかなり多くの処理がぶら下がります。
この「周辺ロジック」の多くもCPU・メモリ・ストレージ側で回り、GPUはあくまで“途中で呼ばれる一個のアクセラレータ”という位置づけになっていきます。

3. 大容量メモリ（DRAM）とKVキャッシュの管理

長いコンテキストを維持するためのKVキャッシュ
複数エージェント間でのステート共有
メモリページングとルーティング

データセンター向けのレポートでは、Agentic AIの普及で「データセンターのCPUコア数やDRAM容量は、従来のクラウドより数倍規模で必要になる」と分析されています。
GPUのHBMは帯域は凄いが容量が限られるため、最終的には「CPU＋大容量DRAM」がコンテキストとステートの置き場になります。

「CPU：GPU = 1：4」から「1：1、あるいはCPU優位」へ？

Morgan Stanleyなどのレポートでは、Agentic AIへのシフトによって「データセンターのCPU需要は2030年までに最大4倍に増える」と試算されています。
別の分析では、Agenticワークロードでは「GPU1台あたりに割り当てるCPUコア数を増やさないと、GPUが待ち状態（アイドル）になりやすい」と指摘しています。

これまで：

典型的構成：CPU 1 ソケット＋ GPU 4〜8枚
CPUは「GPUにデータを運ぶだけ」の存在

これから：

Agentic構成：CPUとGPUは 1：2〜1：1 に近づく
ワークロードによっては「CPUノードだけ大量にぶら下がる」パターンも

実際、クラウド大手が自社設計のArm系CPU（AWS Gravitonなど）を数千万コア単位で増設し、Agentic AI向けのインフラ強化を進めているという報道も出ています。

GPUだけ増やしても、ホスト側のCPUとメモリが追いつかなければ、システム全体のスループットは頭打ちになる。
この“ホスト側のボトルネック”が、まさに今のCPU再評価の根っこにあります。

メモリ・ストレージ・ネットワークにも波及する

CPUが司令塔として太ると、その周辺パーツも芋づる式に重要になります。

DRAM：コンテキスト長と「記憶」の拡大

長コンテキスト（数十万トークン級）を使ったLLM
複数エージェントが同じドキュメント群を共有
履歴・ワークスペース・中間結果を保持

こうした動きから、「Agentic AIはデータセンターのメモリ需要（DRAM）を構造的に押し上げる」とするレポートも出ており、サーバーDRAMの価格や需要動向が注目されています。

NANDフラッシュ（SSD）：RAGとログの吹き上がり

PDF・コード・ログ・ナレッジベースなどのインデックスを永続化
推論ログやトレース情報を長期間保存
ベクトルDBやオブジェクトストレージとしての利用

「Agentic AIが“計算力”だけでなく“ストレージ”も一級市民に押し上げた」という指摘もあり、NANDベンダーやエンタープライズSSDのポジションも変わりつつあります。

ネットワーク：エージェントがクラスタ全体を飛び回る

マイクロサービス化されたツール群へのアクセス
マルチノード・マルチGPU構成でのパラメータ・KV同期
ストレージクラスタとの高速接続

ここはInfinibandや高速イーサ（800Gクラス）などの世界になりますが、「GPU間の通信」だけでなく「CPUノード間の協調」も重要になり、ネットワークファブリック全体の設計が問われてきています。

サーバーベンダーのターン：DELLがなぜ注目されるのか

ハードとしては、「CPU・GPU・メモリ・ストレージ・ネットワーク」を全部まとめて、ちゃんと冷やしてちゃんと動く箱 にするのがサーバーベンダーの仕事です。
この領域で、ここ最近存在感を増しているのがDELL（デル・テクノロジーズ）。

AIサーバー売上が急拡大

生成AI向けのサーバー需要が急増し、DELLのインフラ部門はここ数年で大きく伸びています。
2024年時点で「生成AI商用化の波に乗るDell AIサーバー売上は、かつてのVMwareビジネスに匹敵するレベル」とまで評されています。
最近の分析では、DELLはAIインフラ領域で「ハードウェア会社」から「インフラ・ソリューションの大手」へとビジネスモデルを変えつつあると指摘されています。

なぜDELLなのか（個人的な視点）

普段から半導体やAIインフラ関連のニュースを追っていると、どうしても「GPU」「最新プロセス」「HBM」といったキラキラしたワードに目が行きがちです。
でも実際にデータセンターでラックを組んで冷やして電源を引き回すとなると、一気に“泥臭い世界”になります。

ラックあたりの電力上限
冷却方法（空冷か液冷か）
メンテナンス性・保守体制
GPUだけでなくCPUやメモリ構成のバランス

こういう「現場目線の総合設計」ができる企業が、Agentic AI時代の勝ち組として浮上してきている。
そう考えると、「DELLじゃね？」という直感はかなり筋が良いと感じています。

投資家としてどう付き合うか（あくまでスタンスの話）

ここまでテクノロジー寄りで書いてきましたが、読んでくださっている方の多くは「じゃあどこに注目すればいいの？」という視点も気になると思います。
個別銘柄の推奨はしませんが、構造だけ整理するとこんな感じのレイヤーに分かれます。

レイヤー	代表例	Agentic AIでの位置づけ
GPU/アクセラレータ	NVIDIAなど	大型モデルの学習・推論の心臓部。
CPU（x86/Arm）	Intel, AMD, Arm系クラウドCPUなど	エージェントのオーケストレーションとメモリ管理の中核。
メモリ	DRAMベンダー	長コンテキストと多エージェントの“ワーキングメモリ”。
ストレージ	NAND/SSD, オブジェクトストレージ	RAGやログ・ナレッジの“長期記憶”。
サーバー／システムインテグレータ	DELL, HPE, Supermicroなど	すべてをまとめてデータセンターに持ち込む「箱＋ソリューション」。

僕自身、ニュースを追いながら「GPUだけ見ていると、だいぶ世界が狭く見えていたな」と感じることが増えました。
Agentic AIが広がるにつれて、CPU・メモリ・ストレージ・サーバーという“一見地味だったパーツ”たちが、再び主役級の扱いを受け始めているのを肌で感じます。

おわりに：AIはますます「総合格闘技」に

Agentic AIの文脈でCPUが再評価されている話を書いてきましたが、裏を返せば「AIインフラ＝総合格闘技」になってきたということでもあります。

どのGPUを何枚積むか
それを支えるCPUをどのアーキテクチャにするか（x86かArmか）
どの程度のDRAMとSSDを積み、どんなネットワークでつなぐか
それをどのベンダーのサーバーで、どう冷やすか

こうした選択の積み重ねが、最終的には「エージェントの賢さ」「レスポンスの速さ」「運用コスト」に直結します。

投資家としてニュースを追いかけていると、どうしても目先の株価や決算の数字に振り回されがちですが、
一歩引いてこの「技術の地殻変動」を眺めてみると、AI相場はまだまだ面白いフェーズが続きそうだな、と改めて感じています。

Agentic AIでGPU一強時代は終わる？ 再注目されるCPUとメモリ・ストレージ・サーバーの新相場