Contents
- 1 なぜ今「CPU」が再評価されているのか
- 2 Agentic AIとは何者か(ざっくり整理)
- 3 GPUだけでは回らない理由:CPUの3つの役割
- 4 1. オーケストレーション(エージェントの司令塔)
- 5 2. データ前処理・後処理・RAGの土台
- 6 3. 大容量メモリ(DRAM)とKVキャッシュの管理
- 7 「CPU:GPU = 1:4」から「1:1、あるいはCPU優位」へ?
- 8 メモリ・ストレージ・ネットワークにも波及する
- 9 DRAM:コンテキスト長と「記憶」の拡大
- 10 NANDフラッシュ(SSD):RAGとログの吹き上がり
- 11 ネットワーク:エージェントがクラスタ全体を飛び回る
- 12 サーバーベンダーのターン:DELLがなぜ注目されるのか
- 13 AIサーバー売上が急拡大
- 14 なぜDELLなのか(個人的な視点)
- 15 投資家としてどう付き合うか(あくまでスタンスの話)
- 16 おわりに:AIはますます「総合格闘技」に
なぜ今「CPU」が再評価されているのか
少し前まで、「AI相場=GPU相場=NVIDIA一強」というシンプルな図式でした。
ところが、2026年に入ってからは「Agentic AI(エージェント型AI)」というキーワードとともに、CPU需要が最大4倍に膨らむ可能性があると指摘するレポートが次々と出てきています。
ポイントはここです。
- 旧来:チャットボット中心の「一問一答AI」
- これから:自律的に情報を集め、ツールを叩き、タスクを完了させる「Agentic AI」
前者は、ほぼ 行列演算=GPUの独壇場 でしたが、後者は
「考える(LLM)」+「動く(ツール実行・APIコール・ファイル操作)」のセットになり、後半の「動く」部分はどうしてもCPUが担当せざるを得ません。
スポンサーリンク
Agentic AIとは何者か(ざっくり整理)
ここで一度、Agentic AIをざっくり定義しておきます。
- LLMが自分で「計画を立てる」
- 必要に応じてWeb検索・DBクエリ・コード実行・外部APIを呼ぶ
- 結果を読み、タスクを分解しながらゴールに向かって粘り強く動く
例えば、
- 「この企業の決算書を読み込んで要約して、株価チャートと合わせてブログ草案を書いて」と頼む
- → LLMが決算PDFをダウンロード
- → RAGで重要部分を検索
- → Pythonで簡単なチャートを描画
- → それらを組み合わせて文章を生成
この一連の流れの中で、「GPUが必要なのは“LLMで文章を生成している部分”だけ」で、それ以外の ファイルI/O、HTTPリクエスト、プロセス管理、エラー処理 などは全部CPU側で回ります。
エンジニアの感覚で言うと、
「GPUはカーネルの中だけが仕事。
それ以外のホスト側の仕事が、一気に太った」
という感じに近いと思います。
GPUだけでは回らない理由:CPUの3つの役割
Agentic AI時代にCPUが担う役割は、大きく分けて3つあります。
スポンサーリンク
1. オーケストレーション(エージェントの司令塔)
- マルチエージェント間のメッセージング
- ワークフローエンジン(どの順番で何を呼ぶか)
- リトライ・タイムアウト・エラーリカバリ
これは全部「制御フロー中心」の処理で、GPUの得意なSIMD型の並列演算とは真逆の世界です。
OSのスケジューラに近い仕事なので、必然的にCPUが担当することになります。
2. データ前処理・後処理・RAGの土台
- テキスト前処理・トークナイズ
- Embeddingの検索(ベクトルDBへの問い合わせ)
- PDF・ログ・コードベースなどのインデックス更新
RAG(検索拡張生成)を本格的に使い始めると、LLM本体の前後にかなり多くの処理がぶら下がります。
この「周辺ロジック」の多くもCPU・メモリ・ストレージ側で回り、GPUはあくまで“途中で呼ばれる一個のアクセラレータ”という位置づけになっていきます。
3. 大容量メモリ(DRAM)とKVキャッシュの管理
- 長いコンテキストを維持するためのKVキャッシュ
- 複数エージェント間でのステート共有
- メモリページングとルーティング
データセンター向けのレポートでは、Agentic AIの普及で「データセンターのCPUコア数やDRAM容量は、従来のクラウドより数倍規模で必要になる」と分析されています。
GPUのHBMは帯域は凄いが容量が限られるため、最終的には「CPU+大容量DRAM」がコンテキストとステートの置き場になります。
「CPU:GPU = 1:4」から「1:1、あるいはCPU優位」へ?
Morgan Stanleyなどのレポートでは、Agentic AIへのシフトによって「データセンターのCPU需要は2030年までに最大4倍に増える」と試算されています。
別の分析では、Agenticワークロードでは「GPU1台あたりに割り当てるCPUコア数を増やさないと、GPUが待ち状態(アイドル)になりやすい」と指摘しています。
これまで:
- 典型的構成:CPU 1 ソケット + GPU 4〜8枚
- CPUは「GPUにデータを運ぶだけ」の存在
これから:
- Agentic構成:CPUとGPUは 1:2〜1:1 に近づく
- ワークロードによっては「CPUノードだけ大量にぶら下がる」パターンも
実際、クラウド大手が自社設計のArm系CPU(AWS Gravitonなど)を数千万コア単位で増設し、Agentic AI向けのインフラ強化を進めているという報道も出ています。
GPUだけ増やしても、ホスト側のCPUとメモリが追いつかなければ、システム全体のスループットは頭打ちになる。
この“ホスト側のボトルネック”が、まさに今のCPU再評価の根っこにあります。
メモリ・ストレージ・ネットワークにも波及する
CPUが司令塔として太ると、その周辺パーツも芋づる式に重要になります。
DRAM:コンテキスト長と「記憶」の拡大
- 長コンテキスト(数十万トークン級)を使ったLLM
- 複数エージェントが同じドキュメント群を共有
- 履歴・ワークスペース・中間結果を保持
こうした動きから、「Agentic AIはデータセンターのメモリ需要(DRAM)を構造的に押し上げる」とするレポートも出ており、サーバーDRAMの価格や需要動向が注目されています。
NANDフラッシュ(SSD):RAGとログの吹き上がり
- PDF・コード・ログ・ナレッジベースなどのインデックスを永続化
- 推論ログやトレース情報を長期間保存
- ベクトルDBやオブジェクトストレージとしての利用
「Agentic AIが“計算力”だけでなく“ストレージ”も一級市民に押し上げた」という指摘もあり、NANDベンダーやエンタープライズSSDのポジションも変わりつつあります。
ネットワーク:エージェントがクラスタ全体を飛び回る
- マイクロサービス化されたツール群へのアクセス
- マルチノード・マルチGPU構成でのパラメータ・KV同期
- ストレージクラスタとの高速接続
ここはInfinibandや高速イーサ(800Gクラス)などの世界になりますが、「GPU間の通信」だけでなく「CPUノード間の協調」も重要になり、ネットワークファブリック全体の設計が問われてきています。
サーバーベンダーのターン:DELLがなぜ注目されるのか
ハードとしては、「CPU・GPU・メモリ・ストレージ・ネットワーク」を全部まとめて、ちゃんと冷やしてちゃんと動く箱 にするのがサーバーベンダーの仕事です。
この領域で、ここ最近存在感を増しているのがDELL(デル・テクノロジーズ)。
AIサーバー売上が急拡大
- 生成AI向けのサーバー需要が急増し、DELLのインフラ部門はここ数年で大きく伸びています。
- 2024年時点で「生成AI商用化の波に乗るDell AIサーバー売上は、かつてのVMwareビジネスに匹敵するレベル」とまで評されています。
- 最近の分析では、DELLはAIインフラ領域で「ハードウェア会社」から「インフラ・ソリューションの大手」へとビジネスモデルを変えつつあると指摘されています。
なぜDELLなのか(個人的な視点)
普段から半導体やAIインフラ関連のニュースを追っていると、どうしても「GPU」「最新プロセス」「HBM」といったキラキラしたワードに目が行きがちです。
でも実際にデータセンターでラックを組んで冷やして電源を引き回すとなると、一気に“泥臭い世界”になります。
- ラックあたりの電力上限
- 冷却方法(空冷か液冷か)
- メンテナンス性・保守体制
- GPUだけでなくCPUやメモリ構成のバランス
こういう「現場目線の総合設計」ができる企業が、Agentic AI時代の勝ち組として浮上してきている。
そう考えると、「DELLじゃね?」という直感はかなり筋が良いと感じています。
投資家としてどう付き合うか(あくまでスタンスの話)
ここまでテクノロジー寄りで書いてきましたが、読んでくださっている方の多くは「じゃあどこに注目すればいいの?」という視点も気になると思います。
個別銘柄の推奨はしませんが、構造だけ整理するとこんな感じのレイヤーに分かれます。
僕自身、ニュースを追いながら「GPUだけ見ていると、だいぶ世界が狭く見えていたな」と感じることが増えました。
Agentic AIが広がるにつれて、CPU・メモリ・ストレージ・サーバーという“一見地味だったパーツ”たちが、再び主役級の扱いを受け始めているのを肌で感じます。
おわりに:AIはますます「総合格闘技」に
Agentic AIの文脈でCPUが再評価されている話を書いてきましたが、裏を返せば「AIインフラ=総合格闘技」になってきたということでもあります。
- どのGPUを何枚積むか
- それを支えるCPUをどのアーキテクチャにするか(x86かArmか)
- どの程度のDRAMとSSDを積み、どんなネットワークでつなぐか
- それをどのベンダーのサーバーで、どう冷やすか
こうした選択の積み重ねが、最終的には「エージェントの賢さ」「レスポンスの速さ」「運用コスト」に直結します。
投資家としてニュースを追いかけていると、どうしても目先の株価や決算の数字に振り回されがちですが、
一歩引いてこの「技術の地殻変動」を眺めてみると、AI相場はまだまだ面白いフェーズが続きそうだな、と改めて感じています。