NVIDIA H200は、比類のないメモリ帯域幅と処理速度でAI革命を推進する強力なコンピューティングパワーを備えています。しかし、このパフォーマンスには大きな熱コストが伴います。熱設計電力(TDP)は GPUあたり700W ラックの電力密度は 50kW従来の空冷はもはや非効率なだけでなく、パフォーマンスの重大なボトルネックとなっています。高密度クラスタの潜在能力を最大限に引き出すには、データセンターはより効果的な熱管理パラダイムへと移行する必要があります。
浸漬油冷却 H200サーバーインフラ全体を熱伝導性誘電流体に浸すという手法を採用しています。この方法では空気の熱抵抗が排除されるため、電力使用効率(PUE)は最低でも 1.03ラック密度を増加 100%まで、サーマルスロットリングのリスクなしに、一貫したピーククロック速度を保証します。
このガイドでは、HGX H200クラスタへの液浸冷却の導入に関する包括的なエンジニアリング分析を提供します。単相油の熱力学を検証し、最適な誘電流体を選択し、必要なシステムアーキテクチャを定義し、材料の適合性に関する課題を解決して、将来を見据えた高密度AIデータセンターを構築します。
NVIDIA H200 クラスターでは空冷が時代遅れなのはなぜですか?
NVIDIA H200への移行は、高性能コンピューティングにおける空冷時代の終焉を決定づけるものです。従来の強制空冷の熱限界は、一般的に約 ラックあたり30~40kWしかし、高密度のH200クラスターは簡単に ラックあたり100kW空気冷却では物理的に除去できない熱負荷が生じ、過度の騒音、振動、そして持続不可能なエネルギーコストが発生します。これらのシステムを空冷しようとすると、即座に熱スロットリングが発生し、計算効率が大幅に低下します。
故障の熱力学:H200仕様
空気がなぜ壊れるのかを理解するには、ハードウェアの生の熱データを見る必要があります。NVIDIA H200は単なるチップではありません。物理学の限界を押し広げる熱的挑戦なのです。
- エクストリームTDP: 単一のH200(SXM5)GPUの熱設計電力(TDP)は 700Wピーク時の過渡負荷はしばしばこれを超えます。8GPU HGXベースボードだけでも、 5.6 kW 4U または 6U シャーシ内の熱。
- 高い接合温度: ピークブーストクロックを維持するためには、GPUジャンクション温度(Tj)をその最大限度(通常は 約90℃~95℃)。空冷では、このような高い熱流束でこのデルタ T を維持するのは困難です。
- ラック密度の爆発: H200サーバーを搭載した標準ラックは、電力密度が 50 kW〜100 kWこれを冷却するには空気の体積流量 (CFM) が非常に必要となり、不可能な速度要件が発生します。
空気にしがみつくことの結果
H200 展開で空冷を引き続き使用すると、重大な運用上のペナルティが発生します。
- 寄生電力損失: 100kWのラックを空冷するには、サーバーファンを最大回転数(10,000回転以上)で稼働させる必要がある。この寄生負荷によって、 15%の25%に データセンター全体の電力を削減し、PUE(電力使用効率)を大幅に向上させます。
- 音響振動: 高速ファンは、 100 dBAこの音響エネルギーは微小振動を引き起こし、時間の経過とともにハードディスクドライブ (HDD) のパフォーマンスを低下させたり、コネクタを緩めたりする可能性があります。
- サーマルスロットリング: 空気の流れが不均一なため、「ホットスポット」が発生します。GPUが熱容量上限に達すると、自動的にスロットルダウンが発生します。つまり、H200の性能を支払っているにもかかわらず、H100(もしくはそれ以下)の速度しか得られないことになります。
| 製品仕様 | NVIDIA H200 (SXM5) 要件 | 空冷限界 | 結果 |
|---|---|---|---|
| GPUあたりのTDP | 700 W | 約350~400ワット(効率) | サーマルスロットリング |
| ラック電力密度 | > 50kW~100kW | 約30kW~40kW | 低密度展開が必要(無駄なスペース) |
| デルタT(チップからクーラントまで) | 低い熱抵抗が必要 | 高抵抗(空気は絶縁体である) | 高い接合部温度 |
| ファンの消費電力 | N/A(ファンレスオイル) | IT負荷の20% | 高いPUE(>1.5) |
浸漬冷却とは?単相と二相
浸漬冷却は、次の 2 つの異なる技術に分類されます。 単相 および 二相。 に 単相浸漬サーバーは液体状態の誘電流体(通常は炭化水素油)に浸されており、能動ポンプ対流によって熱を除去します。 二相浸漬特殊設計された流体が部品表面で直接沸騰し、蒸発潜熱を利用して熱を奪い、液体に戻ります。二相流体は理論上の熱伝達率が高いですが、単相流体は長期的な運用安定性と総所有コスト(TCO)の点で優れた選択肢として広く認められています。
単相浸漬冷却(業界標準)
単相システムでは、高沸点(通常は > 150°C)により、動作中に状態が変化することはありません。この液体はH200 GPUから熱を吸収し、ポンプによって冷却液分配ユニット(CDU)に循環され、放熱されます。
- メカニズム: 依存している 強制対流ポンプはタンクとサーバーシャーシを通じてオイルを循環させます。
- 熱伝達効率: 典型的な熱伝達係数(h)の範囲は 1,200~1,500 W/m²K沸騰温度よりは低いですが、適度な流量で 700W H200 GPU を冷却するには十分です。
- 流体コスト: コスト効率に優れた (約 1.5 リットル) 炭化水素ベースの流体 (鉱油または合成 PAO) を使用します。 5リットルあたり15~XNUMXドル).
- メンテナンス: オープンバス設計により、容易にアクセスできます。液体は急速に蒸発しないため、DIMMやGPUの交換といったメンテナンス作業(「ディップ&ワイプ」)が簡単です。
二相浸漬冷却(高性能ニッチ)
二相システムでは、低温で沸騰するように設計されたフルオロカーボンベースの流体を使用します(例: 50°C)。沸騰プロセスによりチップ表面に蒸気泡が生成され、密閉タンクの上部にある凝縮コイルまで上昇します。
- メカニズム: 依存している 核沸騰 および相変化(蒸発潜熱)。
- 熱伝達効率: 非常に高い係数を超えている 10,000W/m²Kこれにより、接合部温度が可能な限り低くなります。
- 流体コスト: 非常に高価なエンジニアリング流体(例:Novec)は、多くの場合、 1リットルあたり150~300ドル以上.
- 環境リスク: 多くの二相流体は次のように分類されます。 PFAS(「永遠の化学物質」)EUと米国で規制禁止が迫っている。
- 運用リスク: タンクは完全に密閉されていなければなりません。たとえ微小な漏れであっても、蒸気が漏れ出すことで数千ドル相当の液体が瞬く間に失われることになります。
エンジニアリングの洞察: ほとんどのハイパースケール展開において、Walmate Thermalは以下を推奨しています。 単相オイル二相システムは熱特性が若干優れているものの、天文学的な流体コスト、メンテナンスの複雑さ(密閉)、PFASに関する規制の不確実性などから、10年間のデータセンターライフサイクルにおいてはリスクの高い投資となります。単相システムは堅牢で持続可能であり、十分な冷却能力(最大 タンクあたり200kW以上) は現在および将来の H200 クラスター向けです。
| 機能 | 単相(油) | 二相(エンジニアリング流体) |
|---|---|---|
| 熱伝達係数 | 約1,200~1,500 W/m²K | > 10,000 W/m²K |
| 液体コスト(概算) | 低価格(5~15ドル/リットル) | 非常に高い(1リットルあたり150ドル~300ドル以上) |
| メンテナンスの複雑さ | 低(オープンアクセス) | 高(密閉容器が必要) |
| 体液喪失リスク | 無視できる(不揮発性) | 高(シールが破れると急速に蒸発します) |
| PUEポテンシャル | 1.03 – 1.05 | 1.02 – 1.03 |
| 規制の状況 | 安全で生分解性のオプション | PFAS禁止のリスク |
適切な誘電液(「オイル」)の選択
誘電液は液浸システムの生命線です。冷却剤としても電気絶縁体としても機能します。高密度H200クラスターの場合、誘電液は厳しい要件を満たす必要があります。 40 kVを超える絶縁強度 ショートを防ぐための高い熱伝導性、GPUあたり700Wの熱負荷を伝達するための高い熱伝導性、そして厳格な 材料の互換性精製鉱物油が一般的ですが、現代のデータセンターは 合成PAO(ポリアルファオレフィン)オイル 優れた酸化安定性と一定した粘度により、 10年以上 寿命。
主要な特性:流体の物理
流体の選択は価格だけではありません。流体力学と安全仕様も考慮する必要があります。
- 粘度(cSt): これによってポンプの稼働率が決まります。低いほど熱伝達に優れています。理想的な流体の動粘度は 40℃で10 cSt未満粘度の高い流体は GPU ダイ上に停滞した境界層を作り出し、接合部温度を上昇させます。
- 引火点と火災安全性: 通常の運転条件下では、流体は可燃性であってはなりません。引火点は > 150°C これは標準的な安全マージンであり、サーバーの動作温度である約 50 ~ 60°C をはるかに上回ります。
- 流動点: コールドスタートには重要です。理想的には低温でも液体のままでなければなりません。 <-40°C冬季の施設停電後もポンプが直ちに流体を循環できるようにするためです。
隠れたリスク:材料の適合性
初期の浸漬型展開における最も一般的な故障モードは熱ではなく化学的なものでした。炭化水素油は溶剤として作用する可能性があります。
- ケーブル強化: 標準的なPVCケーブル絶縁体では、油によって可塑剤が浸出するため、ケーブルが脆くなり、ひび割れが発生しやすくなります。浸漬対応ケーブル(例:テフロン/PTFE)の使用が必須です。
- TIMウォッシュアウト: 標準的なサーマルペーストはオイル中に溶解したり「ポンプアウト」したりして液体を汚染し、GPUダイの熱接触を悪化させる可能性があります。インジウム箔または特殊な液浸グレードのTIMが必要です。
| プロパティ | 合成PAO | 精製鉱物油 | 標準変圧器油 | H200の理想的なターゲット |
|---|---|---|---|---|
| 絶縁耐力 | > 50kV | > 40kV | > 30kV | > 45kV |
| 粘度(40℃) | 6〜8 cSt | 10〜15 cSt | > 20 cSt (厚すぎる) | 10 cSt未満 |
| 引火点 | > 160°C | > 140°C | 〜135°C | > 150°C |
| 相対コスト | $$ | $ | $ | パフォーマンスとコストのバランス |
システムアーキテクチャ:タンク、CDU、マニホールド
液浸冷却の導入は、浴槽に油を注ぐほど単純ではありません。膨大な熱エネルギーを正確に移動させるために設計された、高度な閉ループ油圧アーキテクチャが必要です。NVIDIA H200クラスター向けの完全な液浸エコシステムは、3つのミッションクリティカルなサブシステムで構成されています。 液浸タンク (主容器)、 クーラント分配ユニット (CDU) (熱管理エンジン)、そして 熱遮断システム (ドライクーラーまたはチラー)。各コンポーネントは、誘電流体の特定の流動特性と材料適合性要件を満たすように設計する必要があります。
NVIDIA H200クラスターの完全な液浸冷却システムは、3つの統合サブシステムが調和して動作することで実現されています。まず、 液浸タンク サーバーのハードウェアを収容し、主要な熱回収容器として機能します。 クーラント分配ユニット (CDU) システムの心臓部として機能し、液体対液体熱交換器を介して流体の流れ、濾過、温度調節を管理します。最後に、外部 ドライクーラーまたはチラー 捕捉した熱を大気中に放出し、熱ループを完了します。
浸漬タンク:単なる容器以上のもの
タンクはITハードウェアと流体のインターフェースです。高密度H200ラックの場合、タンクの設計はいくつかの機械的課題を解決する必要があります。
- 材料構造: タンクは通常、 ステンレス鋼(304または316) 誘電流体との相互作用をゼロにし、重い流体負荷(多くの場合 > 1,000 kg タンクあたりのオイル量)。
- ケーブル管理とウィッキング: 油は毛細管現象(ウィッキング)によってケーブルを伝って上昇することがあります。タンクには、油が床に滴り落ちたり、浸水していない領域にまで達するのを防ぐため、専用のケーブルトレイとシールが必要です。
- バスバー電力供給: 納品管理 100 kW タンクへの電力供給には、標準的なケーブルではなく、剛性の高いバスバーが必要です。これらのバスバーは、誘電液と互換性があり、電圧降下を最小限に抑えるように設計されている必要があります。
CDU:システムの心臓部
冷却液分配ユニット(CDU)は二次ループを形成し、タンク内の高価な誘電液を施設の水ループから分離します。流量制御、ろ過、温度安定性を担います。
- 熱交換器: これがコアコンポーネントです。高効率 ろう付けプレート熱交換器(BPHE) 油から施設内の水へ熱を伝達するために使用されます。Walmate Thermalは、これらの重要な部品の製造を専門としており、水よりも高い粘度を持つ油に対応するためにプレートの形状を最適化しています。
- 冗長性戦略: 信頼性は譲れない。H200クラスタのCDUは通常、 N+1ポンプ構成1台のポンプが故障した場合、バックアップが直ちに引き継ぎ、熱暴走を防ぎます。熱暴走は、 <30秒 これらの電力密度では。
- ろ過: CDUは、接点をブリッジさせる可能性のある微粒子(破片、はんだフラックス)を除去するために、オイルを継続的に濾過する必要があります。濾過等級は 10ミクロン未満 敏感な GPU コンポーネントを保護するための標準です。
マニホールドと流れの分布
単にオイルをタンクに送り込むだけでは不十分です。オイルの流れを高温部品に正確に導く必要があります。これは、カスタム設計のマニホールドによって実現されます。
- 流速要件: 700WのGPUを単相オイルで効果的に冷却するには、局所的な流量が約 10~15リットル/分(LPM) ノードごとに必要な場合がよくあります。
- 均一: マニホールド設計は、すべてのサーバースロットで均等な圧力降下を保証する必要があります。不適切なマニホールド設計は、タンクの遠端にあるサーバーに「飢餓状態」をもたらし、他のサーバーが冷却されたままであるにもかかわらず、そのサーバーが過熱する原因となります。
- ウォルメイトの専門知識: 当社は、カスタムステンレス鋼流体分配マニホールドを設計・製造しています。 CFDシミュレーション タンク容積全体にわたって均一な速度プロファイルを保証します。
| 成分 | キー機能 | 重要な仕様(データ) |
|---|---|---|
| 液浸タンク | IT機器と流体を収容 | 容量: 42U – 52U; 力: 100kW以上 |
| CDU(熱交換器) | 施設の水に熱を伝達する | アプローチ温度: 3°C - 5°C; タイプ: ろう付けプレート |
| 循環ポンプ | 誘電液を移動させる | 流速: > 300 LPM (100kWタンクあたり)冗長性: N + 1 |
| ろ過システム | 微粒子を除去 | 評価: 5〜10ミクロン; 走行中でも交換可能 |
| ドライクーラー | 熱を大気中に放出する | 戻り水温: 35°C - 45°C (フリークーリングが可能) |
浸漬のROI:PUE、密度、TCO
液浸冷却への移行には、タンクと冷却液のための初期資本支出(CapEx)は高額になりますが、投資収益率(ROI)は迅速かつ大きく向上します。液浸冷却の経済的メリットは、エネルギー消費量(OpEx)の大幅な削減、コンピューティング密度の大幅な向上(設置面積の節約)、そしてハードウェア寿命の延長という3つの柱に基づいています。高密度のNVIDIA H200クラスターの場合、液浸冷却は持続可能な総所有コスト(TCO)を実現する唯一の方法となることがよくあります。
液浸冷却は、データセンターの非効率性の根本原因を突き止めることで、運用コストを大幅に削減します。サーバーファンや電力を大量に消費するCRACユニットを排除することで、総エネルギー消費量を 30-50%電力使用効率(PUE)評価を最低 1.03 空冷式施設の一般的な1.5倍以上の性能と比較して、ハードウェア密度を1.5倍に高めることができます。 2-3x高価な床面積と建設コストを節約します。
エネルギー節約の内訳
エネルギーの節約は、2 つの大きな寄生負荷を除去することによって実現されます。
- サーバーファンの排除: 空冷式のH200サーバーでは、ファンが消費する電力は 15-20% 高密度ヒートシンクを通して空気を送り出すために、IT全体の電力の大部分が消費されます。液浸型では、ファンが完全に取り外されます。これにより、同じコンピューティング出力でIT負荷が最大20%も瞬時に削減されます。
- コンプレッサーフリー冷却: 空冷ではチラーで冷気(通常15~20℃)を生成する必要があります。油浸油はより高温(40~50℃)で作動するため、 フリークーリング ほぼあらゆる気候で屋外ドライクーラーのみを使用するため、エネルギーを大量に消費する機械式冷凍機(コンプレッサー)が不要になります。
ハードウェアの寿命と信頼性
水没はハードウェアを冷却するだけでなく、保護します。これにより、平均故障間隔(MTBF)が延長されます。
- 熱安定性: オイルの高熱容量により、はんだ接合部の疲労の原因となる急激な温度上昇 (熱サイクル) が排除されます。
- 汚染物質からの保護: 水中に沈んだコンポーネントは、空冷式電子機器の一般的な致命的要因であるほこり、湿気、硫黄、酸化の影響を受けません。
- 振動除去: 高速ファンがないため、音響振動が排除され、HDD アレイとコネクタが保護されます。
| メトリック | 従来の空冷 | 浸漬油冷却 | 節約/利益 |
|---|---|---|---|
| PUE(電力使用効率) | 1.4 – 1.6 | 1.03 – 1.05 | 総電力が約30%低下 |
| ラック電力密度(kW) | 15〜30 kW | 100kW~200kW以上 | 3倍~6倍の密度 |
| サーバーファン電源 | IT負荷の15%~20% | 0% (削除済み) | 即時の効率向上 |
| 故障率(MTBF) | ベースライン | 延長(安定温度) | メンテナンスコストの削減 |
| 必要な床面積 | 高さ(ホット/コールドアイル) | 低(コンパクトタンク) | 約60%のスペース節約 |
設計と実装の課題(および解決策)
H200クラスターに液浸冷却を実装するには、熱力学だけでなく、特定のエンジニアリング上のハードルを克服する必要があります。この移行により、特有の物理的課題が生じます。 材料の互換性 炭化水素がケーブルから可塑剤を剥離する問題。 ケーブルウィッキング油が毛細管現象によって電線の絶縁体を伝って非浸水領域まで移動する。 保守性 油で汚れたハードウェアの取り扱いには、新たなプロトコルが必要となる制約があります。これらのリスクを効果的に軽減するには、PTFEケーブルやインジウム箔TIMの使用といった正確な材料選定と、堅牢な施設設計が不可欠です。
材料の適合性:サイレントキラー
標準的なサーバーコンポーネントは、油ではなく空気用に設計されています。炭化水素系流体に長期間さらされると、特定の材料の化学劣化が起こり、システム障害につながる可能性があります。
- ケーブル絶縁: スタンダード PVC(ポリ塩化ビニル) ケーブルには可塑剤が含まれており、時間が経つと油に浸出する可能性があります。その結果、ケーブルは脆くなり、ひび割れが発生しやすくなり、誘電液を汚染します。 解決策: 水中ケーブルはすべて交換する必要がある PTFE(テフロン) or FEP 油中では化学的に不活性な絶縁体です。
- ガスケットとシール: EPDM のような一般的なゴムシールは膨張したり溶解したりする可能性があります。 解決策: バイトン(FKM) or ニトリル(ブナ-N) 炭化水素環境において長期安定性が実証されているガスケットです。
- ラベリング: 紙のラベルや標準的な接着剤は剥がれてフィルターを詰まらせます。 解決策: レーザー エッチングまたは耐油性ポリエステル ラベルを使用します。
ウィッキング現象(毛細管現象)
油は表面張力が非常に低いため、ケーブル内の撚り線銅線を登り、タンクから数メートル離れた配電ユニット (PDU) またはネットワーク スイッチまで移動する可能性があります。
- リスク: 油が非浸水床タイルに滴り落ちたり、ネットワーク機器のポートに入り込んだりする。
- 緩和: インストールを開始する 密閉型ケーブルグランド あるいは、タンク出口に「ウィッキングブロック」を設置する。あるいは、ケーブル経路に「サービスループ」を設け、出口より下まで垂らして重力トラップを形成する方法もある。
H200サーバーのイマージョン向け改造
標準の HGX H200 ベースボードをそのまま油の中に落とすことはできません。正しく機能させるには、特別な変更が必要です。
- ファンの取り外しとスプーフィング: 流体の流れを確保するには、物理ファンを取り外す必要があります。ただし、BMC(ベースボード管理コントローラー)がファンの故障を検知し、起動を妨げます。 解決策: インストールを開始する ファンの偽物 (小さなドングル)は、偽の「正常」なタコメータ信号をマザーボードに送信します。
- TIMの交換: 標準的なサーマルグリースは、時間の経過とともに油の中で洗い流されたり、劣化したりすることがあります。 解決策: グリースを交換する インジウム箔 または固体 相変化材料(PCM) パッド。インジウム箔は優れた導電性を提供する(86W / m・K) であり、化学的な洗い流しの影響を受けません。
| 危険因子 | 影響の可能性 | 緩和戦略(エンジニアリングソリューション) |
|---|---|---|
| 液体の汚染 | 絶縁強度の低下、フィルターの目詰まり | すべての紙ラベルをはがす。PVCフリーのケーブルを使用する。連続 10µmろ過. |
| ケーブルウィッキング | タンク外へのオイル漏れ(安全上の問題) | 可能な場合は単線を使用してください。 圧縮シールブロック タンク出口にて。 |
| TIMウォッシュアウト | 隙間の形成によるGPUの過熱 | ペーストを置き換える インジウム箔 またはグラファイト パッド (垂直安定)。 |
| シールの失敗 | 大量の体液損失(環境問題) | Viton/FKM Oリング; 二重壁の封じ込めタンクを設計します。 |
よくある質問(FAQ)
1. 液浸冷却を行うと NVIDIA の保証が無効になりますか?
標準空冷式HGX H200ベースボードからファンやヒートシンクを取り外して改造すると、標準保証が無効になります。ただし、NVIDIAは認定システムインテグレーター(Supermicro、Gigabyte、QCTなど)と提携しており、以下の保証を提供しています。 「没入型対応」 液体浸漬に対する完全な保証が付いたSKUです。サポート範囲を確保するには、標準ユニットを改造するのではなく、必ず浸漬認定ハードウェアをご購入ください。
2. 誘電油はどのくらいの頻度で交換する必要がありますか?
高品質の合成PAO誘電液は驚くほど安定しています。DLCループの水グリコールは3~5年ごとにメンテナンスが必要になる場合がありますが、単相液浸油は通常、100万回を超える耐用年数があります。 10年間から15年間液体は継続的に濾過され、微粒子が除去されます。また、酸化や湿気の侵入を確認するために定期的なラボ分析が推奨されますが、サーバーのライフサイクル中に完全な交換が必要になることはほとんどありません。
3. 既存の H200 空冷サーバーを液浸用に改造できますか?
技術的には可能ですが、エンジニアリングの負荷が高くなります。すべてのファンを取り外し、TIMをインジウム箔またはグラファイトパッドに交換し(ペーストは洗い流されるため)、ファンスプーファーを取り付け、場合によってはBIOSを変更する必要もあります。概念実証には可能ですが、保証リスクと人件費の観点から、本番環境のクラスターには推奨されません。専用の液浸サーバーの方が優れた選択肢です。
4. 浸漬タンク内のポンプが故障するとどうなりますか?
浸漬はコールドプレートに比べて安全性が大幅に向上します。タンクには 1,000リットル 流体の循環が止まると、流体の温度はゆっくりと上昇し、作業員は 数分 T_junctionの限界に達する前に反応する。さらに、堅牢なシステム設計では、 N+1冗長ポンプそのため、ポンプ 1 台が故障しても循環が停止したり、冷却性能に影響したりすることはありません。
5. 鉱油は可燃性ですか?
誘電液は可燃性ですが、発火しにくいです。標準的な液浸液は引火点が高く、通常は > 150°C(302°F)オイルの動作温度は40℃~50℃に維持されるため、100℃を超える大きな安全マージンを確保できます。データセンターでは消火システムが標準装備されていますが、空冷ラックにおける電気火災のリスクと比較すると、自然発火のリスクは極めて低くなります。
6. 液浸冷却により床面積はどのくらい節約できますか?
液浸冷却はスペース効率を大幅に向上させます。標準的な空冷ラックでは、 30 kW温水通路と冷水通路に十分なスペースが必要です。浸漬タンクは 100 kW〜200 kW 通路を必要とせず、同様の設置面積で実現できます。これにより、通常は 60%から75%の削減 同じ量の計算能力に必要なホワイトスペースで。
7. Walmate はカスタムの浸漬タンクまたは CDU を設計できますか?
はい。Walmate Thermalは、浸漬型エコシステムにおける重要な熱部品の専門メーカーです。高効率の設計・製造を行っています。 ろう付けプレート熱交換器 CDUと カスタムステンレス鋼流体マニホールド タンク内の均一な流量分布を確保します。当社はシステムインテグレーターと提携し、高密度H200の導入に必要なカスタムメイドの熱対策ハードウェアを提供しています。
結論
NVIDIA H200は、熱に関するパラダイムシフトを要求します。ラック密度が50kWを超えると、空冷の物理的特性が障害となり、パフォーマンスの上限を下げ、運用コストを増大させています。液浸油冷却は単なる代替手段ではなく、AIインフラストラクチャの潜在能力を最大限に引き出すための実証済みのエンジニアリング手法です。熱抵抗とファンの寄生負荷を排除することで、真のピークパフォーマンスを実現しながら、消費電力を大幅に削減します。
この技術をうまく導入するには、タンクだけでは不十分です。絶対的な信頼性で大量の熱流を管理できる、堅牢で統合された油圧アーキテクチャが必要です。
高密度冷却の専門家と提携しましょう。
ウォルメイト・サーマルは、液浸システムを動かす重要なハードウェアの製造を専門としています。高効率から ろう付けプレート熱交換器 CDUsを カスタムステンレス鋼流体分配マニホールド タンク形状に合わせてカスタマイズすることで、次世代データセンターの熱基盤を提供します。 100kW以上 簡単にラックに収納できます。ぜひ当社の熱設計エンジニアにご相談ください。AIにとってよりクールで、より高速な未来を築きましょう。

