本繁體中文版使用機器翻譯,譯文僅供參考,若與英文版本牴觸,應以英文版本為準。
測試組態
貢獻者
建議變更
本節說明已測試的組態、網路基礎架構、SR670 V2伺服器、以及NetApp儲存資源配置詳細資料。
解決方案架構
我們使用下表所列的解決方案元件進行此驗證。
解決方案元件 | 詳細資料 |
---|---|
Lenovo ThinkSystem伺服器 |
|
Linux(使用CUDA 11.8的Ubuntu–20.04) |
|
NetApp AFF 產品儲存系統(HA配對) |
|
在此驗證中、我們使用ResNet v2.0搭配MLPerf v2.0指定的ImageNet基礎。此資料集儲存在採用AFF NFS傳輸協定的NetApp支援儲存系統中。SR670是AFF 透過100GbE交換器連線至NetApp RE64A400儲存系統。
ImageNet是常用的影像資料集。它包含將近130萬個影像、總大小為144GB。平均映像大小為108 KB。
下圖說明已測試組態的網路拓撲。
儲存控制器
下表列出儲存組態。
控制器 | Aggregate | 流通量FlexGroup | Aggregate大小 | Volume大小 | 作業系統掛載點 |
---|---|---|---|---|---|
控制器1. |
Aggr1. |
/A400-100g |
9.9TB |
19TB |
/A400-100g |
控制器2. |
Aggr2. |
/A400-100g |
9.9TB |
/A400-100g |
/A400-100g資料夾包含用於ResNet驗證的資料集。 |