Skip to main content
NetApp Solutions
本繁體中文版使用機器翻譯,譯文僅供參考,若與英文版本牴觸,應以英文版本為準。

解決方案總覽

貢獻者

在此架構中、重點在於AI或機器學習(ML)分散式線道偵測訓練程序中運算密集程度最高的部分。車道偵測是自主駕駛中最重要的任務之一、可協助引導車輛定位車道標記。諸如車道標記等靜態元件可引導車輛以互動且安全的方式在高速公路上行駛。

複雜的神經網路(有線電視新聞網)型方法、已將場景的瞭解和分段推向新的境界。雖然對於可能會被遮蔽的長結構和區域(例如、柱狀物、線上陰影等)物件來說、它的效能並不理想。空間凸狀神經網路(SCNN)可將有線電視新聞網(CNNN)泛化為豐富的空間層級。它可在同一層的新學之間傳播資訊、因此最適合用於通道、極或阻塞的卡車等結構化物件。這種相容性是因為空間資訊可以強化、而且可以保持順暢度和連續性。

需要在系統中注入數千個場景影像、以便讓模型學習並區分資料集中的各種元件。這些影像包括天氣、白天或夜間、多線道公路及其他交通路況。

在訓練方面、需要良好的資料品質和數量。單一GPU或多個GPU可能需要數天到數週的時間才能完成訓練。資料分散式訓練可以使用多個和多個GPU來加速程序。Horovod是這樣的架構、可提供分散式訓練、但讀取GPU叢集內的資料可能會成為障礙。提供超快、高處理量和持續低延遲、以提供橫向擴充/橫向擴充功能、讓GPU發揮最大運算能力。Azure NetApp Files我們的實驗證實、叢集內的所有GPU平均使用超過96%的時間來使用SCNN進行線道偵測訓練。

目標對象

資料科學在IT和業務中納入多項原則、因此我們的目標對象包括多位人員:

  • 資料科學家需要靈活運用自己選擇的工具和程式庫。

  • 資料工程師需要知道資料的流通方式及存放位置。

  • 自主駕駛使用案例專家。

  • 雲端管理員與架構設計師、負責設定及管理雲端(Azure)資源。

  • DevOps工程師需要工具、將新的AI/ML應用程式整合到他們的持續整合與持續部署(CI/CD)管線中。

  • 企業使用者想要存取AI / ML應用程式。

在本文件中、我們將說明Azure NetApp Files 功能完善、執行:AI和Microsoft Azure如何協助這些角色為企業帶來價值。

解決方案技術

本節說明線道偵測使用案例的技術需求、方法是大規模實作可在Azure雲端中完整執行的分散式訓練解決方案。下圖概述解決方案架構。

本解決方案所使用的元素包括:

  • Azure Kubernetes服務(KS)

  • Azure運算SKU搭配NVIDIA GPU

  • Azure NetApp Files

  • 執行:AI

  • NetApp Trident

此處提及的所有元素連結均列於中 "其他資訊" 區段。

錯誤:缺少圖形影像

雲端資源與服務需求

下表列出實作解決方案所需的硬體元件。在任何解決方案實作中使用的雲端元件、可能會因客戶需求而異。

雲端 數量

至少三個系統節點和三個GPU工作節點

虛擬機器(VM)SKU系統節點

三個Standard_DS2_v2

VM SKU GPU工作節點

三個Standard_NC6s_v3

Azure NetApp Files

4TB標準層

軟體需求

下表列出實作解決方案所需的軟體元件。在解決方案的任何實作中使用的軟體元件、可能會因客戶需求而異。

軟體 版本或其他資訊

KS - Kubernetes版本

1.18.14

執行:AI CLI

v2.2.25

RUN:AI Orchestration Kubernetes運算子版本

1.0.109.

霍羅沃德

0.21.2

NetApp Trident

20.01.1

掌舵

3.0.00.0