Skip to main content
NetApp Solutions
本繁體中文版使用機器翻譯,譯文僅供參考,若與英文版本牴觸,應以英文版本為準。

驗證結果

貢獻者

如前一節所述、只要有兩個或多個機器學習模式依序執行、錯誤就會傳播到整個管線中。對於此解決方案、句子的意涵是衡量公司股票風險等級的最重要因素。語音對文字模式雖然對管道至關重要、但在預測意見之前、仍是預先處理單位。真正重要的是、基本真理句子與預測句子之間的情緒差異。這可做為字錯誤率(WER)的Proxy。語音對文字的準確度很重要、但WER並未直接用於最終的傳輸途徑指標。

PIPELINE_SENTIMENT_METRIC = MEAN(DIFF(GT_sentiment, ASR_sentiment))

這些情緒指標可針對每個句子的F1分數、回收和精準度進行計算。然後可以將結果彙總並顯示在混淆對照表中、以及每個指標的可信度間隔。

使用轉移學習的好處在於、模型效能的提升只需一小部分的資料需求、訓練時間和成本。此外、還應將微調模型與基礎版本進行比較、以確保傳輸學習能提升效能、而非損害效能。換句話說、微調模式應該比預先訓練的模式更能在支援中心資料上執行。

管道評估

測試案例 詳細資料

測試編號

管道觀感指標

測試先決條件

針對語音對文字和情緒分析模式進行微調

預期結果

微調模型的觀感指標比原始的預先訓練模型更好。

管道觀感指標

  1. 計算基礎模式的感受指標。

  2. 計算微調模型的感受指標。

  3. 計算這些指標之間的差異。

  4. 平均所有句子的差異。