本繁體中文版使用機器翻譯,譯文僅供參考,若與英文版本牴觸,應以英文版本為準。
驗證結果
貢獻者
建議變更
如前一節所述、只要有兩個或多個機器學習模式依序執行、錯誤就會傳播到整個管線中。對於此解決方案、句子的意涵是衡量公司股票風險等級的最重要因素。語音對文字模式雖然對管道至關重要、但在預測意見之前、仍是預先處理單位。真正重要的是、基本真理句子與預測句子之間的情緒差異。這可做為字錯誤率(WER)的Proxy。語音對文字的準確度很重要、但WER並未直接用於最終的傳輸途徑指標。
PIPELINE_SENTIMENT_METRIC = MEAN(DIFF(GT_sentiment, ASR_sentiment))
這些情緒指標可針對每個句子的F1分數、回收和精準度進行計算。然後可以將結果彙總並顯示在混淆對照表中、以及每個指標的可信度間隔。
使用轉移學習的好處在於、模型效能的提升只需一小部分的資料需求、訓練時間和成本。此外、還應將微調模型與基礎版本進行比較、以確保傳輸學習能提升效能、而非損害效能。換句話說、微調模式應該比預先訓練的模式更能在支援中心資料上執行。
管道評估
測試案例 | 詳細資料 |
---|---|
測試編號 |
管道觀感指標 |
測試先決條件 |
針對語音對文字和情緒分析模式進行微調 |
預期結果 |
微調模型的觀感指標比原始的預先訓練模型更好。 |
管道觀感指標
-
計算基礎模式的感受指標。
-
計算微調模型的感受指標。
-
計算這些指標之間的差異。
-
平均所有句子的差異。