由于深度學習方法,語音和事件識別系統的性能最近顯著提高。然而,當算法部署在機器人上時,由于訓練神經網絡時執行器會產生看不見的機械噪聲和電氣干擾,其中一些任務仍然具有挑戰性。
因此,在機器人上使用預先訓練的語音和事件識別算法時,作為預處理步驟的自我降噪可以幫助解決這個問題。提出了一種僅使用麥克風陣列和不到兩分鐘的噪聲記錄來減少自我噪聲的新方法。
使用主成分分析 (PCA),從校準期間在線創建的字典中選擇最佳協方差矩陣候選,并與最小方差無失真響應 (MVDR) 波束形成器一起使用。結果表明,該方法實時運行,將信噪比 (SDR) 提高了 10 dB,在某些情況下將誤字率 (WER) 降低了 55%,并提高了平均精度 ( AP)的事件檢測提高了高達 0.2。