天津師範大學電腦與信息工程學院認知與情感計算研究團隊趙子平老師在基於語音訊號的情感計算研究中取得進展

接下來,研究了一種自注意機制,該機制在訊號幀和通道兩個層次上聚合情感資訊,最後使用CTC損失作為優化目標,解碼得到情感類別。該文具有很强的綜合性,充分利用了深度學習中的各種方法,體現了認知與情感計算團隊的研究特色。電腦與信息工程學院副院長趙子平老師是該文的第一作者,指導的碩士研究生李啟飛為該文的共同第一作者。

日前,電腦與信息工程學院趙子平老師及其合作者在《Neural Networks》上發表了題為“Combininga parallel 2D CNN with a self-attention Dilated Residual Network for CTC-based discrete speech emotion recognition”的學術論文。

該文提出了一種聯合並行卷積神經網路和自注意力殘差卷積網絡搭配CTC(Connectionist temporal classification)損失函數的語音情感識別方法。首先,將原始的語音訊號轉化成對數梅爾頻譜圖然後做二階差分組成3維的對數梅爾頻譜圖,以獲取它們動態的時間和頻率資訊。其次,利用並行的卷積網絡進行空間特徵選取,再次,使用殘差擴張卷積網絡來學習語音特徵種的長時動態特徵。接下來,研究了一種自注意機制,該機制在訊號幀和通道兩個層次上聚合情感資訊,最後使用CTC損失作為優化目標,解碼得到情感類別。本方法在國際公開的情感數据集IEMOCAP(Interactive Emotional Dyadic Motion Capture)和FAU-AEC(FAU-Aibo Emotion corpus)進行實驗驗證,實驗結果表明,該方法能够有效地提升情感識別的效能。該文具有很强的綜合性,充分利用了深度學習中的各種方法,體現了認知與情感計算團隊的研究特色。

電腦與信息工程學院副院長趙子平老師是該文的第一作者,指導的碩士研究生李啟飛為該文的共同第一作者。該研究得到國家自然科學面上項目(No:62071330)、國家自然科學基金青年項目(No:61702370)與天津市自然科學基金重點專案(No:18JCZDJC36300)等專案資助。

論文連結:https://doi.org/10.1016/j.neunet.2021.03.013

本文版權歸原作者所有,文章內容不代表平臺觀點或立場。如有關於文章內容、版權或其他問題請與我方聯系,我方將在核實情况後對相關內容做删除或保留處理!

本文標題: 天津師範大學電腦與信息工程學院認知與情感計算研究團隊趙子平老師在基於語音訊號的情感計算研究中取得進展
永久網址: https://www.laoziliao.net/doc/1656063404698233
相关資料
遺傳與發育生物所左建儒研究組和陳凡研究組等發現調控水稻氮高效的新機制
在該研究中,作者發現Ghd7結合到ARE1基因上並抑制其表達,從而正調控水稻氮素利用和產量。
標籤: 水稻 研究員 水稻品種 陳凡 科學 科普
昆明植物所在植物內生及根際菌的活性次生代謝產物發現方面取得新進展
中國科學院昆明植物研究所植物化學與西部植物資源持續利用國家重點實驗室黃勝雄研究員領銜的研究團隊長期致力於植物內生、根際微生物資源的活性天然產物發現工作,近期取得了系列新進展。
標籤: 植物 科學 科普
昆明植物所,|,宿兵/陳華研究組聯合揭示東南亞土著體貌錶型對熱帶雨林環境適應的分子機制
解析人類錶型多樣性的分子機制和進化規律將理解人類的演化歷史提供重要的資訊。東南亞擁有除非洲大陸之外最為豐富的人類文化、語言、種族和錶型多樣性。考古學和遺傳學等多學科研究顯示,東南亞一直是人類頻繁定居、遷徙、擴散和交流的重要區域。
標籤: 陳華 科學 科普
电浆所在誤差場鎖模非線性物理研究方面取得新進展
近日,EAST大科學工程團隊孫有文三維物理課題組在誤差場鎖模研究方面取得了新進展。由誤差場滲透引發的鎖模現象是引起电浆大破裂的重要原因之一,也是裝置高參數穩態運行面臨的挑戰之一。與此同時,為了進一步闡明誤差場鎖模理論的適用範圍,課題組在射頻
標籤: 物理 非線性誤差 非線性 線性系統 誤差分析 科學