近日,電子科技大學數學科學學院2018級大學生羅倚斯的文章“HLRTF: Hierarchical Low-Rank Tensor Factorization for Inverse Problems in Multi-Dimensional Imaging”被電腦視覺領域國際頂級會議IEEE/CVF Conference on Computer Vision and Pattern Recognition(CVPR,中國電腦協會A類會議,2021年Google學術期刊和會議影響力排名總榜第四)接收發表。數學科學學院大學生羅倚斯為論文第一作者,電子科技大學張量建模與計算團隊趙熙樂教授為通訊作者,合作作者為西安交通大學孟德宇教授和西南財經大學蔣太翔教授。
圖1相較於固定的線性變換DFT和DCT,本文的多層非線性變換DNN可以更加靈活地獲得更好的低秩表示,從而大幅度提升高維影像填充的效能。
高維影像反問題,如影像填充、影像去噪和壓縮感知,是底層電腦視覺中的前沿基礎科學問題之一。這些高維影像反問題由於數據量大和問題的內在不適定性具有很强的挑戰性。最近,基於張量奇异值分解(t-SVD)的方法在高維影像反問題提中得到了成功的應用。t-SVD是利用一個線性變換如離散傅裡葉變換或離散余弦變換來定義的。然而,簡單的線性變換可能難以刻畫高維影像數據的複雜低維結構。囙此,該研究工作首次提出了一種基於多層非線性變換的低秩張量分解(HLRTF)。這裡的多層非線性變換可以解釋為一個神經網路,並且這個神經網路僅需使用觀測數據無監督學得。相較於傳統的線性變換,本研究中的多層非線性變換可以獲得一個更好的低秩表示,從而大幅度提升高維圖像恢復的效能(見圖1)。為了解决優化過程中的梯度消失問題,本研究進一步提出一種參數全變分正則項方法。在大量高維影像數據(包括高光譜影像、多光譜影像和視頻)上的廣泛實驗(包括影像填充、影像去噪和壓縮感知)表明HRLTF方法在視覺質量和定量評估名額等方面均優於當前最先進方法;部分結果如圖2所示。匿名審稿人高度評價研究工作為“Fusion of the conventional tensor factorization with the neural network is quite interesting(融合傳統張量分解和神經網路非常有趣)”。
圖2不同方法的壓縮感知還原結果。(1)-(4)為基於模型的方法,(5)-(7)為基於深度學習的方法,HLRTF為本文方法
羅倚斯同學於2019年加入黃廷祝教授帶領的張量建模與計算團隊,在趙熙樂教授指導下進行基於數學方法和深度學習方法的高維圖像復原問題研究。該團隊近年來在高水准學術期刊和會議上發表文章,如應用數學權威SIAM系列期刊(SIIMS和SISC)和圖像處理權威IEEE系列期刊(TIP、TNNLS、TCYB、TCI和TGRS)及人工智慧權威會議CVPR和AAAI等。團隊科研育人氛圍濃厚,近年來趙熙樂老師已指導多名學院大學生以第一作者身份發表高水准學術會議和期刊文章,如CVPR、IEEE TIP、IEEE TGRS、IEEE SPL、KBS和IEEE JSTARS等,獲四川省第十五届挑戰杯二等獎、首届新工科教育課外創新實踐成果展優秀學術論文、校級優秀畢業論文。