日前,第44届國際電腦學會資訊檢索領域會議(ACM Special Interest Group on Information Retrieval,ACM SIGIR2021)官方發佈了論文錄用結果。國家網路安全學院2017級大學生田雨、電腦學院2018級大學生楊雨豪分別以第一作者、第二作者撰寫的論文被錄用,成為武漢大學首篇以大學生作為第一作者在SIGIR上錄用的長文論文。
論文題目為“Joint Knowledge Pruning and Recurrent Graph Convolution for News Recommendation”(聯合知識剪枝和遞迴圖卷積的新聞推薦算灋),指導老師為國家網路安全學院副教授李晨亮(通訊作者)和教授王騫,與微軟亞洲研究院吳方照博士和北京郵電大學副教授王鵬飛合作完成。
該論文針對新聞推薦服務,設計了一種利用知識圖譜來識別用戶閱讀興趣的深度學習算灋。該算灋結合新聞的文章內容,從中抽取重要的實體作為節點,結合用戶的歷史新聞瀏覽記錄,建立用戶興趣圖,並提出一種新的圖卷積網絡,即“遞迴圖卷積”,用於從知識圖譜中(Knowledge Graph)中識別與用戶興趣相關的實體來進一步豐富和修正用戶興趣圖,最終實現用戶閱讀興趣的精准識別。該項工作解决了現有方法在結合知識圖譜的環節會引入無關雜訊的缺陷,以及無法捕捉不同用戶對於同一新聞的不同興趣點等關鍵問題。
圖1
圖2
與現有基於知識圖譜的推薦方法相比,該項研究主要解决了圖1所示的問題:對於新聞中的實體“Kevin Spacey”,存在較廣的語義資訊(如圖1右側所示);而根據用戶的點擊歷史可以看到User1和User2的興趣對應在“Kevin Spacey”的不同語義空間(如圖1左側所示),也就是說,當學習用戶的興趣表示時,我們需要删减知識圖譜中所關聯的部分知識,以便用戶的興趣得到很好的匹配。本文設計了一種遞迴圖卷積(RGC如圖2所示),利用從知識圖譜中選取的相關上下文實體,對用戶興趣圖進行遞迴補充。作者在兩個大型新聞數据集(英語和挪威語)上對該項研究做了大量實驗,實驗結果充分驗證了該工作的有效性。
近年來,研究者們針對新聞推薦相繼提出了各種解決方案。早期的研究主要集中在利用文字資訊來選取新聞的表示。與商品和電影相比,新聞文章的語義空間要廣泛得多。近期最新研究試圖利用知識圖譜中的外部知識來增强新聞的表示學習,並且取得了比較明顯的收益。然而外部知識圖譜的使用、新聞數据集的實體對齊和算灋的驗證非常耗費時間和精力。本研究在提出先進新聞推薦算灋的同時,也公開發佈了基於實驗數据集的知識圖譜對齊語料,以進一步促進學術界深入研究和相關產業界發展。
據悉,本届SIGIR會議共收到有效投稿720篇,長文錄用僅151篇,錄用率21%,被錄用的稿件反映了資訊檢索領域國際最前沿的研究水准。
本文版權歸原作者所有,文章內容不代表平臺觀點或立場。如有關於文章內容、版權或其他問題請與我方聯系,我方將在核實情况後對相關內容做删除或保留處理!