近日,第28届ACM知識發現與資料挖掘會議(KDD 2022)官方發佈論文錄用結果,電子科技大學資訊與軟體工程學院碩士生和大學生為第一作者的兩篇論文被大會接收,周帆副教授為論文指導教師和通訊作者,資訊與軟體工程學院為第一作者單位和通訊組織。
圖1SPGCL損失函數示意圖
2020級碩士生黎嶸繁和2019級大學生蔣新科為共同第一作者的論文“Mining Spatio-Temporal Relations via Self-Paced Graph Contrastive Learning”被ResearchTrack接收。
該研究提出了一種新的時空圖數據學習方法SPGCL,解决了現存時空圖預測模型中的鄰接關係不完善問題(如圖1所示),證明了節點和其鄰居的全域最優和反覆運算的局部最優等價,並且利用對比學習和正例-無標籤學習提出了自我調整的構圖方法,能為不同的節點尋找相適應的互資訊最大化的鄰居集合,同時使得預測損失最小化。相比較以往相關研究,該研究的優勢在於一是能動態地構建網絡而不是基於靜態的超參數;二是為通過互資訊建立優化目標函數提供理論依據;三是不依賴某個特定的特徵和預處理,而是通過對比學習强化嵌入表示。該研究可作為通用算灋應用於時空内容預測任務,在公開數据集上進行的大量實驗,證明了與之前最先進的基線方法相比該方案的優越性。
圖2GraphGeo框架圖示
2020級碩士研究生王志遠和2019級大學生曾文軒以共同第一作者身份發表的論文“Connecting the Hosts: Street-Level IP Geolocation with Graph Neural Networks”被AppliedDataScienceTrack接收。
該研究專注於街道級IP地址定位問題,即將給定的任意IP地址識別為其所在的地理位置標識。此前,該問題主要通過量測路由時延等拓撲資訊,或綜合IP相關資料庫的特徵實現。然而傳統方法存在資訊局限性問題,忽略了IP地址與地標之間的關係。該研究通過引入圖神經網路來克服這一局限性,並提出了系統性的IP街道級定位框架GraphGeo(如圖1所示)。該框架首先以公共路由器為中心,構建目標IP與地標之間的結構關係,並通過空間距離和特徵相似度進行賦權。隨後通過圖神經網路融合IP地址的特徵和鄰域關係,選取區域公共知識和拓撲。此外,針對網路環境的不穩定性,該方法進行了概率性建模,使得圖結構學習和IP定位結果更具魯棒性。
KDD為資料挖掘領域的頂級會議,中國電腦學會(CCF)評級為A類會議。KDD包含兩個Track,其中AppliedDataScienceTrack面向工業、互聯網和商業等實際數據科學應用場景,ResearchTrack則聚焦於資料挖掘理論、科技和算灋的創新性研究,本届KDD兩個Track的錄用率分別為25%和15%。