科技日報北京8月7日電(記者華淩)記者7日從清華大學獲悉,該校電子系方璐教授課題組與自動化系戴瓊海教授課題組在智慧光晶片領域取得重大進展。他們首創全前向智慧光計算訓練架構,研製出“太極-Ⅱ”光晶片,實現了大規模神經網路的原位光訓練,為人工智慧(AI)大模型探索了光訓練的新路徑。相關成果線上發表於最新一期國際學術期刊《自然》。
AI大模型的迅猛發展和廣泛應用,使算力成為關鍵的戰畧資源。智慧光計算憑藉高算力、低能耗的優勢,在後摩爾時代展現出巨大潜力。訓練和推理,是AI大模型核心能力的兩大基石。此前,智慧光晶片“太極”的問世,為大規模複雜任務的“推理”帶來了曙光,但未能釋放光計算的“訓練之能”。現有光神經網路的訓練嚴重依賴GPU離線建模,並要求高度匹配的前向-反向傳播模型。這對光計算系統的精准對齊提出苛刻要求,致使梯度計算難、訓練規模小,禁錮了光計算的優勢。
“與現有訓練範式不同,我們摒弃了反向傳播,另闢蹊徑,構建了光神經網路的對稱傳播模型,僅用光學系統的前向傳播即可實現高效高精度光訓練。”方璐告訴科技日報記者。
據介紹,“太極-Ⅱ”的問世,填補了智慧光計算在大規模神經網路訓練這一覈心領域的空白。除了加速AI模型訓練外,其還在高性能智慧成像、高效解析拓撲光子系統等方面表現出卓越性能,為人工智慧大模型、通用人工智慧、複雜智慧系統的高效精准訓練開闢了新路徑。