標籤聚合:强化學習

査詢所有有關於標籤强化學習的老資料

瀋陽自動化所在基於深度强化學習的車間智慧調度方面研究取得新進展
由於車間調度問題大多屬於NP難問題,傳統元啟發式演算法只能在多項式時間內求得近優解。對大規模問題,元啟發式演算法的求解時間難以滿足動態生產環境下實时決策的需求。如何對可重構車間的生產調度和車間重構進行實时優化和動態協同,是研究的難點。該研究
標籤: 機器學習 强化學習 重構
清華交叉資訊研究院高陽課題組在强化學習領域取得新突破
近日,清華大學交叉資訊研究院高陽研究組在强化學習領域中取得突破,研究組所提出的模型EfficientZero首次在雅達利遊戲數據上超過同等遊戲時長的人類平均水準。EfficientZero的高效率學習能力為强化學習算灋應用到現實世界場景提供
標籤: 强化學習 機器學習 科普 人工智慧 算灋
自動化所類腦智慧研究中心通過多尺度動態編碼助力脈衝網絡實現高效强化學習
近期,自動化所類腦智慧研究中心徐波、張鐵林團隊,通過將生物系統中多尺度資訊的高效編碼、細胞集羣的時空資訊綜合機制加入到脈衝神經網路中來,在多類强化學習任務中取得了超過深度强化學習的突出表現。
標籤: 機器學習 强化學習 網絡編碼 神經網路
合肥研究院科研團隊提出模仿人眼的强化表徵AI學習模型
近日,中科院合肥研究智慧所先進製造研究中心王紅强研究員團隊與中啟人工智慧聯合實驗室提出利用有效視野域理論强化表徵AI學習模型,並證實該模型能够顯著提高目標檢測效能。鑒於此,科研人員提出模仿人眼有效感受野區域來增强表徵學習。
標籤: 强化學習 人工智慧 科普
讓算灋“適應”不同環境丨人工智慧頂會ICLR,2022收錄西湖大學王東林課題組最新成果
你是如何在不同的環境中行走的?對人類來說,根據不同環境調整自身行為以達到相同目的是如此簡單。但對機器人而言,適應複雜環境是個眾所周知的難題。此項研究在西湖大學王東林老師的指導下,由19級博士生劉金鑫和科研助理張洪銀共同完成。
標籤: 機器人 人工智慧 機器學習 强化學習 智慧算灋 自我調整
上海光機所再使用深度强化學習實現雷射自動鎖模研究方面取得重要進展
數值模擬表明,雷射腔的動態特徵可以從光譜序列中獲得,與傳統的進化蒐索算灋相比,該模型大大提高了鎖模蒐索的效率。在實驗中,所提出的算灋平均只用了690ms即可獲得穩定的鎖模狀態,蒐索次數比傳統方法少一個數量級,也是現時報導蒐索次數最少的方法(
標籤: 强化學習 上海光機所 機器學習 雷射器 算灋
OpenAI,挑戰《索尼克》,阿裏南大隊如何一舉奪魁?
近日,OpenAI舉辦了首届强化學習競賽RetroContest,比賽主題就是“用AI玩《刺猬索尼克》遊戲”,吸引了全球數百支隊伍的競技追逐。最終,由阿裡南大的聯合團隊Dharmaraja(法王)隊以壓倒性優勢獲得了冠軍。今天,我們邀請了團
標籤: 索尼克 强化學習 機器學習 阿裡 測試模型 智慧算灋