瀋陽自動化所在基於深度强化學習的車間智慧調度方面研究取得新進展

由於車間調度問題大多屬於NP難問題,傳統元啟發式演算法只能在多項式時間內求得近優解。對大規模問題,元啟發式演算法的求解時間難以滿足動態生產環境下實时決策的需求。如何對可重構車間的生產調度和車間重構進行實时優化和動態協同,是研究的難點。該研究得到了國家自然科學基金和遼寧省自然科學基金專案的支持。

基於深度强化學習的智慧調度和重構系統架構

訓練過程中目標值的下降曲線

近日,中國科學院瀋陽自動化研究所在車間智慧調度方面研究取得新進展,基於深度强化學習方法實現了動態訂單下可重構車間對動態生產調度和車間重構的實时優化和智慧決策,研究成果發表在International Journal of Production Research

由於車間調度問題大多屬於NP難問題,傳統元啟發式演算法只能在多項式時間內求得近優解。對大規模問題,元啟發式演算法的求解時間難以滿足動態生產環境下實时決策的需求。另外,小批量定制化的生產模式,要求車間滿足動態可重構。如何對可重構車間的生產調度和車間重構進行實时優化和動態協同,是研究的難點。

科研人員基於深度强化學習方法,將生產調度和車間重構的決策過程建模為馬爾科夫決策過程,建立了調度和重構系統的深度强化學習模型,設計了獎勵函數、狀態空間和行為空間等。訓練後,決策智慧體在求解質量和求解時間上取得了比2種元啟發式演算法(反覆運算貪婪算灋和遺傳演算法)更優的結果。智慧體對單個工件的決策時間僅為1.47ms,可用於動態生產環境下可重構車間的實时優化和智慧決策。

該研究得到了國家自然科學基金和遼寧省自然科學基金專案的支持。

本文標題: 瀋陽自動化所在基於深度强化學習的車間智慧調度方面研究取得新進展
永久網址: https://www.laoziliao.net/doc/1656041858844506
相关資料
瀋陽自動化所提出基於時空四維卷積網絡的海洋溫度預測模型
近日,中國科學院瀋陽自動化研究所在海洋溫度預測方法研究中取得新進展,提出的基於立體空間-時間的四維卷積模型高精度應用於海水溫度預測。瀋陽自動化所數位工廠研究室大數據課題組提出一種基於時空四維卷積網絡的模型,此模型由四維卷積網絡、殘差網絡、再
標籤: 卷積 預測模型 網絡模型 科學 科普
Nature子刊|復旦大學喬亮等提出了用於從DIA數據中對完整的糖肽進行全蛋白質組表徵的方法,或可成為糖蛋白組學研究的强有力工具
在糖蛋白組學中,對完整的糖肽進行大規模的分析是至關重要的,但也是具有挑戰性的。數據獨立採集是一項新興技術,在蛋白質組學研究中具有深度的蛋白質組覆蓋和精確的定量能力,但在糖蛋白組學領域仍處於早期發展階段。該研究提出了GproDIA,一個將以肽
標籤: 糖蛋白 dia 科普
浙大雷鳴課題組,採用富勒烯光電資料提高鈣鈦礦太陽能電池效能的研究取得新進展
研究背景和基礎:富勒烯衍生物在有機太陽能電池中作為受體資料發揮了至關重要的作用,某些功能化的富勒烯衍生物還可以作為陰極介面修飾層資料改善光活性層和陰極之間介面層的電學特性,顯著提高正向和反向結構光伏器件的能量轉化效率。隨著近十年來研究的不斷
標籤: 富勒烯 鈣鈦礦太陽能電池 光電資料 太陽能電池 光電轉換 科學
史上最强“食物指南針”來了!看看你平時愛吃的那些東西有多不健康…
眾所周知,“多吃水果和蔬菜,少吃甜食和肉食”是健康飲食的基本準則。“食物指南針”可以用於對各種食品、飲料和混合菜肴的整體健康狀況進行客觀的科學評估。為了全面客觀評估食物的營養成分,研究團隊歷時三年開發了這套名為“食物指南針”的新型營養成分分
標籤: 羅盤 蔬菜