世界模型WHALE來了!
因此,具身智能體可以與世界模型進行交互,而不是直接與現實世界環境交互,以生成模擬數據,這些數據可以用于各種下游任務,包括反事實預測、離線策略評估、離線強化學習。
世界模型在具身環境的決策中起著至關重要的作用,使得在現實世界中成本高昂的探索成為可能。為了促進有效的決策,世界模型必須具備強大的泛化能力,以支持分布外(OOD)區域的想象,并提供可靠的不確定性估計來評估模擬體驗的可信度,這兩者都對之前的可擴展方法提出了重大挑戰。
近日,來自南京大學、南棲仙策等機構的研究者在論文中引入了WHALE(World models with beHavior-conditioning and retrAcing-rollout LEarning),這是一個用于學習可泛化世界模型的框架,由兩種可以與任何神經網絡架構普遍結合的關鍵技術組成。
在確定策略分布差異是泛化誤差的主要來源的基礎上,研究者引入了一種行為—條件(behavior-conditioning)技術來增強世界模型的泛化能力,該技術建立在策略條件模型學習的概念之上,旨在使模型能夠主動適應不同的行為,以減小分布偏移引起的外推誤差。此外,研究者還提出了一種簡單而有效的技術,稱為retracing-rollout,以便對模型想象進行有效的不確定性估計,作為一種即插即用的解決方案,可以有效地應用于各種實施任務中的末端執行器姿態控制,而無需對訓練過程進行任何更改。
通過整合WHALE的這兩種技術,研究者提出了WHALE-ST,這是一種可擴展的基于時空transformer的世界模型,旨在實現更有效的決策。研究者進一步提出了WHALE-X,這是一個在970K機器人演示上預訓練的414M參數世界模型。最后,研究者進行了大量的實驗,以證明WHALE-ST和WHALE-X在模擬和現實世界任務中的卓越可擴展性與泛化性,突出了它們在增強決策方面的效果。
為了評估WHALE-X在實際物理環境中的泛化能力,研究團隊在ARX5機器人上進行了全面實驗。與預訓練數據不同,評估任務調整了攝像機角度和背景等,增加了對世界模型的挑戰。他們收集了每個任務60條軌跡的數據集用于微調,任務包括開箱、推盤、投球和移動瓶子,還設計了多個模型從未接觸過的任務來測試模型的視覺、運動和任務泛化能力。
結果顯示,WHALE-X在真實世界中展現出明顯的優勢:與沒有行為—條件的模型相比,WHALEX的一致性提高了63%,表明該機制顯著提升了OOD泛化能力;在97萬個樣本上進行預訓練的WHALE-X,比從零開始訓練的模型具有更高的一致性,凸顯了大規模互聯網數據預訓練的優勢;增加模型參數能夠提升世界模型的泛化能力,WHALE-X-base(203M)動態模型在三個未見任務中的一致性比率是77M版本的3倍。此外,視頻生成質量與一致性的結果一致。通過行為—條件策略、大規模預訓練數據集和擴展模型參數,三種策略結合,顯著提高了模型的OOD泛化能力,尤其是在生成高質量視頻方面。
關鍵詞:
責任編輯:孫知兵
免責聲明:本文僅代表作者個人觀點,與太平洋財富網無關。其原創性以及文中陳述文字和內容未經本站證實,對本文以及其中全部或者部分內容、文字的真實性、完整性、及時性本站不作任何保證或承諾,請讀者僅作參考,并請自行核實相關內容。
如有問題,請聯系我們!
- 世界模型WHALE來了!2024-11-23
- 安陽同德醫院看病怎么樣?專業治療安陽看男2024-11-23
- 報告:生成式人工智能帶來智慧旅游發展新機2024-11-23
- 浙江義烏市場6.0時代:海量新技術成為商人2024-11-23
- 國際金融論壇香港舉行年會 探討中國企業“2024-11-23
- 加快推進制造業數字化綠色化協同轉型發展2024-11-23
- 國際游客“趕早”,中國冰雪經濟升溫2024-11-23
- 企業反映經營還有困難?多部門表態:持續推2024-11-23
- 滬指周五跌逾3% 互聯網電商板塊逆勢上漲2024-11-23
- 中歐班列(鄭州)開行突破10000列 通達歐2024-11-23
- 廣州地鐵正建設19條線路 總里程年底將突破2024-11-23
- 今年前九月廣州新設外資企業同比增長32.2%2024-11-23
- (經濟觀察)熱門中概股密集發布三季度業績2024-11-23
- 搜狗輸入法全面升級,讓輸入框變身搜索框2024-11-23
- 我國充電基礎設施建設駛上“快車道” 汽車2024-11-23
- 國家外匯局:10月中國外匯市場總計成交24.22024-11-23
- 三方面9條政策助力外貿企業穩訂單拓市場 2024-11-23
- 透過烏鎮看未來:數字警務“智慧護航”互聯2024-11-23
- 中外嘉賓天津共論職業技術教育合作機遇2024-11-23
- 中國貿促會:全球經貿摩擦呈加劇態勢2024-11-23
- 文旅部:促進旅行社研學旅游業務健康發展2024-11-23
- 擁壯闊維港煙花海景 香港啟德天瀧暢享奢華2024-11-22
- 冬季如何防護才能保持血壓的穩定?醫生解答2024-11-22
- 上海科研團隊研究成果再登《自然》 提出限2024-11-22
- 中新健康|高速擴張暗藏隱憂 塔斯汀屢陷食2024-11-22
- 創新保險模式 助力經濟社會高質量發展2024-11-22
- 小雪節氣后如何避免陽氣損害?中醫專家建議2024-11-22
- 中新真探:吃桂圓能補血嗎?2024-11-22
- 中新健康|六部門:完善基層藥品聯動管理 2024-11-22
- 黑龍江中俄友好醫院揭牌:多領域合作為兩國2024-11-22
精彩推薦
- 小黃象攜手中國國家U18冰球隊,以熱愛書...
- 北京花卉交易中心豐富市民“花樣”生活
- 南漳柑橘“致富經”:高山盆地“金果”...
- 市場監管總局:推動平臺企業和平臺內商...
- 遇見非遺丨把沉睡的泥土鐫刻進生活
- “江南蔬菜之鄉”江西樂平3000余畝水芹...
- 襄陽牛肉面:“熱辣滾燙”顯“俠義”
- 【百萬莊小課堂】今天你emo了嗎?職場青...
- 中國試點開放信用監管數據 便利境外來...
- 深圳年度最大規模畢業生雙選會提供崗位3...
- 廣西桂林滿城桂花飄香
- 江南造船中東代表處揭牌 續簽兩艘液氨...
- 首屆全國小戲小品展演將于十月中旬在長...
- 阿爾卡拉斯止步上海網球大師賽男單八強
- 健全糧食和食物節約長效機制(話說新農村)