Voyager: 由 GPT-4 提供支持的 Minecraft 終身學習AI

Spread the love

https://80.lv/articles/voyager-gpt-4-powered-lifelong-learning-agent-for-minecraft/

編輯

“它通過編寫、改進、提交和從技能庫中檢索代碼來不斷改進自己。”

NVIDIA 的研究人員展示了 Voyager——第一個以 LLM 為動力的體現式終身學習代理,可以在上下文中玩 Minecraft。它“不斷探索世界,獲得各種技能,並在沒有人為乾預的情況下做出新發現。”

Voyager 由三個關鍵組件組成:

  1. 最大化探索的自動課程,
  2. 一個不斷增長的可執行代碼技能庫,用於存儲和檢索複雜的行為,
  3. 一種新的迭代提示機制,結合環境反饋、執行錯誤和程序改進的自我驗證。

“Voyager 通過黑盒查詢與 GPT-4 交互,這繞過了對模型參數微調的需要。……根據經驗,Voyager 顯示出強大的上下文終身學習能力,並且在玩 Minecraft 時表現出非凡的熟練程度。它獲得了 3.3 倍的獨特性項目,行進距離延長 2.3 倍,解鎖關鍵技術樹里程碑的速度比之前的 SOTA 快 15.3 倍。航海者能夠利用新 Minecraft 世界中學到的技能庫從頭開始解決新任務,而其他技術則難以推廣”

AI 科學家 Jim Fan解釋了AI 的工作原理:

“首先,Voyager 嘗試使用流行的 Javascript Minecraft API (Mineflayer) 編寫一個程序來實現特定目標。該程序在第一次嘗試時很可能是錯誤的。遊戲環境反饋和 javascript 執行錯誤(如果有)幫助 GPT- 4細化方案。

其次,Voyager 通過將成功的程序存儲在向量 DB 中來逐步構建技能庫。每個程序都可以通過嵌入其文檔字符串來檢索。複雜的技能是通過組合更簡單的技能來合成的,隨著時間的推移,這會復合 Voyager 的能力。

第三,自動課程根據智能體當前的技能水平和世界狀態提出合適的探索任務,例如,如果它發現自己在沙漠而不是森林中,則學習在鐵之前收穫沙子和仙人掌。

將所有這些放在一起,這是一個完整的數據流設計,可以在沒有任何人為乾預的情況下在廣闊的 3D 體素世界中推動終身學習。”

在這裡找到開源項目

留下一個答复

spot_img

More like this

《我的同學竟然是女優...

🔞 成人校園戀愛模擬新作《我的同學竟然是女優!?》Steam 商店頁公開!由 第四の壁 開發、永恆艾莉絲工坊 Eternal Alice Studio 發行的 R18 模擬戀愛新作 《我的同學是女優》(My Classmate is AV Actress),現已登陸 Steam,商店頁同步開放願望清...

2025 年發布的 ...

史蒂芬沃里克 出版​2025年7月16日 生成式人工智慧將繼續存在 (圖片來源:未來) 一項關於 Steam 上生成式 AI 遊戲開發應用程式激增的最新研究顯示,揭露該技術應用程式的遊戲數量驚人地增加了 681%。事實上,根據Totally Hu...

《魔獸世界:午夜》擴...

亞歷山大‧科普( Alexander Cope ) 發表 2025年7月16日 準備好您的日曆,因為《魔獸世界》世界之魂傳奇的下一章將於 2025 年 8 月 19 日在 Gamescom 上隆重揭曉。 《魔獸世界》的世界魂傳奇在《魔獸世界:午夜》中延續。 (...