Voyager: 由 GPT-4 提供支持的 Minecraft 終身學習AI

Spread the love

https://80.lv/articles/voyager-gpt-4-powered-lifelong-learning-agent-for-minecraft/

編輯

“它通過編寫、改進、提交和從技能庫中檢索代碼來不斷改進自己。”

NVIDIA 的研究人員展示了 Voyager——第一個以 LLM 為動力的體現式終身學習代理,可以在上下文中玩 Minecraft。它“不斷探索世界,獲得各種技能,並在沒有人為乾預的情況下做出新發現。”

Voyager 由三個關鍵組件組成:

  1. 最大化探索的自動課程,
  2. 一個不斷增長的可執行代碼技能庫,用於存儲和檢索複雜的行為,
  3. 一種新的迭代提示機制,結合環境反饋、執行錯誤和程序改進的自我驗證。

“Voyager 通過黑盒查詢與 GPT-4 交互,這繞過了對模型參數微調的需要。……根據經驗,Voyager 顯示出強大的上下文終身學習能力,並且在玩 Minecraft 時表現出非凡的熟練程度。它獲得了 3.3 倍的獨特性項目,行進距離延長 2.3 倍,解鎖關鍵技術樹里程碑的速度比之前的 SOTA 快 15.3 倍。航海者能夠利用新 Minecraft 世界中學到的技能庫從頭開始解決新任務,而其他技術則難以推廣”

AI 科學家 Jim Fan解釋了AI 的工作原理:

“首先,Voyager 嘗試使用流行的 Javascript Minecraft API (Mineflayer) 編寫一個程序來實現特定目標。該程序在第一次嘗試時很可能是錯誤的。遊戲環境反饋和 javascript 執行錯誤(如果有)幫助 GPT- 4細化方案。

其次,Voyager 通過將成功的程序存儲在向量 DB 中來逐步構建技能庫。每個程序都可以通過嵌入其文檔字符串來檢索。複雜的技能是通過組合更簡單的技能來合成的,隨著時間的推移,這會復合 Voyager 的能力。

第三,自動課程根據智能體當前的技能水平和世界狀態提出合適的探索任務,例如,如果它發現自己在沙漠而不是森林中,則學習在鐵之前收穫沙子和仙人掌。

將所有這些放在一起,這是一個完整的數據流設計,可以在沒有任何人為乾預的情況下在廣闊的 3D 體素世界中推動終身學習。”

在這裡找到開源項目

留下一個答复

spot_img

More like this

史上最香轉學生!《我...

由「第四の壁」團隊傾力開發、永恆艾莉絲工坊發行的成人向校園戀愛模擬遊戲《我的同學是女優!?》,於 23 日在Steam平台正式發售!本作支援繁體中文、簡體中文、英文、日文、韓文及俄文共六種語言,讓全球玩家都能無障礙體驗這場心跳加速的校園戀愛物語。 ▌ 從青澀到大師:一場改變人生的特別「...

《Pokémon G...

圖1-「GO集章趣」將於10月21日至11月16日於臺灣首次登場!更有期間限定的裝飾背景板與精美好禮在臺北市立兒童新樂園等你。 《Pokémon GO》今宣佈「GO集章趣」將於2025年10月21日至11月16日登陸臺北市立兒童新樂園,將帶來滿滿驚喜與好禮,同時將於10月24日~10月26日周...

《Pokémon G...

【Niantic新聞提供】 《Pokémon GO》推出「Take a GO!走出趣!」36條台灣在地「官方路線」!跟著寶可夢一起穿梭城市體驗另類文化樂趣! 圖1-《Pokémon GO》推出「Take a GO!走出趣!」台灣專屬「官方路線」, 邀您走遍5大主題36條路線...