Voyager: 由 GPT-4 提供支持的 Minecraft 終身學習AI

Spread the love

https://80.lv/articles/voyager-gpt-4-powered-lifelong-learning-agent-for-minecraft/

編輯

“它通過編寫、改進、提交和從技能庫中檢索代碼來不斷改進自己。”

NVIDIA 的研究人員展示了 Voyager——第一個以 LLM 為動力的體現式終身學習代理,可以在上下文中玩 Minecraft。它“不斷探索世界,獲得各種技能,並在沒有人為乾預的情況下做出新發現。”

Voyager 由三個關鍵組件組成:

  1. 最大化探索的自動課程,
  2. 一個不斷增長的可執行代碼技能庫,用於存儲和檢索複雜的行為,
  3. 一種新的迭代提示機制,結合環境反饋、執行錯誤和程序改進的自我驗證。

“Voyager 通過黑盒查詢與 GPT-4 交互,這繞過了對模型參數微調的需要。……根據經驗,Voyager 顯示出強大的上下文終身學習能力,並且在玩 Minecraft 時表現出非凡的熟練程度。它獲得了 3.3 倍的獨特性項目,行進距離延長 2.3 倍,解鎖關鍵技術樹里程碑的速度比之前的 SOTA 快 15.3 倍。航海者能夠利用新 Minecraft 世界中學到的技能庫從頭開始解決新任務,而其他技術則難以推廣”

AI 科學家 Jim Fan解釋了AI 的工作原理:

“首先,Voyager 嘗試使用流行的 Javascript Minecraft API (Mineflayer) 編寫一個程序來實現特定目標。該程序在第一次嘗試時很可能是錯誤的。遊戲環境反饋和 javascript 執行錯誤(如果有)幫助 GPT- 4細化方案。

其次,Voyager 通過將成功的程序存儲在向量 DB 中來逐步構建技能庫。每個程序都可以通過嵌入其文檔字符串來檢索。複雜的技能是通過組合更簡單的技能來合成的,隨著時間的推移,這會復合 Voyager 的能力。

第三,自動課程根據智能體當前的技能水平和世界狀態提出合適的探索任務,例如,如果它發現自己在沙漠而不是森林中,則學習在鐵之前收穫沙子和仙人掌。

將所有這些放在一起,這是一個完整的數據流設計,可以在沒有任何人為乾預的情況下在廣闊的 3D 體素世界中推動終身學習。”

在這裡找到開源項目

留下一個答复

spot_img

More like this

人工智慧儲存架構師指...

開發人員傾向於軟體定義、開源、雲端原生且簡單的技術。這本質上定義了物件儲存。 Keith Pijanowski Keith Pijanowskion AI/ML 15 June 2023 介紹 為機器學習 (ML) 專案的所有階段選擇最佳儲存至關重要。研究工程師需要建立多個版本的資料集並嘗...

UREAL虛幻引擎助...

麥克威廉斯 | 2023年9月21日   Kee Zhang是完美世界遊戲旗下Hotta Studio的遊戲製作人。他已經在線上遊戲開發領域深耕了19年。 在蝸牛遊戲的黑金工作室工作期間,他參與開發了《航海世紀》、《太極熊貓》的前三個版本、《天堂2》等眾多作品。 2018年,他加入...

80 Level D...

https://80.lv/articles/80-level-digest-insights-into-japanese-game-design-interviews-and-talks-with-talented-developers/ 安娜凱斯勒 編輯 今天,我們收集了幾個有見地的採訪...