Voyager: 由 GPT-4 提供支持的 Minecraft 終身學習AI

Spread the love

https://80.lv/articles/voyager-gpt-4-powered-lifelong-learning-agent-for-minecraft/

編輯

“它通過編寫、改進、提交和從技能庫中檢索代碼來不斷改進自己。”

NVIDIA 的研究人員展示了 Voyager——第一個以 LLM 為動力的體現式終身學習代理,可以在上下文中玩 Minecraft。它“不斷探索世界,獲得各種技能,並在沒有人為乾預的情況下做出新發現。”

Voyager 由三個關鍵組件組成:

  1. 最大化探索的自動課程,
  2. 一個不斷增長的可執行代碼技能庫,用於存儲和檢索複雜的行為,
  3. 一種新的迭代提示機制,結合環境反饋、執行錯誤和程序改進的自我驗證。

“Voyager 通過黑盒查詢與 GPT-4 交互,這繞過了對模型參數微調的需要。……根據經驗,Voyager 顯示出強大的上下文終身學習能力,並且在玩 Minecraft 時表現出非凡的熟練程度。它獲得了 3.3 倍的獨特性項目,行進距離延長 2.3 倍,解鎖關鍵技術樹里程碑的速度比之前的 SOTA 快 15.3 倍。航海者能夠利用新 Minecraft 世界中學到的技能庫從頭開始解決新任務,而其他技術則難以推廣”

AI 科學家 Jim Fan解釋了AI 的工作原理:

“首先,Voyager 嘗試使用流行的 Javascript Minecraft API (Mineflayer) 編寫一個程序來實現特定目標。該程序在第一次嘗試時很可能是錯誤的。遊戲環境反饋和 javascript 執行錯誤(如果有)幫助 GPT- 4細化方案。

其次,Voyager 通過將成功的程序存儲在向量 DB 中來逐步構建技能庫。每個程序都可以通過嵌入其文檔字符串來檢索。複雜的技能是通過組合更簡單的技能來合成的,隨著時間的推移,這會復合 Voyager 的能力。

第三,自動課程根據智能體當前的技能水平和世界狀態提出合適的探索任務,例如,如果它發現自己在沙漠而不是森林中,則學習在鐵之前收穫沙子和仙人掌。

將所有這些放在一起,這是一個完整的數據流設計,可以在沒有任何人為乾預的情況下在廣闊的 3D 體素世界中推動終身學習。”

在這裡找到開源項目

留下一個答复

spot_img

More like this

【悠妮涅可 R...

https://www.youtube.com/live/SQuYx7txBd8 今晚來玩 順便宣傳站聚活動 【 誰是中之人 】 ✩前導影片▸   • 誰是中之人|前導預告片|PC Steam   ✩遊戲載點▸https://store.steampowered.com/app/2...

【 紗羅 ̵...

https://www.youtube.com/watch?v=lY3UiUmJ3-o Sara Ch. 紗羅 【群星計畫 / 比鄰星域所屬】 哈囉~ 我是紗羅!請多多指教! 虛擬中文系研究生,朝知識型Vtuber的方向努力著。 夢想是在家裡打造一座圖書館。 隸屬於臺灣Vtuber企業團體「比...

【水上玄子】《誰是中...

https://www.youtube.com/live/Dkj6FbsF0yI 大家好,我是病氣系vtuber水上玄子,擅長占卜、直覺溝通,目前常態企劃有鳥卦人生,請大家多多指教<3 生長自夢境,想成為人類與人們一同生活,先是變身成鳥,才終於成為人形。 病氣系vtuber,罹患焦...