Imagic圖片魔法:用AI擴散模型的提示文字來編輯靜態圖片

Spread the love

https://80.lv/articles/imagic-editing-images-with-text-prompts/

編輯

擴散模型的另一個令人印象深刻的實現。

如果您曾經需要編輯照片但沒有合適的技能,那麼您可能會對這項研究感興趣。作者介紹了 Imagic——一種可以根據文本提示轉換圖像的方法。它可以改變圖像中一個或多個對象的姿勢和構圖,同時保留其原始特徵。

該方法僅需要具有所需結果的單個輸入圖像和文本。它不需要圖像蒙版或對象的其他視圖,這使其成為真正有價值的工具。 

“我們的方法,我們稱之為“Imagic”,利用預訓練的文本到圖像擴散模型來完成這項任務。它產生與輸入圖像和目標文本對齊的文本嵌入,同時微調擴散模型來捕捉圖像特定的外觀。”研究論文指出。

該方法並不像看起來那麼輕鬆。您可以從此處使用 Stable Diffusion 的 Imagic 實現中看到它需要一個具有大約 30GB VRAM 的 GPU。您看到的示例在 Lambda Labs 的 A100 上處理每張圖像大約需要 5 分鐘。

單擊此處了解有關 Imagic 的更多信息

留下一個答复

spot_img

More like this

《魔獸世界:午夜》擴...

亞歷山大‧科普( Alexander Cope ) 發表 2025年7月16日 準備好您的日曆,因為《魔獸世界》世界之魂傳奇的下一章將於 2025 年 8 月 19 日在 Gamescom 上隆重揭曉。 《魔獸世界》的世界魂傳奇在《魔獸世界:午夜》中延續。 (...

介紹Discord新...

Discord Orb 是一種全新的虛擬平台貨幣,目前由 Discord 正式推出,並逐步開放給使用者使用: 🎯 Discord Orbs 是什麼? Orbs 是一種透過完成「Quests(探索任務)」所獲得的虛擬獎勵貨幣,使用者可在 Discord Desktop ...

100% Orang...

是時候用全新卡牌包來點燃派對了!全新「課外活動包」卡牌包現已推出100% 橙汁版本,包含 12 張新卡牌、一種新卡牌類型和 2 個新卡牌關鍵字! 100% 柳橙汁支援英語、日語、西班牙語、巴西葡萄牙語、韓語、俄語以及簡體中文和繁體中文,是自 2014 年以來 Steam 上最受歡迎的日本桌遊。...