Imagic圖片魔法:用AI擴散模型的提示文字來編輯靜態圖片

Spread the love

https://80.lv/articles/imagic-editing-images-with-text-prompts/

編輯

擴散模型的另一個令人印象深刻的實現。

如果您曾經需要編輯照片但沒有合適的技能,那麼您可能會對這項研究感興趣。作者介紹了 Imagic——一種可以根據文本提示轉換圖像的方法。它可以改變圖像中一個或多個對象的姿勢和構圖,同時保留其原始特徵。

該方法僅需要具有所需結果的單個輸入圖像和文本。它不需要圖像蒙版或對象的其他視圖,這使其成為真正有價值的工具。 

“我們的方法,我們稱之為“Imagic”,利用預訓練的文本到圖像擴散模型來完成這項任務。它產生與輸入圖像和目標文本對齊的文本嵌入,同時微調擴散模型來捕捉圖像特定的外觀。”研究論文指出。

該方法並不像看起來那麼輕鬆。您可以從此處使用 Stable Diffusion 的 Imagic 實現中看到它需要一個具有大約 30GB VRAM 的 GPU。您看到的示例在 Lambda Labs 的 A100 上處理每張圖像大約需要 5 分鐘。

單擊此處了解有關 Imagic 的更多信息

留下一個答复

spot_img

More like this

《奇幻生活i轉圈圈的...

《奇幻生活i轉圈圈的龍和偷取時間的少女》銷售破百萬套 確定追加全新免費DLC,預定實裝Roguelike 開放世界模式! 圖1-《奇幻生活i轉圈圈的龍和偷取時間的少女》將追加Roguelike 開放世界模式至大大大陸 LEVEL5 Inc. 宣布,慢活系探險RPG遊戲《奇幻生活i轉圈圈的龍和...

關於Wordefen...

我們最近在一篇討論 XML-RPC 暴力破解攻擊的部落格文章中,提出了一些關於如何在 WordPress 上停用 XML-RPC 的問題。為了消除您的疑惑,我們想詳細解釋 XML-RPC 的功能,以及您是否應該考慮停用它。 WordPress 上的XML-RPC 實際上是一個 API,即「應用...

MAMIYA ...

2024 年 11 月 22 日,Fruitbat Factory為紀念《MAMIYA - Complete Collection》發行一周年,發布了遊戲的藝術書!MAMIYA - 數位藝術書包含 208 頁的角色設計、插圖、草圖、未發布的藝術作品以及開發者 Kokoroten 的評論,深入了解遊戲...