Imagic圖片魔法:用AI擴散模型的提示文字來編輯靜態圖片

Spread the love

https://80.lv/articles/imagic-editing-images-with-text-prompts/

編輯

擴散模型的另一個令人印象深刻的實現。

如果您曾經需要編輯照片但沒有合適的技能,那麼您可能會對這項研究感興趣。作者介紹了 Imagic——一種可以根據文本提示轉換圖像的方法。它可以改變圖像中一個或多個對象的姿勢和構圖,同時保留其原始特徵。

該方法僅需要具有所需結果的單個輸入圖像和文本。它不需要圖像蒙版或對象的其他視圖,這使其成為真正有價值的工具。 

“我們的方法,我們稱之為“Imagic”,利用預訓練的文本到圖像擴散模型來完成這項任務。它產生與輸入圖像和目標文本對齊的文本嵌入,同時微調擴散模型來捕捉圖像特定的外觀。”研究論文指出。

該方法並不像看起來那麼輕鬆。您可以從此處使用 Stable Diffusion 的 Imagic 實現中看到它需要一個具有大約 30GB VRAM 的 GPU。您看到的示例在 Lambda Labs 的 A100 上處理每張圖像大約需要 5 分鐘。

單擊此處了解有關 Imagic 的更多信息

留下一個答复

spot_img

More like this

【 紗羅 ̵...

https://www.youtube.com/watch?v=lY3UiUmJ3-o Sara Ch. 紗羅 【群星計畫 / 比鄰星域所屬】 哈囉~ 我是紗羅!請多多指教! 虛擬中文系研究生,朝知識型Vtuber的方向努力著。 夢想是在家裡打造一座圖書館。 隸屬於臺灣Vtuber企業團體「比...

【水上玄子】《誰是中...

https://www.youtube.com/live/Dkj6FbsF0yI 大家好,我是病氣系vtuber水上玄子,擅長占卜、直覺溝通,目前常態企劃有鳥卦人生,請大家多多指教<3 生長自夢境,想成為人類與人們一同生活,先是變身成鳥,才終於成為人形。 病氣系vtuber,罹患焦...

【納希斯Narcis...

https://www.youtube.com/watch?v=YArbmONSXUE 本週六日11/9-11/10在花博,巴哈姆特要28周年站聚啦! 聯合各家 VTuber 相關獨立遊戲開發團隊,並打造了雙面巨型看板,邀請120位台灣VTuber主播們一起幫巴哈慶生。 歡迎大家到現場...