谷歌P圖神器來了！不用學不用教，輸入一句話，分分鐘給結果

2022-11-07 由尉遲長喜發佈於奇聞

Pine 發自凹非寺

量子位 | 公眾號 QbitAI

當你拍照片時，“模特不好好配合”怎麼辦？

沒事！現在只用一句話就能後期P圖了，還是能改變動作、表情的那種！

比如説你能輕鬆讓鳥張開翅膀（輸入“張開翅膀的鳥”即可）：

又或者説，想要讓一隻站立的狗蹲下：

看起來還真不賴！而這個新的“P圖”方法呢，名叫Imagic，是基於爆火的擴散模型（Diffusion Model）來實現的。

是的，又是擴散模型，它的能耐想必也不用多介紹了吧（那看那鋪天蓋地和它相關的論文就能佐證）。

那在擴散模型加持下的Imagic到底有何厲害之處，話不多説，一起來看看吧！

多達6種功能

據不完全統計，Imagic的功能就有6種。

改變姿勢、變換構圖、切換濾鏡、多個對象編輯、添加對象、更改顏色……

先來看看這個P圖神器改變姿勢的效果，比如説輸入一條站立的狗，通過變換提示文字，得到的效果是醬紫的～

或者説輸入一個隨意站立的人，輸入口令，他就“乖乖聽話，任你擺佈”（手動狗頭）了，甚至還能憑空出現一個水杯。

還沒看夠？那再來康康Imagic其他功能：改變顏色，或者增加對象，也可以多種功能同時使用。

總的來説，Imagic的厲害之處太多，這裏就不一一詳細展開了，效果可以看下圖。

除了這麼多功能之外，Imagic還有另外一個比較人性化的點，就是當你告訴它要如何“P圖”後，它會隨機生成幾個不同的選項供你選擇。

其實這種在真實圖像上編輯的模型Imagic不是第一個，在此之前就已經有很多個類似的模型。

這時就會有網友問了，“Imagic有什麼厲害的點呢？”

話不多説，直接上效果對比。

這裏選取了比較常見的基於真實圖像編輯的兩個模型：SDEdit、Text2LIVE與Imagic作對比。

結果很顯然，Imagic完成“P圖指令”的效果很好，在細節上也絲毫不遜色其他模型。

（確實妙啊）

那Imagic是如何“擊敗”SDEdit、Text2LIVE，實現這樣的效果呢？

是怎樣實現的

千言萬語匯成四個字：擴散模型，在論文的標題上它都赫然在列。

具體到Imagic中，擴散模型的作用是如何發揮出來的，來看看詳細的“P圖”過程。

整體來説分為三大步。

第一步是優化文本嵌入層。

具體來説，先給定輸入的圖像和目標文本，然後對目標文本進行編碼，得到初始的嵌入層。

然後不斷調整初始嵌入層，讓其能夠通過預先訓練的擴散模型很好地重建輸入圖像。

這樣一來，最終便會得到優化後的嵌入層（能夠很好地重建輸入圖像）。

第二步是對擴散模型進行微調，這時就要用到上一步已經優化之後的嵌入層，讓嵌入層經過模型後重建輸入圖像。

在重建的過程，需要不斷更改模型中損失函數的參數，以讓模型適應優化後的輸入層，直到能夠很好地重建輸入圖像時為止，這樣一來便得到了微調之後的模型。

第三步就要開始正式P圖了。

值得一提的是，這一步除了輸入初始的目標嵌入層（tgt）外，還會插入優化好的嵌入層（opt），它們的關係如下圖。

通過變換參數，實際的效果如下圖。

如果你想更加詳細地瞭解Imagic，可以戳文末鏈接閲讀論文原文。

研究團隊

Imagic的六位作者均來自Google Research，論文有兩位第一作者：Bahjat Kawar和Shiran Zada，均來自以色列。

值得一提的是，Bahjat Kawar還是一位以色列理工學院在讀博士，他是在Google Research實習期間完成了這項研究。

而Shiran Zada今年5月剛加入Google Research，目前是計算機視覺研究員。

他曾在微軟擔任軟件工程師以及技術主管的職務，主要負責網絡安全相關的項目開發。

參考鏈接：

[1]https://arxiv.org/abs/2210.09276

[2]https://twitter.com/Buntworthy/status/1582307817884889088

[3]https://github.com/justinpinkney/stable-diffusion/blob/main/notebooks/imagic.ipynb

— 完 —

量子位 QbitAI · 頭條號簽約

轉載請註明：谷歌P圖神器來了！不用學不用教，輸入一句話，分分鐘給結果 - 楠木軒

恆生電子董事長劉曙峯：以技術創新推動資本市場數智化轉型

發佈於: 財經2023-11-14標籤: 恆生電子金融機構劉曙峯模型

中國網財經11月14日訊(記者朱玲)在日前舉行的2023金融街論壇年會——第三屆全球金融科技大會資本市場金融科技論壇上，恆生電子董事長劉曙峯發表了主題演講。他指出，當前金融機構正處於數智化轉型和信息

大華股份：勤辰資產、東財證券等多家機構於11月10日調研我司

發佈於: 財經2023-11-13標籤: 大華股份東財證券模型數據

證券之星消息，2023年11月13日大華股份（002236）發佈公告稱勤辰資產崔瑩、東財證券張煊、中信證券夏胤磊、招商基金張大印、泊通投資莊臣、財通資管虞圳幼、河清資本李澤豪、上投摩根倪權生趙隆隆

M7重新上漲貝萊德千億美元模型投資組合押注超大市值股票

發佈於: 財經2023-11-08標籤: 貝萊德美聯儲公司模型

智通財經APP獲悉，負責組建貝萊德模型投資組合的團隊青睞於股市中規模最大的公司，這可能會讓數十億美元的資金湧入科技股。貝萊德旗下多資產策略與解決方案的策略師Tushar Yadava表示，這家投資巨頭

“深海一號”模型亮相進博會

發佈於: 休閒2023-11-06標籤: 深海一號亮相進博會模型博會

11月5日，“深海一號”大氣田模型亮相第六屆進博會國家展，吸引眾多觀眾前來參觀。“深海一號”大氣田距三亞150公里，於2014年勘探發現，是我國迄今為止自主發現的水深最深、勘探開發難度最大的海上超深水

大模型落地教育，老師會和大模型“交流”合作，提升學生人際互動和社會情感能力嗎？

發佈於: 經典2023-10-27標籤: 人工智能 ChatGPT 教師模型

最近，以ChatGPT為代表的大語言模型技術正在引領新的人工智能浪潮，成為AI領域的一大熱點，它們不僅具有強大的語言理解和生成能力，還能進行復雜的分析和推理。在不少人看來，這些大模型在教育領域有着廣泛

科大訊飛學習機扭曲歷史？董事長：有“幕後推手”…市值蒸發百億

發佈於: 財經2023-10-24標籤: 科大訊飛劉慶峯訊飛星火模型

科大訊飛董事長劉慶峯：“今天星火3.0剛發佈，我們就發現了鋪天蓋地的輿情，這是有幕後推手的……”據媒體10月24日報道，有家長宣稱在自家孩子的科大訊飛學習機中發現了一些詆譭偉人、扭曲歷史等違背主流價值

搭載國內首個教育大模型"子曰" 有道虛擬人口語教練Hi Echo上線

發佈於: 經典2023-10-11標籤: 口語用户英語模型

　　10月11日，網易有道宣佈，搭載子曰教育大模型的全球首個虛擬人口語教練 Hi Echo正式推出獨立APP和微信小程序。這名一對一口語教練具備全天候多平台的陪伴能力，將更好地為用户提供隨時隨地高質

星環科技：9月15日召開業績説明會，投資者參與

發佈於: 財經2023-09-16標籤: 公司基礎軟件模型淨利潤

2023年9月15日星環科技（688031）發佈公告稱公司於2023年9月15日召開業績説明會。具體內容如下：問：上半年淨利潤同比下降，下半年預計淨利潤會怎樣答：尊敬的投資者您好，感謝提問。公司上半年

效率提升數十倍！保險業逐浪大模型，新一輪“裝備競賽”開啓？

發佈於: 財經2023-09-11標籤: 中國太保模型保險公司北京商報

當紅的AI大模型市場風起雲湧，作為數字化基礎較為完善的金融保險業，正加速大模型應用落地。年內中國太保、眾安保險、陽光保險等險企均公佈了佈局的新動作；科技公司也在加速大模型佈局，並已運用在保險領域。大模

商湯科技營收增速由負轉正智能汽車業務商業化發展空間持續拓展

發佈於: 財經2023-09-08標籤: 商湯科技人工智能商湯模型

8月28日，商湯科技（00020.HK）披露了2023年中期業績。財報顯示，2023年上半年營業收入14.3億元，同比增幅1.3%。今年以來，生成式人工智能熱度持續升温，人工智能技術在全球範圍內掀起

從服貿會透視AI教育大模型助力智慧教育新變革

發佈於: 經典2023-09-06標籤: 模型人工智能教育公司人工智能技術

本文轉自：人民網在正在舉行的2023年中國國際服務貿易交易會（以下簡稱“服貿會”）上，多家教育公司推出新產品、新服務，體現了科技變革下教育服務產業發展的新方向。教育部國際司副司長賈鵬在2023年服貿

美年健康舉辦醫療健康行業AI創新創業大賽，加快推進AIGC及大模型戰略落地

發佈於: 財經2023-09-03標籤: 美年健康集團模型醫療健康AIGC 美年

　　近日，預防醫療領域龍頭企業美年健康集團又有大動作，主辦第十二屆中國創新創業大賽—“AI大數據醫療健康專業賽”，公開尋找AIGC及大模型領域的合作伙伴，再次展示了其“All in 數字化”的戰略決心

商湯半年報解讀：生成式AI收入增幅670.4% 大模型驅動長期成長性

發佈於: 財經2023-08-29標籤: 商湯模型人工智能商湯集團

8月28日晚間，商湯集團公佈截至2023年上半年財報。財報顯示，集團營業收入14.3億元，同比增幅1.3%；虧損淨額按年收窄2.0%至31.4億元，經調整虧損淨額按年收窄6.7%至23.9億元。值得一

商湯集團上半年生成式AI收入同比增逾670%

發佈於: 財經2023-08-28標籤: 商湯集團模型營業收入首席執行官

　　中新社香港8月28日電首批納入“港幣-人民幣雙櫃枱模式”的上市公司、人工智能軟件公司商湯集團股份有限公司(商湯集團)28日在香港公佈2023年上半年中期業績。該公司上半年營業收入14.3億元(人

金山辦公：8月23日召開業績説明會，包括知名機構淡水泉的多家機構參與

發佈於: 財經2023-08-25標籤: 產品模型金山辦公公司

2023年8月25日金山辦公（688111）發佈公告稱公司於2023年8月23日召開業績説明會，中金公司、招商證券、天風證券、華泰證券、安信證券、國信證券、財通證券、東吳證券、華創證券、開源證券、Mo