AI繪畫的“小秘密”都在這一篇文章里

來源：科技日報2023-01-09

分享到 :

核心提示：有了AI，人人都可以是藝術(shù)家,。AI繪畫的出現(xiàn),，恰如瑞士藝術(shù)家保羅·克利所言：“藝術(shù)不是再現(xiàn)可見,，而是使不可見成為可見,?！苯?jīng)過20年左右的發(fā)展,，目前基于不同類型或者模態(tài)

有了AI,，人人都可以是藝術(shù)家。AI繪畫的出現(xiàn),，恰如瑞士藝術(shù)家保羅·克利所言：“藝術(shù)不是再現(xiàn)可見,，而是使不可見成為可見?！苯?jīng)過20年左右的發(fā)展,，目前基于不同類型或者模態(tài)元素的AI繪畫發(fā)展情況不盡相同，發(fā)展最久的是“以圖生圖”,，再到近期火爆的“文+圖”生圖,。當(dāng)然，也有團隊已經(jīng)研發(fā)出由語音生成圖像的技術(shù),。

上傳一張圖片,，或者輸入一些簡單的關(guān)鍵詞，系統(tǒng)就能自動生成一張卡通圖像……最近一段時間,，AI繪畫開始在互聯(lián)網(wǎng)社交平臺走紅,。

AI繪畫，顧名思義就是利用人工智能進行繪畫,，是人工智能生成內(nèi)容的典型應(yīng)用場景之一,。其主要原理是收集大量已有作品，通過算法對其內(nèi)容和風(fēng)格特征進行解析,，最后再生成新的作品,，所以算法是AI繪畫的核心。

當(dāng)前,，“憑空”生成圖像的AI繪畫,，其實也會動輒“翻車”：也許上一秒AI通過你的照片繪出的是一張充滿藝術(shù)感的二次元畫像，下一秒你的寵物貓,、狗則可能被畫成可愛少女或肌肉猛男,。

事實上，AI繪畫早已火爆全球,。第一張公開展出的,、由人工智能創(chuàng)作的繪畫作品《埃德蒙·貝拉米的肖像》曾于2018年在佳士得拍賣行以43.25萬美元成交，那是一張由機器學(xué)習(xí)了從14世紀到20世紀的1.5萬張肖像畫之后自動生成的一張肖像畫作品,。

AI繪畫是如何實現(xiàn)“憑空”生圖的,？除了娛樂外，AI繪畫還有哪些潛在的應(yīng)用前景,？

從“以圖生圖”到“語音生圖”

2022年,，由人工智能創(chuàng)作的《太空歌劇院》一度火出圈。在美國科羅拉多州舉辦的新興數(shù)字藝術(shù)家競賽中,，《太空歌劇院》獲得“數(shù)字藝術(shù)/數(shù)字修飾照片”類別一等獎,。它的構(gòu)圖、配色以及畫面的細節(jié)堪稱精致。然而,，這個作品的創(chuàng)作者不是藝術(shù)家,，而是來自美國科羅拉多州的游戲設(shè)計師。

這位游戲設(shè)計師在一個名為“Midjourney”的AI創(chuàng)作工具里,，先輸入幾個關(guān)鍵詞,，如光源、構(gòu)圖,、氛圍等,，得到了100幅作品，再進行約80小時的修圖修飾,，最終選出3幅作品,，最后把圖像打印到畫布上。

通過簡單交互式對話在短時間內(nèi)生成的“藝術(shù)”作品,，讓人類藝術(shù)家展開了一場關(guān)于“AI繪畫作品參賽是否屬于作弊”的爭論,。這場聲勢浩大的爭論也令大眾直觀地意識到如今的AI繪畫水平已經(jīng)發(fā)展到了何種程度。

“人工智能在藝術(shù)方面的創(chuàng)作最早可以追溯到上個世紀末,，當(dāng)時的人工智能繪畫技術(shù)叫作‘圖像的風(fēng)格化濾鏡’,。”中國科學(xué)院自動化研究所多模態(tài)人工智能系統(tǒng)全國重點實驗室研究員董未名說,，最初的AI繪畫方法比較簡單,，比如一張普通的照片，通過一些圖像處理的算法,，把照片像素進行幾何或者色彩上的變換,，然后再調(diào)節(jié)不同參數(shù)，就可以模擬出類似油畫或者水彩畫的風(fēng)格,。

經(jīng)過20年左右的發(fā)展,，目前基于不同類型或者模態(tài)元素的AI繪畫發(fā)展情況不盡相同，發(fā)展最久的是“以圖生圖”,，再到近期火爆的“文+圖”生圖,。當(dāng)然,，也有團隊已經(jīng)研發(fā)出由語音生成圖像的技術(shù),。

AI繪畫主要依靠三種技術(shù)模式實現(xiàn)

董未名介紹，目前AI繪畫主要借助圖像風(fēng)格遷移技術(shù),、圖文預(yù)訓(xùn)練模型和擴散模型實現(xiàn),。

“圖像風(fēng)格遷移技術(shù)指的是圖像處理算法通過對輸入的真實圖像內(nèi)容特征和對參考的藝術(shù)圖像風(fēng)格特征的提取，實現(xiàn)真實圖像內(nèi)容特征和藝術(shù)圖像風(fēng)格特征的融合,，從而生成新的藝術(shù)圖像,。”董未名舉例，如果將美國舊金山藝術(shù)宮的外景照片和印象派創(chuàng)始人莫奈繪制的作品,，通過圖像風(fēng)格遷移技術(shù)進行融合,，就能得到一張看起來像是由莫奈繪制的美國舊金山藝術(shù)宮的繪畫作品。最初的AI繪畫采用的正是這種技術(shù),。

不過,，在董未名看來，圖像風(fēng)格遷移技術(shù)大多依賴的是生成式對抗網(wǎng)絡(luò)（GAN）算法,，它最大的問題是生成的繪畫作品藝術(shù)性不強,，筆觸和構(gòu)圖讓人覺得與真實的繪畫有差距，所以長久以來,，AI繪畫一直“籍籍無名”,。

當(dāng)圖像風(fēng)格遷移技術(shù)還在掙扎于輸出作品的審美問題時，圖文預(yù)訓(xùn)練模型的出現(xiàn),，加速了AI繪畫的崛起,。

“依托圖文預(yù)訓(xùn)練模型，只要輸入一句話或者上傳一幅風(fēng)格明顯的圖片,，算法就能將圖像特征和文字特征‘對齊’,。生成的繪畫作品的內(nèi)容特征和上傳圖片的內(nèi)容相似，藝術(shù)性也比圖像風(fēng)格遷移技術(shù)生成的圖片強很多,?！倍疵e例，比如支撐圖文預(yù)訓(xùn)練模型的可對比語言—圖像預(yù)訓(xùn)練（CLIP）算法,，就是利用圖文特征“對齊”的能力,，再結(jié)合已有的生成模型，實現(xiàn)“以圖生圖”或者“圖+文”生圖,。

不過,，董未名坦言，圖文預(yù)訓(xùn)練模型的推廣也存在一些爭議,，有部分人認為,，該模型在訓(xùn)練前期，需要用大量的圖形處理器（GPU）進行數(shù)據(jù)訓(xùn)練,，耗電量大,、成本很高，而該模型的應(yīng)用場景卻不夠清晰,。但也有人認為,，也許該模型未來可以打造為通用的人工智能模型，用它完成更多的算法作業(yè),，只是這還需要時間的驗證,。

誠然沒有一項技術(shù)是完美的,，這也為人類探究更先進的技術(shù)提供了無限動力。當(dāng)下最流行的擴散模型便是其中之一,。

“目前最新的AI繪畫技術(shù)采用的就是擴散模型,，這種模型可以把一個隨機采樣的噪聲輸入模型，然后嘗試通過去噪來生成圖像,?！倍疵硎荆瑪U散模型也存在弱點,，由于模型對圖片內(nèi)容識別的能力不足,，或者難以完全理解識別文字的意義，以及訓(xùn)練數(shù)據(jù)的偏差,，有時便會生成“四不像”的作品,。此外，擴散模型生成圖片的速度比較慢,，目前還達不到實時生成圖片,。

互聯(lián)網(wǎng)治理、元宇宙或潛藏應(yīng)用前景

AI繪畫目前的應(yīng)用場景,，更多聚焦于社交軟件,。近期在國內(nèi)社交網(wǎng)絡(luò)“火出天際”的AI繪畫軟件主要集中在小程序及App。隨著AI繪畫小程序的火爆,，短視頻平臺抖音也迅速上線了AI繪畫特效,。同時，此前騰訊上線了“QQ小世界AI畫匠”活動,，百度也推出了首款A(yù)I藝術(shù)和創(chuàng)意輔助平臺“文心一格”,。

有了AI，人人都可以是藝術(shù)家,。AI繪畫的出現(xiàn),，恰如瑞士藝術(shù)家保羅·克利所言：“藝術(shù)不是再現(xiàn)可見，而是使不可見成為可見,?！薄癆I現(xiàn)在已經(jīng)完美實現(xiàn)了這一目標，人們可以通過機器計算來繪制出很多現(xiàn)實中見不到的場景,?！倍疵麜诚耄贿h的將來,，AI繪畫或許還將展現(xiàn)更豐富的應(yīng)用場景,。

“現(xiàn)在網(wǎng)絡(luò)上充斥著很多不良內(nèi)容,，這些內(nèi)容為了逃避監(jiān)管經(jīng)常以繪畫的形式出現(xiàn),，而當(dāng)前很多內(nèi)容識別模型對真實圖片識別得很準確,，但缺乏不良內(nèi)容藝術(shù)作品的相關(guān)訓(xùn)練數(shù)據(jù)，所以對不良內(nèi)容識別不準確,。也許可以用AI繪畫技術(shù),，積累不良內(nèi)容藝術(shù)作品的數(shù)據(jù)，并用以訓(xùn)練識別模型,，以提升互聯(lián)網(wǎng)內(nèi)容的安全監(jiān)管能力和識別的準確率,。”董未名建議,。

在董未名看來,，作為一種藝術(shù)呈現(xiàn)形式，AI繪畫也將在元宇宙,、設(shè)計,、文旅等行業(yè)催生新的商業(yè)模式。例如AI繪畫目前在AI輔助創(chuàng)作,、短視頻,、影視制作和元宇宙等方面都有布局，因為這些賽道都離不開創(chuàng)意,，AI繪畫可以幫助創(chuàng)作者通過簡單的特征輸入,，實現(xiàn)對其創(chuàng)意的預(yù)覽，甚至可以直接進行創(chuàng)作,。

不過,，董未名并不諱言，當(dāng)下AI繪畫仍然存在版權(quán)爭議問題,。AI繪畫的核心是模型,，而訓(xùn)練模型需要使用大量圖像、文本數(shù)據(jù),。對于未經(jīng)授權(quán)的圖片,，經(jīng)過運算之后所生成的圖像版權(quán)歸屬尚難界定?！坝械漠嫾绎L(fēng)格特別明顯,，如果用畫家的畫去訓(xùn)練算法模型生成作品，那最后的版權(quán)屬于誰呢,？”董未名提出的問題,，正是多數(shù)AI繪畫作品所面臨的現(xiàn)實問題。

AI繪畫掀起了一場資本的群體狂歡,，希望有一天它能走出“照貓畫虎”的尷尬,，真正服務(wù)藝術(shù)創(chuàng)作、創(chuàng)造更多價值,。

（編輯：月兒）

返回315記者攝影家首頁>>

相關(guān)閱讀： AI繪畫“小秘密”

關(guān)閉窗口

[責(zé)任編輯: 315xwsy_susan]

免責(zé)聲明：

1,、本網(wǎng)內(nèi)容凡注明"來源：315記者攝影家網(wǎng)"的所有文字、圖片和音視頻資料,，版權(quán)均屬315記者攝影家網(wǎng)所有,，轉(zhuǎn)載、下載須通知本網(wǎng)授權(quán),，不得商用,，在轉(zhuǎn)載時必須注明"稿件來源：315記者攝影家網(wǎng)"，違者本網(wǎng)將依法追究責(zé)任,。
2,、本文系本網(wǎng)編輯轉(zhuǎn)載，轉(zhuǎn)載出于研究學(xué)習(xí)之目的,，為北京正念正心國學(xué)文化研究院藝術(shù)學(xué)研究,、宗教學(xué)研究、教育學(xué)研究,、文學(xué)研究,、新聞學(xué)與傳播學(xué)研究、考古學(xué)研究的研究員研究學(xué)習(xí),，并不代表本網(wǎng)贊同其觀點和對其真實性負責(zé),。
3、如涉及作品,、圖片等內(nèi)容,、版權(quán)和其它問題，請作者看到后一周內(nèi)來電或來函聯(lián)系刪除,。

AI繪畫的“小秘密”都在這一篇文章里

相關(guān)閱讀： AI繪畫“小秘密”

免責(zé)聲明：

熱點投訴

記者調(diào)查

315曝光臺