AI生成藝術與NFT的擦槍走火

by Eric Chen
in AI生成藝術
on 10 4 月, 2022

Purple Cybernetic Dyson Sphere on Wall Street by Junji Ito

什麼是AI生成藝術?

上圖是一張由完全AI繪製出的圖片，

並且它是透過這一句英文敘述所創造出來的。

Purple Cybernetic Dyson Sphere on Wall Street by Junji Ito

Junji Ito是伊藤潤二，日本著名恐怖漫畫家，

AI很聰明，只要在一串文字後多打上「by Junji Ito」，

就可以生成出帶有他畫風的圖片，

同樣的道理，改成其他如「by Vincent Van Gogh 」梵谷，

你的圖片就會有梵谷作品的味道，是不是很酷?

這就像是把夢境「打印」出來一樣，只要輸入一段文字給AI，

它就會幫你「具象化」或是說是「Dream」出一張圖片 !

下面的影片是上圖AI的繪製過程，

你可以看到AI是如何從零到有地將一張圖片給「生」出來。

免責聲明

本篇文章的所有內容純屬個人分析觀點，不構成任何投資建議，

任何數據僅只是根據過去的結果所做的估算或分析結果，不應被視為確切的收益數據。

所有數字僅為說明用途，並非投資建議，投資有風險，投資人應具備獨立思考的能力。

文章目錄

2021年的年度關鍵字冠軍：NFT

在談AI生成藝術之前，讓我們先聊聊NFT吧，

非同質化代幣，一個能唯一識別檔案擁有者的技術，

在2021年壓過了新冠肺炎等其他熱門關鍵字成為了年度代表字冠軍。

可能很多人會問：一張不用購買人人都可以自己下載的JPG到底能有什麼價值?

事實上雖然大家都能得到那張圖，

但在區塊鏈上只有真正持有者才能通過持有證明。

雖然市場上正在發生的事確實可以證明它是有價值的，

但是它的溢價(水分)也是肯定存在的。

有實際賦能的，價值多半體現在一個私密社群中，

此時NFT儼然成為一張VIP卡識別證，只有持有者才能進入這個私人俱樂部；

而沒實際賦能的，往往很取決於當下一段時間的話題性和熱度，

在風口浪尖時可能非常會被炒得非常高，但隨著時間過去就會漸漸回到它應有的水平。

隨著最近一年以來NFT市場的火爆，

各個行業的人們都開始利用自身的優勢來發行NFT，

例如本身就有流量的名星或網紅，甚至連師園鹽酥雞都發行了。

目前來看，發行NFT可以說是變成了一個新的商業模式，

可以把以前難以「定價」、或是「不知道該怎麼單賣的資訊或服務」，

統一透過「賦能」的方式「商品化」賣出，

並且可以在短時間內就獲得巨額的集資，

例如，最近也開始出現以「軟體工具使用權」做為賦能的項目，

這些原本多半以「訂閱制」做為商業模式的服務，現在也開始以NFT的形式來賣。

以上提到的多半是需要靠「有價值的賦能」來吸引人購買，

圖片本身並不是最強調的點，因為多數人都不是只因為美術而購買的。

然而，以下將提到的藝術型NFT則剛好相反，價值基本上只有圖片本身。

生成藝術是什麼？

生成藝術的概念其實早在100年以前就已經出現了，

從當時一些藝術家的「嘗試」中開始慢慢發展起來，

而隨著近年來科技的快速進步，

造成計算機科學蓬勃發展的同時也開創了一個新的領域，

即藝術和計算機的結合：「演算法藝術」，

泛指使用電腦各種演算法的技術來創作藝術品。

引用維基百科對生成藝術的定義，

指全部或部分使用「自主系統」創作的藝術，

而這個自主系統通常是非人類的，能夠獨立確定藝術品的特徵，

例如AI生成藝術就是專指使用AI做為自主系統的生成藝術。

簡而言之，生成藝術與傳統藝術品兩者創作方式的最大差異就是「是否有使用自主系統」。

以前的藝術作品多半都是100%用人腦構思、並最終產出，

並無「自主系統」的輔助，人們稱他們為Artist，藝術家。

而最近由於NFT市場的火爆，

於是乎就催生出了一個新的名詞：Crypto Artist，加密藝術家，

專指將藝術作品與區塊鏈技術產生掛勾的藝術家，

他們多半會在各大NFT交易平台上直接刊登自己的作品，

若有積累一定的觀眾，便能直接從中獲得收益支持其創作，

這就與傳統藝術家往往會被中間的各種管道阻礙，無法直接獲得收益不同，

如今作品能直接曝光在網路上的二級市場平台，

Opensea這種自由買賣平台的崛起，

使得加密藝術家只要上傳自己的作品到網路上就可能會有人購買，

錢也不用再經手給好幾層的人。

例如最有名的公海Opensea是目前世界上最大的NFT集散地以外，

當然也有其他專注於藝術型NFT的平台，

例如邀請制的Foundation、Async Art等等。

既然說到生成藝術的NFT，就不得不提到這個在近一年多迅速崛起的王國，

Opensea裡最具代表性的生成藝術項目 : Art Blocks，

你可以把它想像成一個面向全世界的生成藝術大展覽，

每個季度裡面有非常多不同的作品展示於其中。

它主要分為三個Level，最上層是Curated，

這裡面的作品代表是經過Art Blocks內部團隊在評估一系列的作品後，

選出最能代表它們標準的精選集，

而Factory則是多半屬於落選於Curated的遺珠之憾，

Playground則是曾入選過Curated的藝術家專屬於他們的實驗室畫廊。

上面我們曾提過，藝術型項目的NFT主要的價值只來自於圖本身，

但儘管如此，藝術型項目的火熱程度卻不見得會輸給有實際賦能的項目，

例如一個在Art Blocks Curated的系列：Singularity，總交易量可以破4000個以太幣，

無論買的人是基於欣賞還是投機，對多數人來說都是非常瘋狂的事情，

花數十萬台幣就只為了買一張圖，一般人若想發行這種藝術型的NFT，

除了要有一群粉絲外，通常也需要具備很好的美術水平。

簡而言之，Art Blocks是生成藝術家的戰場，

門檻滿高的，並不是一般人想參與就能夠參與的。

因為那裡通常聚集著有多年經驗、赫赫有名的藝術家們，

你通常需要有很好的藝術天賦，

同時也要有程式能力，才具備基本的競爭力。

為什麼這麼說呢? 因為Art Blocks有規定，

提交的每一件作品都必須能用一段程式碼生成出來，

也就是說，不僅要提交你畫出來的作品，

也要提交生成出作品的程式碼，例如提交p5.js的程式碼。

所以說，這裡其實也不是傳統藝術家的戰場，因為程式能力也是必備的。

換句話說，若不是用程式碼一對一畫出的作品便無法被Art Blocks所接受，

例如我們即將要提到的 : AI生成藝術。

AI生成藝術背後的技術

AI生成藝術，其實並不是什麼新的技術或概念，

早在數年之前就已經存在了，只是因為相對冷門，所以比較少人關注。

最近的一個轉折點是去年2021年，

因為NFT的崛起再加上人工智慧演算法技術的提升，

使得這塊領域突然出現許多「可能性」以及「應用的商機」。

其中最著名的一個AI模型就是由輝達Nvidia (NVDA) 公司所研發出來的StyleGAN，

從2018年時提出的初代，當時就已經幾乎能以假亂真的照片來騙過人類的眼睛了，

更不用說到現在，StyleGAN已經出到了第三代，更是將前幾代的幾個小缺陷都進行了改善。

例如 : This person does not exist. 「此人不存在」，

這個網站裡的每一張人臉圖片都是透過AI生成出來的「假人」，

不是真實存在的照片喔 !

說到這裡，相信大多數人應該都會對於這個「GAN」是什麼感到滿好奇的，

那麼它究竟是什麼技術呢?

首先，它的全名是Generative Adversarial Network，即生成對抗網路，

是早在2014年就被Ian Goodfellow提出的概念，在當時引起了不小的風波，

它的架構是建立兩種AI模型，

其中一個扮演「專門畫假畫的畫師」的角色，

而另一個則扮演「真畫鑑定師」的角色，

同時對它們兩個進行訓練可以讓他們產生類似於博弈的互動，

專門畫假畫的畫師它的目標很簡單，就是畫出一個能騙過真畫鑑定師的圖，

而真畫鑑定師的目標則剛好完全相反，希望盡可能地把假畫辨別出來，

雙方就在這樣的「對抗」中逐漸成長進步，

等到哪天畫假畫的模型功力已經可以騙過真畫鑑定師時便是它出山表演的時候了，

我們就會用「專門畫假畫的模型」來生成我們想要的圖片。

簡而言之，GAN是一個很神奇的技術，

它可以透過大量相似的圖片學習出整個圖片資料集中的「分布」，

進而從分布中「採樣」，並逐步生成出一整張「新的圖片」，

讓這張照片從原本不屬於現實世界的地方被創造出來。

雖然說GAN是一個很玄的東西，但它其實也有不少缺點，不是這麼完美無缺。

首先，「訓練一個令人滿意的GAN」這件事本身並不是一件很容易的事情，

不是說你只要把資料餵給它，它就一定能畫出令你滿意的結果。

其次，除了需要花費大量運算資源(GPU)和大量時間(數天至數周)以外，

通常還須具備一些訓練的「小技巧」，

例如圖片的質量要夠好，許多有些麻煩的圖片前處理需要先完成，

當然，訓練時所設定的超參數也有很大的影響。

說完了技術背景，接著就來說一下AI生成藝術的3大應用場景。

3種用AI創作的典型應用場景

1.生成特定主體的圖片

舉個例子，當今天你想要生成某些特定的圖片時，例如 : 動物的臉，

那麼你就得先蒐集很多張動物臉部的圖片，

少則要數千張，多至數萬甚至數十萬張都是可能的，

取決於資料蒐集的難度和效能的取捨，

當然，如果可以的話，

你蒐集的圖片資料集裡的每一張圖片最好也需要有些一致性的規律，

比如說物種接近、照片角度相同、圖中主體的遠近，

這些若能保持一致對訓練都是加分，

因為如果相差過大便容易讓GAN學不出東西而「崩壞」，

就可能生成出長得異常奇怪的東西，

當然，如果訓練得當，GAN的圖片多樣性就會展現出來，

例如可能會生成出一種看起來像貓+狗的混合體生物，

如果幸運畫出這種類型的「稀有種」的話，

就會比只是畫出「雖然很逼真但不特別」的圖片來得有意思，

理論上，這個應用場景可以學習畫任意東西，

前提是只要你準備好相應的資料集。

2.主體圖片風格轉換

如果說剛才我們提到的模型是拿來負責學習畫一張圖中的「主體」，

那麼以下要介紹的另一個則是負責「整體色調、風格」的，

也就是Style Transfer，風格轉換。

若先用前面的第一款AI來生成指定某種主體的圖片，

再用第二款風格轉換的AI做潤飾，

便能在第一款AI的原作基礎上再錦上添花一筆。

風格轉換的典型應用場景是，

在給定一張有主體的圖片的狀況下，

將其他種不同樣式的圖片風格融進去原本的圖中，

可能只有一張或甚至不只一張，

例如 : 可以同時選擇一張梵谷的風景畫和肖像畫來進行融合。

就這一點來說非常適合與人類協作，

人類決定好要畫什麼主體以及如何做搭配，

至於怎麼變得更「eye-catching」就可以交給AI來完成。

3.任意文字轉任意圖片

這種模式就是文章一開始放的文字轉圖系列，

讓AI幫你「腦補」，用一段簡短任意的英文字，生成出天馬行空的圖片，

這類模式生成的圖片往往會畫出令你意想不到、非常有趣的結果，

有可能超酷，但也可能很醜XD。

最著名的模型是OpenAI於近年提出的CLIP : Connecting Text and Images，

它的訓練方式是將大量的文字與圖片進行配對，

強制模型去學習出文字與圖片的關聯性，

這也就是為什麼生成出來的圖片會和你輸入的文字有關係，

不過訓練CLIP使用的資料範圍很廣，並不局限於特定的東西，

因此才會生成出來的圖片看起來包羅萬象，感覺像融合了很多種元素。

經過一群對AI生成藝術有熱情的人們一番挖掘之後發現了一個巧妙的應用，

便是將CLIP和一種特殊的GAN(VQGAN)相結合，

透過兩者的專業分工，以VQGAN做為畫師，

而CLIP則負責監督VQGAN畫出的圖片是否能匹配上你輸入的文字，

透過文章上面一開始提供的影片可以看到，

隨著這兩個模型的互動，

圖片也從原本的空無一物漸漸變成最終很不一樣的成品。

從2021年以來，AI生成藝術領域開始以一個極為飛快的腳步成長，

有愈來愈多人(外國人居多)發現並開始使用這項有趣的技術，

他們往往都會在Twitter上發布他們的作品，並tag #ai art等字眼。

而就在寫這篇文章的同時，

OpenAI竟然又悄悄地發表了一篇關於AI生成藝術的論文，

是一個基於初代畫家模型DALL-E的改良大作，DALL-E 2，

優化了原本圖片可能解析度不夠高等問題，

賦予了文字生圖這一塊出現了更多的可玩性。

綜合以上，我們可以歸納出AI生成藝術的三種主要典型用途，

實際上可以根據自己的需求來決定使用哪一種創作方式。

1.如果已經有畫好的主體圖片，那麼只要風格轉換就好

2.如果沒主體但對主體的長像有要求，可用GAN來生成，當然也可以再加上風格轉換

3.如果是沒主體、也對圖片模樣沒有特定要求，就適合直接文字生成圖

AI生成藝術應用於NFT

想必大家看到這裡，上面看了這麼多文字應該需要一些圖片來平衡吧，

以下就來秀一下我自己訓練出來的成果，

我最早的時候訓練了一個專門畫動物臉的AI，

圖片資料集裡面包含了貓科 (貓、虎、獅、豹)，以及犬科(狗、狼、狐)動物，

之所以沒有專門訓練同一個物種的原因是，

1.如果只挑一個物種，資料會有點少

2.我想看看AI能不能畫出一些新的物種出來

結果沒想到AI還真的畫出了幾隻長相奇特的「新物種」，

例如看上去臉是獅子，但鼻子卻是狗的「獅狗」，

或是看上去像老虎但卻擁有豹神韻的「豹虎」，

另外，大家可以在下圖看到好幾隻貓貓實在是好可愛 !!!

真的是完全想不到這些貓竟然是AI畫的，它們不真實存在 !

AI生成藝術成品 : 動物臉

後來，我由於缺乏蒐集高質量圖片資料集的管道，

就想到何不使用別人發行的NFT圖片來做呢?

因為這樣的圖片做起來很省事，大小都相同甚至不用Resize，

圖片通常只有一個focus的主體，並且也很有一致性，

因此我就在當時Opensea挑上了最具代表性的兩款藍籌 : Azuki、CloneX來實驗看看，

於是乎我就把1萬張Azuki、近2萬張CloneX全部下載下來各自訓練了兩個禮拜，

以下就是訓練出來的成品啦 !

仔細看可以發現每張都與Azuki原版的圖片有所不同，

而且還不只是服裝搭配組合的不同而已，

甚至還有新髮型和漂染的髮色出現 !

AI生成藝術成品 : Azuki

而CloneX也有類似的效果，

仔細看也能發現每張都與CloneX原版的圖片有所不同，

髮型以及服裝的顏色應該會是最明顯的差異，

因為AI不懂人類的頭髮多半只有一種顏色，

所以它對顏色的搭配就是完全出自於它自己的理解，

若沒有非常往細節看其實根本看不太出來這些也是假的CloneX。

AI生成藝術成品 : CloneX

如果以上這幾張圖對你來說還不夠酷的話，

那麼請繼續往下看，

下面將揭曉如果將上面的「AI原生圖片」再加上風格轉換，

又會變成什麼樣子呢?

以下就是我根據原生圖片的樣貌和背景，

去搭配出適合它的風格所呈現出來的結果，

仔細看可以發現其實非常風格很多變、靈活，

原本Azuki比較空的背景也能得到一些裝飾，

若有懂美術的讀者應該能看出幾張作品中有梵谷油畫作品的味道。

我自己在決定「如何選素材」的過程中也是玩得不亦樂乎，

在這個步驟中我發現，

自己選素材的眼光和素材的多樣性，

反而才是決定圖片美觀的關鍵。

對於本身沒有藝術背景的我來說，

不論是跑出來的結果超乎自己的預期，

或是跟別人說這張是我畫的，而讓別人嚇一跳，

這兩種都能讓我獲得不少的成就感XD。

AI生成藝術風格轉換成品 : Azuki

AI生成藝術風格轉換成品 : CloneX

不知道讀者們的眼睛有被哪一隻抓到嗎?

歡迎在底下留言可以用座標的方式讓我們知道 !

最左下角為(0,0)往右一格變(1,0)，往上一格變(0,1)，最右上角為(4,7)。

那麼看到這裡，應該產生 :

如何將AI生成藝術應用在充滿商機的NFT市場這樣的想法吧 ?

以下就來談一下這一塊在目前NFT市場上可以怎麼應用。

1.圖片提供商

第一種，也是最簡單明瞭的方式就是用AI來生成出自己的作品，

當一個加密藝術家發行藝術型的NFT，

此時你需要的是高質量的圖和一群粉絲，

其實目前Tezos鏈上的akaSwap就已經有不少人在那裡發行NFT了，

相比於Opensea主要使用的以太鏈，門檻滿低的，

這裡的平均定價和瓦斯費都對小資族或是新手很友善，

不會買一張就沒錢了。

因此，如果是想走純藝術型路線，最好要經營Twitter，

因為這圈子的人和資訊幾乎都在這流通，

至於發行的話在akaSwap發行是藝術品NFT一個不錯的選擇，

而且這裡也有滿多華人發行的，例如最近張惠妹的NFT項目。

如果發行在Opensea這種一天新增數千個NFT項目的世界級大染缸，

如果行銷部分沒有做得很好，應該很容易被看到，

一下子就被鋪天蓋地的新項目淹沒了。

第二種則是與需要認真做項目、想發NFT但缺少圖片這一塊的人合作，

主要負責生成出項目方滿意的圖片。

目前NFT項目圖的生成方式大多不外乎以下幾種，

1.找繪師畫(多半是像速圖)

2.找知名的藝術家畫(多半是海外大項目)

3.用程式畫(多半是生成藝術型)

綜觀目前的市場發NFT的需求正在快速增長，

這一塊目前Opensea上用主打AI生成的NFT項目幾乎沒幾個，

如果有的話就會是一個特色。

AI與人工相比的話最主要的特色就是便宜、快速、以及人類難以畫出的效果。

2.一個人人都能創作，汲取人類智慧的通用NFT生成工具?

如果說只是要找NFT生成工具的話其實網路上有很多，

他們多半只是將各種不同的配件透過程式自動化拼湊出很多種組合，

並沒有什麼特別之處，多半還是需要先自己畫一些圖片才能用，

而用AI工具來畫就不同了，

相比於傳統人腦構思再畫出耗時費工的過程，

用AI幫你代勞既能省下時間，畫出來的圖也不見得會比較差，

你可以完全不用實際參與「畫」的部分，但卻也能做出不錯的作品，

以下是使用AI畫圖的關鍵優勢。

1.一旦訓練好模型後要生成幾張就有幾張，

幾小時內就能產出數千張不同的圖片，

不像人類要想+畫出1張就得付出額外一個單位的時間。

2.相比於找繪師或藝術家畫，幾乎沒有什麼金錢成本，

只需要時間等待訓練完畢和一點GPU運算的成本。

3.可高度客製化，極具獨特性，別人很難仿冒，

因為只要使用不同的資料集訓練，就會產出不同風格的圖片。

在導入AI後，整個生成藝術創作流程就會變成像以下這樣，

你主要只需專注於「挑選」出優秀的作品，

真正「畫出」的部分反而不用太操心。

1.選擇你想畫的主體

2.蒐集主體的圖片資料集(你的主要工作)

3.訓練AI來學習畫圖片的主體

4.讓AI預測出任意張畫作並從中挑出精選作品(你的主要工作)

5.選擇幾層喜愛的風格圖片(你的主要工作，可以是肖像油畫、風景水彩畫、特效圖片等等)

6.讓AI將精選作品與風格圖片做融合

7.從融合過的圖片中再挑出最好的代表作(你的主要工作)

3.版權疑慮

最後，如果真的要拿來發行NFT的話，

這些圖片可不可以商業利用就成了不可避免的重大問題。

首先，如果不做商業用途的話是完全沒問題的，

如果真的要商用的話，

有些NFT項目方會在官網上寫使用條款，

如果有說即使持有NFT也不代表擁有圖片版權的話，

那就算你有購買也沒辦法做，

但如果使用條款說圖片版權公開，那就可以使用。

總而言之，

只需要確保你的「所有原材料」都是「公開的、可商用的」即可，

但若只要有其中任何一項違反就會有問題，

也就是說，你的資料集要使用網路上公開的資料集，

還有模型演算法也要是有MIT License的才行，

例如使用StyleGAN生成出來的圖片就不行，

因為它有明確說明不能商用，

但只要沒有違反這幾項規定，目前基本上就沒什麼問題。

結論與未來展望

未來人類藝術家是不是也會被AI取代？

看到這裡，應該會有很多人都會想問這個問題吧 ?

但其實答案是很明顯的，當然不會 !

未來AI很可能會讓藝術發展成只有兩種，一種是用AI做的，一種不是，

傳統的藝術還是有其地位，只不過AI藝術也將稱霸一方。

以前的人們可能覺得電腦也許很厲害，但終究是沒辦法有創造力來做藝術的，

殊不知才沒過幾年之後，沒想到AI也能做這種需要大量創造性的事情，

甚至做得比人類還好，著名生成藝術家Beeple就曾以天價售出AI生成的藝術型NFT。

我認為最有可能大規模發生並且現在就已經正在發生的事情會是，

AI作為新時代的藝術創作工具協助人們創作，有了AI，

一來可以降低藝術的高門檻，人人都可能創作出好作品，

畢竟不是人人都有美術細胞，你不用很會畫畫，

你只要有鑑賞、挑選搭配的能力即可，

你只要在AI生成的很多張作品中選出大家會驚嘆的作品即有辦法辦到；

二來，AI也能讓本來就有創作能力的藝術家再配備更強大的創作武器，

藝術作品本身不需要完全由AI完成，

AI也可以只做為輔助工具協助藝術家進行靈感的發想、生成初步的作品，

最後再讓人類操刀也是完全可以的，

由於電腦快速的運算能力，它可以幫助藝術家省去非常多找靈感的時間。

試想如果將世界著名藝術家的畫作都交由AI來訓練學習創作，

AI將能從人類的創作智慧中汲取菁華，融合出新的可能性，

並可能像AlphaGo改變圍棋界的那個樣子，

在舊的領域以新的方式為人類開創出一片新的天地。

最後，若正在看這篇文章的你對於用AI製圖發行NFT這方面有需求者都歡迎聯絡我們 !

此外，若是讀者們若想看AI畫出其他種圖片也都歡迎在底下留言喔 !

Call To Action

歡迎任何能使這篇文章改進的意見，如果有問題或想法都歡迎在下面告訴我們喔 !

最後，如果你很認同這篇文章的分析方式，或是覺得這篇文章有幫助到你，

請幫我們多按幾次Like，您的支持是我們研究最大的動力，

拍手是不需要付任何費用的喔。

AI生成藝術與NFT的擦槍走火