AI林布蘭,到底有多像(或是有多不像)
文/吳大有
2016年J. Walter Thompson與微軟公司合作,為荷蘭ING銀行的行銷活動創作了一件AI林布蘭的作品,是以300多張林布蘭的畫作為基礎所產生的。乍看之下好像有點林布蘭的風格,但仔細看就會發現有很多問題,我們來和原作比較研究看看有何差異。
左圖是是一張和AI產生的畫很類似的原作Herman Doomer (1640),右圖是AI產生的。
首先看到視覺重心(下圖圈圈處),林布蘭的畫的視覺重心是在右半臉和領子,而AI產生的畫其視覺重心偏到了黑色的帽緣。原因是AI的帽緣太過於銳利,以及帽子和背景的明暗對比太大,而搶走了觀眾的目光。
將圖片放大來看更明顯,AI的帽緣一致地銳利,而林布蘭原作是有節奏變化的模糊。另外也可以看到AI畫的耳朵解剖構造很隨便地帶過去了。
AI的畫也有很多結構美感的問題存在,例如畫中的兩塊明亮處,是人臉和領子,在AI兩者的寬度很類似而顯得呆板,而在林布蘭有比較大的差異,如此就會有比較好的節奏感。同樣的問題也發生在帽子上,林布蘭的帽子是水滴狀的,右側比較尖,兩邊有差異而有節奏感,帽子的左右寬度比領子左右寬度大很多,也有另一層的節奏;而AI的帽子是橢圓形的,且左右寬度和領子的差異較小。
水滴狀的帽子也有比較強的視覺引導作用,能夠調整構圖。兩張畫作的主角都偏畫面的左方,而林布蘭(有意地)利用帽子的指向、衣領的方向、肩膀的衣服突出和手的方向導引視覺,填補了右邊的空洞,但在AI因為沒有肩膀的突出和手,所以紫色處整個空掉了;同時帽子上方的空間也留白太多,整體畫面的結構有很大的問題。也因為上述原因,使得AI的畫面不平衡,左邊太重了;林布蘭的人物雖然在更左邊,但他巧妙地平衡了畫面。
放大看AI的畫的臉部,也有很多解剖的問題:除了前面講的耳朵含糊帶過;兩隻眼睛的方向不一致,有斜視的感覺,右眼的眼窩結構也是含糊帶過:
右邊顴骨的突起沒畫出來,扁掉了;畫面是半側面的臉,臉中線應該要像下圖的白線,人中會有點斜度,但AI的畫的人中是藍色線,位置不對,連帶影響嘴唇左右的寬度錯誤(在半側面,右半嘴唇應該要比左半還寬,但AI畫成左右一樣);還有在這個角度,左側下巴畫太寬了。
雖然解剖構造的問題很多,但我覺得這個對AI來說應該很好解決,套一個3D人臉模組應該就可以了。比較難的地方是繪畫的結構美感,大概300張畫的資料還不夠,而且相同的結構問題,不同的人有不同的解決方法,會使得資料餵養上更加困難。
前面討論的結構和風格其實是繪畫上最入門的問題,即使AI克服所有問題,精進了技術,甚至超越林布蘭,可能在藝術史上也沒有太大的意義,因為當代藝術已不太討論美感和結構問題了,而深入的觀念、心理或精神性、社會性的議題,才是藝術界所看重的,這是AI更難以進入的世界,不過我覺得AI藝術也不一定要進入那個屬於人類的世界。如果AI能成為藝術家,我認為他應該要具有AI本質的創作方式和屬於AI的美學理論,而不是依附在人類藝術家的觀念下,光是要AI模擬人類用手拿筆畫出的筆觸這件事就蠻弔詭的,因為那不屬於機械的本質。藝術不像下棋有一翻兩瞪眼的輸贏目標,而是能夠容納各種特質的部落,所以AI藝術家沒有取代人類藝術家的問題,而應該是能夠並存的。