講師:鳥巢老師 鳥巢AI藝術學園園長「AI生成創作頑童」國立政治大學社會學系 學士國立政治大學傳播學院廣告所 想像與敘事學程 結業 (2013 ~ 2015 )師從攝影家 張照堂、美術攝影家 游本寬、攝影評論家 郭力昕、金馬獎音效設計杜篤之、導演方法&劇本寫作 盧非易教授 29年視覺設計師 21年攝影師 Nikon 官方攝影學校講師 (2010~) Adobe 官方特約講師 (2016~) 台灣第一位以AIGC作品 作品獲得 2022 ViewSonic Color Pro 國際藝術創意大賽TOP 8 前言 Midjourney為目前市面上常見的生成是AI繪圖軟體之一,而因為其能夠生成高品質的圖片,所以廣為設計工作者歡迎。本次課程將告訴Midjourney AI生成基礎技巧,並介紹Midjourney於今年推出的最新功能,讓大家能夠利用AI生成出高度擬真的圖片。 一、Midjourney 生成基礎 Midjourney是目前市面上常用的AI生成工具之一。雖然目前有許多包含Bing在內的生成式AI都具有文生圖的功能,但由於Midjourney所生成的圖片較其他生成式AI有質感,所以仍廣受設計工作者歡迎。Midjourney從推出至今已經有許多不同的版本。大約於去年五月封測時,當時的版本仍為v2版,目前的Midjourney為v5.2版。Midjourney的每個版本的藝術風格都不同,v3和v4版本所生成的圖片藝術成分較高,幾乎不向照片。v5版本雖較前兩個版本更擬真,但仍缺乏真實照片的質感。目前的v5.2版則是AI圖像生成的頂端,適合各種題材。除了生成擬真的圖片外,我們也可以使用專門生成動漫風格的Niji 5生成卡通或動漫風的圖像(圖1)。 圖 1:從上圖我們可以發現,v5.2版本生成的圖片較v5更多了真實感。Niji 5則可以生成動漫風的圖片。 AI指令五大結構 Midjourney為文生圖的生成式AI,因此我們和使用ChatGPT時相同,我們必須知道如何下指令,才能讓AI幫我們產生符合我們期望的圖片。在下指令給Midjourney時,我們可以掌握五大結構。首先為主題,我們要告訴Midjourney欲生成的圖片的人、事、時、地、物,可以是單純的描述,例如櫻花、少女、貓等,也可以是大媽跳著廣場或二次世界大戰等。第二為藝術風格,包含文化與特定藝術家的風格等。我們可以告訴AI想要圖片是中國古風(ancient Chinese)或維京(Viking)風格,也可以是文藝復興(Renaissance)或吉卜力(Ghibli)風格等。第三為優化,指我們可以在指令中加上細節、視角、採光等細節描述,讓AI產生的圖片更接近真實照片。第四為參數,也就是圖片的長寬比、質量、風格變化等。舉例而言,假設我們想指定AI生成長寬比為2:3的圖片,則可以在指令中輸入「--ar 2:3」,就可以得到此比例的圖片。最後則是排除,也就是所謂的反向提示。我們可以透過輸入反向提示,在下指示時將不想要的元素排除。例如,我們想要AI生成「在雨中跳舞的大媽」,但為了避免AI會因為「下雨」而在圖中出現雨傘,我們就可以在圖片最後加上「--no umbrella」,避免AI在圖片中出現雨傘。掌握了以上的五大結構,AI就能更精確地幫我們生成圖片。不過如果我們是AI生圖的小白,真的無法自己寫出指令,那麼也可以到Midjourney網頁中的藝廊中尋找我們喜歡的作品,參考該作者的提示並依照自己的需求進行修改,學習如何寫出完整的指令(圖2)。 圖 2:如果我們再Midjourney藝廊中看到喜歡的作品並想學習指令時,可以在該圖上點擊右鍵,並選擇「Full command」(紅框部分)就可以將指令複製下來,再將指令輸入Midjourney中即可。 基礎圖片編輯:Remix功能與打破語言藩籬 Midjourney生成圖片之後,我們可能也可以再依自己的需求編輯圖片。基本上,Midjourney接收指令後會生成四張圖片,圖片下方則會出現U1~U4以及V1~V4的選項,這些1~4的數字就是圖片的編號(圖3)。 圖 3 :Midjourney生成的四個圖片下方之選項編號,依序為左上圖、右上圖、左下圖、右下圖(如上圖黃色數字編號)。 假設我們喜歡AI生成的第一張圖,則可以點選U1將圖片放大並進行編輯。另外,我們也可以在Midjourney的Discord對話框中輸入「/settings」進入設定選單,並開啟「Remix mode」。如此一來,若我們想要Midjourney以第一張圖為基礎再生成一張新的圖,那麼則可以在點選V1,並在彈跳出的小視窗中輸入「+」並在後面輸入想要加入的元素或者藝術風格。 最後,我們都知道Midjourney目前只能夠聽得懂英文指令,而Niji機器人雖然聽得懂中、英、日、韓四種語言,但它的限制為其所產生的圖片為動漫風格。因此當我們想要一張擬真的圖片時,我們往往只能請ChatGPT幫我們將中文指令翻譯成英文。然而,我們其實可以透過一些技巧,利用Niji打破Midjourney的語言限制,讓我們可以輸入中文指令得到Midjourney的擬真圖片。若要用Niji打破語言限制,我們首先要在Midjourney的Discord中輸入「@niji・journey Bot」(綠色帆船圖樣)邀請Niji機器人,並依照上述的五大結構輸入指令。接著就是打破語言限制的關鍵,我們必須在指令最後輸入「--v5.2」,AI就會利用Midjourney 5.2版本的模型幫我們生成圖片。透過這個方法,我們就能夠打破Niji的動漫風格限制以及Midjourney的語言限制,輸入中文就可以得到Midjourney擅長生成的擬真圖片。 二、Midjourney 2023全新功能 除了上述的基礎功能以外,Midjourney也在今年推出全新的功能,包含影像擴展、改變構圖與局部重繪。 影像擴展功能可以用來幫我們擴充原圖的內容,我們只要在Midjourney生成的四張原圖中選擇想擴展的圖片並將其單張放大後,就可以看到「Zoom Out 2x」、「Zoom Out 1.5x」與「Custom Zoom」的選項。需要特別注意的是,影像擴展的倍數指的是原圖與外擴時四個邊的距離。也就是在使用影像擴展時,AI會以我們的原圖為中心點向外擴展圖片,因此當我們選擇的倍數愈大原圖會愈小(圖4)。另外,當我們使用「Custom Zoom」擴展圖片時,可以只改提示(想要擴展的部分有何種元素)不改指令(圖片尺寸、畫素),讓AI不被過多的資訊混淆。 圖 4 :Midjourney的影像擴展功能會以原圖為中心點擴展圖片,讓原圖的內容更加豐富。 若我們在擴展圖片時不想以原圖為中心點向外擴散,則可以將想要擴展的原圖單張放大後,依照想要擴展的部分,選擇原圖下方的上、下、左、右箭頭,並在指令中輸入想要在擴展部分增加何種元素,AI就可以根據我們的指令擴展原圖,而其擴展的部分為原圖寬度的一半(圖5)。 圖 5:透過以非中心點外擴,我們可以依照自己的需求擴充原圖,增加圖片上、下、左、右的內容,改變原圖的構圖結構。 最後一個2023年新增的功能為局部重繪。我們可以透過此功能修改圖片的特定區域或增添物件。如果AI所生成的圖片中,人物出現了缺手缺腳的情況,我們也可以利用此功能協助完善圖片。若要使用此功能,我們一樣須將想編輯的圖片單張放大,並選擇下方的「Vary (Region)」功能。接著就會跳出一個獨立的視窗,我們只要將想要增添物件的部分如圖6中的左圖框出來,並在下方對話框中輸入想要加入的物件,AI就能夠幫我們重繪圖片囉(圖6)!特別提醒大家,AI在判讀我們的指令時,會認為愈前面的提示愈重要,因此我們可以盡量將想保留的部分擺在前面,也可以在前面加上「::」並輸入數字(最大值為6),數字愈大表示重要性愈大,也就愈不容易被AI在繪圖過程中拿掉。 圖 6:利用局部繪圖,AI可以幫助我們在特定區域添加物件。 三、結語 Midjourney於今年推出的全新功能,再次讓我們看到了AI繪圖的進步,讓我們能在原圖之上增加更多揮灑創意的空間。除此之外,AI生圖常見的缺手缺腳的情況,也終於能夠透過局部重繪的功能,讓我們的圖片更加完整。最後,雖然Midjourney生成圖片的技術在AI繪圖軟體中已是名列前茅,我們還是必須不斷地優化我們的指令,才能夠得到更符合我們需求的圖片喔! 【若想回顧完整版課程影音,請點選此連結;有任何問題或分享,也歡迎在本文底下留言。】