注意看,這張情侶照在網(wǎng)上轉(zhuǎn)瘋了:
舊廠街風(fēng)格,帶著濃濃90年代氛圍感,但是,他倆一夜爆火的原因,你可能想象不到——
(相關(guān)資料圖)
這二位并不是真人!而是由AI一鍵生成的!
(不論是乍眼看去或是放大細(xì)瞧,都會(huì)覺得是拿相機(jī)拍的真人吧!)
這就是Midjourney最新V5版本解鎖的逆天神技。
就連AI繪畫最被詬病的手,這次也完全能hold住了。
而且很多網(wǎng)友一開始不相信這是AI畫的,于是他們親自下場(chǎng)輸入提示詞來(lái)驗(yàn)證:
A pair of young Chinese lovers, wearing jackets and jeans, sitting on the roof, the background is Beijing in the 1990s, and the opposite building can be seen —v 5 —s 250 —q 2.
一對(duì)年輕的中國(guó)情侶,穿著夾克和牛仔褲,坐在屋頂上,背景是20世紀(jì)90年代的北京,可以看到對(duì)面的建筑—v 5 —s 250 —q 2。
在自己體驗(yàn)了一把之后,不少網(wǎng)友這次真的直呼:
人類畫師別活了。
把我嚇壞了。
90年代的中國(guó)情侶以假亂真,那么現(xiàn)代版的呢?
把提示詞中的年代改成2023年:
無(wú)論是時(shí)尚的破洞褲、潮流的發(fā)型,還是背景的樓宇環(huán)境,一下子都拉回到了現(xiàn)在。
還有這樣的:
來(lái)自微博@谷大白話
甚至有人覺得人物的眼神,根據(jù)時(shí)代不同也在發(fā)生變化。
而且逼真程度也是騙過(guò)了不少網(wǎng)友:
當(dāng)然,“歐美愛情故事”也是不在話下:
當(dāng)然,大家最關(guān)心的還是“手”畫的怎么樣。
于是,一位網(wǎng)友就專門加大難度來(lái)測(cè)試Midjourney V5的這項(xiàng)能力。
例如一張印度美人露手的全身像:
妥妥是影樓大片級(jí)別了。
再生成豎大拇哥的:
不僅沒(méi)有拉胯,甚至Midjourney能把鏡頭的聚焦感體現(xiàn)出來(lái)。
那么只生成手呢?
這一次,真的可以說(shuō)是沒(méi)讓大家失望了:
Midjourney這回可以說(shuō)是驚艷眾人了,不過(guò)也有網(wǎng)友好奇,另一位重量級(jí)選手Stable Diffusion表現(xiàn)又會(huì)如何?
這不,有位網(wǎng)友便用Stable Diffusion搞了個(gè)鏡像:
效果似乎也不錯(cuò)?
Midjourney時(shí)隔4個(gè)月的更新,為何會(huì)讓效果一下拉高到如此“嚇人”的程度?具體又更新了哪些東西呢?
整體來(lái)說(shuō),最明顯的的當(dāng)屬以下三點(diǎn)更新了:
細(xì)節(jié)更加逼真
更多可以選擇的風(fēng)格
告別不會(huì)畫手
首先是細(xì)節(jié)部分,下圖從左到右依次是V3、V4、V5生成的效果,可以說(shuō)是越來(lái)越逼近照片效果了。
圖源:arstechnica
不僅如此,在有面部特寫時(shí),各種肌膚紋理以及光影效果,比如說(shuō)反射、眩光和陰影等,V5都能搞定。
在Discord發(fā)布說(shuō)明中,Midjourney還指出,相較于V4版本,V5版本會(huì)有更多的可以選擇的風(fēng)格,分辨率也提升了2倍。
風(fēng)格的話,可以從0~1000中選擇,stylize 0=照片,stylize 1000=更藝術(shù)。
并且V5還會(huì)對(duì)提示詞更加敏感,用更少更精簡(jiǎn)的文本生成更好的有效的圖片。
更更更重要的是,這次升級(jí),Midjourney可算是擺脫掉了“不會(huì)畫手”標(biāo)簽,想要靠看手指數(shù)的多少來(lái)判別AI作畫已經(jīng)不管用了(Doge)。
值得一提的是,此前,已經(jīng)有人通過(guò)Stable Diffusion+ControlNet解決了AI畫手的問(wèn)題。
不過(guò),也有網(wǎng)友出來(lái)開杠,雖然手指數(shù)畫對(duì)了,但仔細(xì)看細(xì)節(jié)還是能區(qū)分出的:
大拇指還是有點(diǎn)過(guò)長(zhǎng)了。
當(dāng)然,除了上面這些比較明顯的升級(jí)之外,Midjourney V5版本還更新了一些小細(xì)節(jié)。
一位機(jī)器學(xué)習(xí)博主特意列了張表格對(duì)V4、V5進(jìn)行了對(duì)比。
來(lái)自@Lars Nielsen
比如說(shuō),在最新的V5版本中,重復(fù)式、鋪瓷磚式作畫功能又回來(lái)了,在V4版本中,這項(xiàng)功能被官方禁止。
還有,Midjourney V5生成的尺寸也更加自由,像下面1:3、5:1這種窄長(zhǎng)的圖像就是V5生成的,甚至1:10的圖像它也能生成(如果你想的話)。
反觀V4版本,尺寸被限制在1:2~2:1之間。
嗯,這樣的話,說(shuō)不定之后的某個(gè)電影創(chuàng)作畫面就是Midjourney V5生成的。
此外,V5版本還可以手動(dòng)調(diào)節(jié)圖像權(quán)重,比如輸入一張圖像,可以手動(dòng)輸入數(shù)值來(lái)決定它影響最終生成圖像的程度。
Midjourney目前在公測(cè)階段,通過(guò)Discord的機(jī)器人指令,AI會(huì)根據(jù)提示詞幫你生成4張你想要的圖像。
具體來(lái)說(shuō),加入測(cè)試后,在新手頻道中,你可以通過(guò)/image指令來(lái)輸入提示詞。
不過(guò),現(xiàn)在想要玩上V5版本的Midjourney,得先充值成為付費(fèi)用戶才行。
(充哪一檔都可以)
在提示詞中加入—v 5或者從/settings 中選擇“V5”,就可以試玩這個(gè)最新模型啦~
就像這樣:
啊,對(duì)了,如果你不知道怎么寫提示詞,或許可以問(wèn)問(wèn)GPT-4。
[1]https://twitter.com/mranti/status/1637326003927396352
[2]https://twitter.com/heybarsee/status/1636766986809282561?s=46&t=6eepxw1G6XRQ7VO0ANjJWg
[3]https://twitter.com/TheCartelDel/status/1636262759947210753
[4]https://arstechnica.com/information-technology/2023/03/ai-imager-midjourney-v5-stuns-with-photorealistic-images-and-5-fingered-hands/
[5]https://bootcamp.uxdesign.cc/midjourney-v5-is-here-so-whats-new-df3f3a645295?gi=062e86694934
[6]https://weibo.com/5119715209/4881021646409834?wm=3333_2001&from=10D3193010&sourcetype=weixin
關(guān)鍵詞: