伊人久久大香线蕉avapp下载-97久久伊人精品影院-伊人三区-亚洲伊人久久大香线蕉综合图片-中文字幕美日韩在线高清-中文字幕伦理聚合第一页

一行字實(shí)現(xiàn)3D換臉,UC伯克利提出「Chat-NeRF」,說句話完成大片級渲染

來源:36kr時間:2023-03-28 15:10:02

只需要一行字的黑科技!UC伯克利提出Instruct-NeRF2NeRF,一鍵圖像編輯進(jìn)階一鍵3D場景編輯。

由于神經(jīng)3D重建技術(shù)的發(fā)展,捕獲真實(shí)世界3D場景的特征表示從未如此簡單。


(資料圖片僅供參考)

然而,在此之上的3D場景編輯卻一直未能有一個簡單有效的方案。

最近,來自UC伯克利的研究人員基于此前的工作InstructPix2Pix,提出了一種使用文本指令編輯NeRF場景的方法——Instruct-NeRF2NeRF。

論文地址:https://arxiv.org/abs/2303.12789

利用Instruct-NeRF2NeRF,我們只需一句話,就能編輯大規(guī)模的現(xiàn)實(shí)世界場景,并且比以前的工作更真實(shí)、更有針對性。

比如,想要他有胡子,臉上就會出現(xiàn)一簇胡子!

或者直接換頭,秒變成愛因斯坦。

此外,由于模型能不斷地使用新的編輯過的圖像更新數(shù)據(jù)集,所以場景的重建效果也會逐步得到改善。

NeRF + InstructPix2Pix = Instruct-NeRF2NeRF

具體來說,人類需要給定輸入圖像,以及告訴模型要做什么的書面指令,隨后模型就會遵循這些指令來編輯圖像。

實(shí)現(xiàn)步驟如下:

在訓(xùn)練視角下從場景中渲染出一張圖像。 使用InstructPix2Pix模型根據(jù)全局文本指令對該圖像進(jìn)行編輯。 用編輯后的圖像替換訓(xùn)練數(shù)據(jù)集中的原始圖像。 NeRF模型按照往常繼續(xù)進(jìn)行訓(xùn)練。

實(shí)現(xiàn)方法

相比于傳統(tǒng)的三維編輯,NeRF2NeRF是一種新的三維場景編輯方法,其最大的亮點(diǎn)在于采用了「迭代數(shù)據(jù)集更新」技術(shù)。

雖然是在3D場景上進(jìn)行編輯,但論文中使用2D而不是3D擴(kuò)散模型來提取形式和外觀先驗(yàn),因?yàn)橛糜谟?xùn)練3D生成模型的數(shù)據(jù)非常有限。

這個2D擴(kuò)散模型,就是該研究團(tuán)隊不久前開發(fā)的InstructPix2Pix——一款基于指令文本的2D圖像編輯模型,輸入圖像和文本指令,它就能輸出編輯后的圖像。

然而,這種2D模型會導(dǎo)致場景不同角度的變化不均勻,因此,「迭代數(shù)據(jù)集更新」應(yīng)運(yùn)而生,該技術(shù)交替修改NeRF的「輸入圖片數(shù)據(jù)集」,并更新基礎(chǔ)3D表征。

這意味著文本引導(dǎo)擴(kuò)散模型(InstructPix2Pix)將根據(jù)指令生成新的圖像變化,并將這些新圖像用作NeRF模型訓(xùn)練的輸入。因此,重建的三維場景將基于新的文本引導(dǎo)編輯。

在初始迭代中,InstructPix2Pix通常不能在不同視角下執(zhí)行一致的編輯,然而,在NeRF重新渲染和更新的過程中,它們將會收斂于一個全局一致的場景。

總結(jié)而言,NeRF2NeRF方法通過迭代地更新圖像內(nèi)容,并將這些更新后的內(nèi)容整合到三維場景中,從而提高了3D場景的編輯效率,還保持了場景的連貫性和真實(shí)感。

可以說,UC伯克利研究團(tuán)隊的此項工作是此前InstructPix2Pix的延伸版,通過將NeRF與InstructPix2Pix結(jié)合,再配合「迭代數(shù)據(jù)集更新」,一鍵編輯照樣玩轉(zhuǎn)3D場景!

仍有局限,但瑕不掩瑜

不過,由于Instruct-NeRF2NeRF是基于此前的InstructPix2Pix,因此繼承了后者的諸多局限,例如無法進(jìn)行大規(guī)模空間操作。

此外,與DreamFusion一樣,Instruct-NeRF2NeRF一次只能在一個視圖上使用擴(kuò)散模型,所以也可能會遇到類似的偽影問題。

下圖展示了兩種類型的失敗案例:

(1)Pix2Pix無法在2D中執(zhí)行編輯,因此NeRF2NeRF在3D中也失敗了;

(2)Pix2Pix在2D中可以完成編輯,但在3D中存在很大的不一致性,因此NeRF2NeRF也沒能成功。

再比如下面這只「熊貓」,不僅看起來非常兇悍(作為原型的雕像就很兇),而且毛色多少也有些詭異,眼睛在畫面移動時也有明顯的「穿模」。

自從ChatGPT,Diffusion, NeRFs被拉進(jìn)聚光燈之下,這篇文章可謂充分發(fā)揮了三者的優(yōu)勢,從「AI一句話作圖」進(jìn)階到了「AI一句話編輯3D場景」。

盡管方法存在一些局限性,但仍瑕不掩瑜,為三維特征編輯給出了一個簡單可行的方案,有望成為NeRF發(fā)展的里程碑之作。

一句話編輯3D場景

最后,再看一波作者放出的效果。

不難看出,這款一鍵PS的3D場景編輯神器,不論是指令理解能力,還是圖像真實(shí)程度,都比較符合預(yù)期,未來也許會成為學(xué)術(shù)界和網(wǎng)友們把玩的「新寵」,繼ChatGPT后打造出一個Chat-NeRFs。

即便是隨意改變圖像的環(huán)境背景、四季特點(diǎn)、天氣,給出的新圖像也完全符合現(xiàn)實(shí)邏輯。

原圖:

秋天:

雪 天:

沙漠:

暴風(fēng)雨:

參考資料

https://instruct-nerf2nerf.github.io

關(guān)鍵詞:

責(zé)任編輯:FD31
上一篇:直播擺攤的年輕人:月賺近萬元,“絕不是躺平”
下一篇:最后一頁
主站蜘蛛池模板: 女人张腿让男桶免费视频大全| 国产人妖系列在线精品| 鲁啊鲁啊鲁在线视频播放| 我要看特级毛片| 亚洲一级二级| 彩虹男gary网站| 好色先生tv网站| 女人与大拘交口述| 日韩精品无码一区二区三区| 国产乱视频| 国产精品久久国产三级国不卡顿| 国产91高清| 1313苦瓜网在线播| 久久综合狠狠色综合伊人 | 婷婷亚洲久悠悠色悠在线播放| 欧美乱xxxxx| 人体大胆做受免费视频| 男女猛烈xx00免费视频试看| 动漫精品一区二区三区3d| 天天摸天天摸色综合舒服网| 亚洲电影a| 亚洲欧美国产另类视频| 亚洲视频免费播放| 午夜不卡av免费| 亚洲午夜久久久久久尤物| 国产chinesehd在线观看| 亚洲精品自产拍在线观看| 午夜剧场免费体验| 久久精品亚洲一区二区三区浴池| 美女扒开尿口让男人操| 美女露内裤扒开腿让男生桶| 旧里番洗濯屋1一2集无删减| 日本在线免费看片| 翁止熄痒禁伦短文合集免费视频| 99视频免费观看| 中文字幕校园春色| 波多野结衣动态图| 跳d放在里面逛超市的视频| 久久久久久久久久久久久久久| 国产欧美日韩综合精品二区| 动漫精品一区二区三区3d|