2021,還有3天就結(jié)束了。回顧過去一年,科技圈有什么BIG NEWS還印在你的腦海?元宇宙、AlphaFold2開源、IBM首發(fā)2nm工藝... 2021,AI從不缺重磅新聞。展望2022,科技領(lǐng)域?qū)心男┐筅厔荩?/span>
2021,還有3天就結(jié)束了。
回顧過去一年,科技圈有什么 BIG NEWS還印在你的腦海?
扎克伯格宣布將 Facebook改名Meta,全力進(jìn)軍「元宇宙」 ;微軟推出混合現(xiàn)實(shí)會議平臺Mesh;英偉達(dá)全能阿凡達(dá)平臺的3個虛擬人同時亮相...
過去,當(dāng)馬斯克說要在人類大腦植入芯片時,你一定認(rèn)為他瘋了。
但Neuralink在今年5月讓 一只植入芯片的猴子用意念打乒乓球游戲 時,全世界都被震驚。
另外, DeepMind今年開源了AlphaFold2 ,并能夠預(yù)測出98.5%的蛋白質(zhì)結(jié)構(gòu),讓學(xué)術(shù)圈再次沸騰。
不僅如此,研究人員還將其做成了數(shù)據(jù)集,將其免費(fèi)開放。
1750億參數(shù)GPT-3在2020年發(fā)布后, NLP大模型 也在不斷刷新紀(jì)錄。
微軟和英偉達(dá)聯(lián)手發(fā)布了5300億參數(shù)的「威震天」,智源1.75萬億參數(shù)的「悟道2.0」,阿里達(dá)摩院發(fā)布創(chuàng)紀(jì)錄的10萬億參數(shù)多模態(tài)大模型「M6」,并且實(shí)現(xiàn)GPT-3同規(guī)模僅需1%能耗…….
還有IBM首發(fā)2nm工藝,人形機(jī)器人Ameca蘇醒......
2021年并不缺重磅新聞,人工智能依然能夠殺出重圍,走進(jìn)主流視野。
展望2022年,科技領(lǐng)域會有哪些大趨勢?
今天,達(dá)摩院重磅發(fā)布2022十大科技趨勢,這是連續(xù)第四年發(fā)布。
通過「 定量發(fā)散 」與「 定性收斂 」,達(dá)摩院分析了近三年來的770萬篇公開論文、8.5萬份專利,通過挖掘其中熱點(diǎn)及重點(diǎn)技術(shù)突破,深度訪談近100位科學(xué)家,提出了2022年可能照進(jìn)現(xiàn)實(shí)的十大科技趨勢。
AI仍是最濃墨重彩的主角,但基本范式正在發(fā)生變革;芯片技術(shù)將更迭;下一代互聯(lián)網(wǎng)即將到來……
科學(xué)研究是在星辰大海里探索未知,其中,實(shí)驗(yàn)科學(xué)和理論科學(xué)是數(shù)百年來科學(xué)界的兩大基礎(chǔ)范式。
而 人工智能正在催生新的科研范式 。
以蛋白質(zhì)為例,通過研究其3D結(jié)構(gòu),生物學(xué)家不僅可以更加快速地研發(fā)出針對各類疾病的藥物,甚至能夠揭開生命之謎。而「蛋白質(zhì)折疊問題」在過去的50年里一直是生物學(xué)的一個巨大挑戰(zhàn)。
1969年,賽勒斯·萊文塔爾 (Cyrus Levinthal) 指出,通過蠻力計(jì)算列舉出典型蛋白質(zhì)的所有可能構(gòu)型所需的時間比已知宇宙的年齡還要長:一個典型的蛋白質(zhì)可能有10的300次方種折疊形式。
不過,隨著人工智能的發(fā)展,2021年7月,DeepMind先是在Nature上開源了利用AI對蛋白質(zhì)結(jié)構(gòu)進(jìn)行預(yù)測的AlphaFold 2,隨后又發(fā)布了來自人類和20種其他生物共350000種蛋白質(zhì)結(jié)構(gòu)的預(yù)測結(jié)果。
經(jīng)過訓(xùn)練的深度神經(jīng)網(wǎng)絡(luò)可以根據(jù)蛋白質(zhì)的基因序列預(yù)測蛋白質(zhì)的特性。主要判斷依據(jù)是氨基酸對之間的距離和連接這些氨基酸的化學(xué)鍵之間的角度。通過已知信息,可以推斷出蛋白質(zhì)折疊之后的角度和距離信息,從而推斷出整個蛋白質(zhì)的結(jié)構(gòu)。
2021年12月,DeepMind首次利用人工智能幫助數(shù)學(xué)家們提出了兩個全新的數(shù)學(xué)猜想,登上Nature封面。
作者猜測低維拓?fù)渲写嬖谖粗姆蔷€性關(guān)系,產(chǎn)生了很多數(shù)據(jù)并用神經(jīng)網(wǎng)絡(luò)擬合了近似函數(shù),發(fā)現(xiàn)其中三個量在擬合過程中起到了很重要的作用。通過反正做擬合實(shí)驗(yàn),產(chǎn)生新的數(shù)據(jù),得到新的觀察模型,最終數(shù)學(xué)家利用智慧猜出了一個不等式結(jié)構(gòu),并進(jìn)一步給了嚴(yán)格的證明。
由此可以看出,機(jī)器學(xué)習(xí)能夠處理多維、多模態(tài)的海量數(shù)據(jù),解決復(fù)雜場景下的科學(xué)難題,帶領(lǐng)科學(xué)探索抵達(dá)過去無法觸及的新領(lǐng)域。
而 人工智能也將成為科學(xué)家繼計(jì)算機(jī)之后的新生產(chǎn)工具 :
1. 帶來效率的顯著提升,人工智能將伴隨科研的全流程,從假設(shè)、實(shí)驗(yàn)到歸納總結(jié),讓科學(xué)家不需要像過去一樣十年寒窗才能產(chǎn)出科學(xué)成果,而是能在一生中保持高產(chǎn);
2. 讓科學(xué)不再依賴少數(shù)天才,人工智能對科學(xué)研究產(chǎn)生猜想,讓科學(xué)家就其中有意義有價值的部分進(jìn)行實(shí)驗(yàn)與證明,讓更多人能夠參與到科學(xué)研究中。
阿里達(dá)摩院預(yù)測在未來的三年內(nèi),人工智能技術(shù)在應(yīng)用科學(xué)中將得到普遍應(yīng)用,在部分基礎(chǔ)科學(xué)中開始成為研究工具。
AI能夠取得這些成就的背后,少不了模型的支撐。
隨著規(guī)模的不斷擴(kuò)大,預(yù)訓(xùn)練模型在文本、圖像處理、視頻、語音等多個AI領(lǐng)域?qū)崿F(xiàn)了突破性進(jìn)展,并逐漸成為人工智能的基礎(chǔ)模型。
2018年,谷歌提出3億參數(shù)BERT模型驚艷四座,大規(guī)模預(yù)訓(xùn)練模型也因此逐漸走進(jìn)人們的視野,成為人工智能領(lǐng)域的焦點(diǎn)。
2019年2月,OpenAI推出了15億參數(shù)的GPT-2,能夠生成連貫的文本段落,做到初步的閱讀理解、機(jī)器翻譯等。
緊接著,英偉達(dá)推出了83億參數(shù)的威震天Megatron-LM,谷歌推出了110億參數(shù)的T5,微軟推出了170億參數(shù)的圖靈Turing-NLG。
2020年6月,大模型來到了一個分水嶺,OpenAI以1750億參數(shù)的GPT-3,直接將參數(shù)規(guī)模刷到千億級別,直逼人類神經(jīng)元的數(shù)量。作詩、聊天、生成代碼等等,無所不能。
在沉寂了一段時間之后,微軟和英偉達(dá)在2021年10月聯(lián)手發(fā)布了5300億參數(shù)的Megatron-Turing自然語言生成模型(MT-NLG)。同時奪得單體Transformer語言模型界「最大」和「最強(qiáng)」兩個稱號。
除了千億規(guī)模的稠密單體模型,還有萬億規(guī)模的稀疏混合模型。
2021年1月,谷歌推出了1.6萬億參數(shù)的Switch Transformer。12月,這個記錄被達(dá)摩院的M6模型的10萬億參數(shù)打破,大模型參數(shù)直接提升了一個量級,而且達(dá)摩院只用了512張GPU進(jìn)行訓(xùn)練。
然而,同樣隨著模型規(guī)模擴(kuò)大的是訓(xùn)練對資源消耗越來大,而參數(shù)數(shù)量增加所帶來的性能提升與消耗提升不成比例。
大模型確實(shí)帶來了非常驚艷的表現(xiàn),但也有研究開始對「模型參數(shù)越多,性能也越好」是否始終成立提出了質(zhì)疑。
例如,谷歌的研究人員開發(fā)了一個參數(shù)量遠(yuǎn)小于GPT-3的模型——微調(diào)語言網(wǎng)絡(luò)(fine-tuned language net, FLAN),這個1370億個參數(shù)的模型在許多有難度的基準(zhǔn)測試中性能都大幅超過GPT-3。
阿里達(dá)摩院認(rèn)為, 接下來大模型的參數(shù)規(guī)模發(fā)展將進(jìn)入冷靜期,大模型與相關(guān)聯(lián)的小模型協(xié)同將是未來的發(fā)展方向 。
其中,大模型沉淀的知識與認(rèn)知推理能力向小模型輸出,小模型基于大模型的基礎(chǔ)疊加垂直場景的感知、認(rèn)知、決策、執(zhí)行能力,再將執(zhí)行與學(xué)習(xí)的結(jié)果反饋給大模型,讓大模型的知識與能力持續(xù)進(jìn)化,形成一套有機(jī)循環(huán)的智能系統(tǒng)。參與者越多,模型進(jìn)化的速度也越快。
而這樣的一種新的智能體系,將會帶來 三點(diǎn)優(yōu)勢 :
1. 讓小模型更容易獲取通用的知識與能力,小模型專注在特定場景做極致優(yōu)化,提升了性能與效率;
2. 解決了過去大模型數(shù)據(jù)集過于單一的問題,小模型在真實(shí)場景回收的增量數(shù)據(jù),讓大模型有再進(jìn)化的元素;
3. 全社會不需要重復(fù)訓(xùn)練相似的大模型,模型可以被共享,讓算力與能源的使用效率最大化。
對此,南京大學(xué)計(jì)算機(jī)科學(xué)與技術(shù)系主任兼人工智能學(xué)院院長周志華也提出了自己的觀點(diǎn):
大模型未來會在一些重大任務(wù)上發(fā)揮作用,而在其他一些場景下或許會通過類似集成學(xué)習(xí)的手段來利用小模型,尤其是通過很少量訓(xùn)練來「復(fù)用」和集成已有的小模型來達(dá)到不錯的性能。
阿里達(dá)摩院預(yù)測在未來的三年內(nèi),個別領(lǐng)域?qū)⒁源笠?guī)模預(yù)訓(xùn)練模型為基礎(chǔ),對協(xié)同進(jìn)化的智能系統(tǒng)進(jìn)行試點(diǎn)探索。
在未來的五年內(nèi),協(xié)同進(jìn)化的智能系統(tǒng)將成為體系標(biāo)準(zhǔn),讓全社會能夠容易地獲取并貢獻(xiàn)智能系統(tǒng)的能力,往通用人工智能再邁進(jìn)一步。
就像《黑客帝國》所描繪情景,未來的虛擬世界是否是矩陣模擬中的那樣,這是未知的。
拉近點(diǎn)距離,我們?nèi)绾尾拍苓M(jìn)入這個虛擬世界才是最重要的一步。
這里就不得不提,頭號玩家中那副眼鏡或許是打開新世界的大門。
未來,眼鏡有望成為新的人機(jī)交互界面,推動形成有別于平面互聯(lián)網(wǎng)的XR(未來虛實(shí)融合)互聯(lián)網(wǎng)。
XR互聯(lián)網(wǎng)將改變用戶的信息感知和獲取方式,最大的特征是由二維平面走向三維立體的沉浸式體驗(yàn),信息會以自然的方式被獲取,讓用戶所見即所得。
阿里達(dá)摩院預(yù)計(jì)未來3年內(nèi)會產(chǎn)生新一代的XR眼鏡,融合AR與VR的技術(shù),成為下一代互聯(lián)網(wǎng)的關(guān)鍵入口。
據(jù)報道,蘋果明年預(yù)計(jì)會推出首款A(yù)R/MR頭顯,將配備3D傳感器,能夠?qū)崿F(xiàn)手眼動作全追蹤。
其實(shí),眼鏡只是構(gòu)成XR互聯(lián)網(wǎng)所需要的四大要素其中的一種。
完整的XR互聯(lián)網(wǎng)包括:硬件(如XR眼鏡等)、內(nèi)容(如娛樂、購物、社交等)、人工智能(如空間感知、數(shù)字孿生)、基礎(chǔ)設(shè)施(如5G、云計(jì)算等)。
四大要素中硬件和內(nèi)容會率先發(fā)展,硬件是獲取數(shù)據(jù)與用戶交互的基礎(chǔ),也是互聯(lián)網(wǎng)平臺的載體。
XR眼鏡將會成為XR互聯(lián)網(wǎng)的第一入口 ,同時云網(wǎng)端協(xié)同將改變眼鏡的形態(tài),使其向著體積更小、重量更輕、響應(yīng)速度更快的方向發(fā)展。
內(nèi)容則以娛樂社交和辦公場景開始,再逐漸發(fā)展至購物、教育、醫(yī)療等對遠(yuǎn)距互動有一定需求的場景。
就比如,微軟推出的混合現(xiàn)實(shí)會議平臺Mesh,人們可以通過虛擬化身的形式見面和互動,還能共享Office文件等。
XR互聯(lián)網(wǎng)改變?nèi)伺c科技互動的方式:
· 模擬真實(shí)世界的時空,解決真實(shí)世界遠(yuǎn)距移動的問題,如遠(yuǎn)程教育、遠(yuǎn)程醫(yī)療、遠(yuǎn)程辦公等,克服地理空間的限制。
· 創(chuàng)造真實(shí)世界不存在的時空,解決真實(shí)世界不完美的問題,如游戲、社交等,讓用戶能夠重新建立自我認(rèn)可,并以接近真實(shí)世界的方式進(jìn)行交互。
XR互聯(lián)網(wǎng)也將重塑現(xiàn)有的產(chǎn)業(yè)結(jié)構(gòu),催生一批從元器件、設(shè)備、操作系統(tǒng)到應(yīng)用的新產(chǎn)業(yè)生態(tài)。
除了AI for Science、大小模型協(xié)同進(jìn)化、XR互聯(lián)網(wǎng)之外,阿里達(dá)摩院還預(yù)測了2022另外七大科技趨勢。
當(dāng)前,硅基半導(dǎo)體已經(jīng)推進(jìn)到5nm和3nm,IBM今年也宣布了突破2nm的「PPT 工藝」。
電子芯片發(fā)展逼近摩爾定律極限,集成技術(shù)進(jìn)步趨于飽和,高性能計(jì)算對數(shù)據(jù)吞吐要求不斷增長,亟需技術(shù)突破。
光子芯片是用光子代替電子進(jìn)行信息傳輸,可以承載更多的信息和傳輸更遠(yuǎn)的距離。
光電融合是未來芯片的發(fā)展趨勢,硅光子和硅電子芯片取長補(bǔ)短,充分發(fā)揮二者優(yōu)勢,促使算力的持續(xù)提升。
未來三年,硅光芯片將支撐大型數(shù)據(jù)中心的高速信息傳輸;未來五到十年,以硅光芯片為基礎(chǔ)的光計(jì)算將逐步取代電子芯片的部分計(jì)算場景。
特斯拉AI日上,馬斯克宣布明年即將推出Tesla Bot;波士頓動力公司的機(jī)器人Atlas上演驚艷跑酷;還有英國Engineered Arts開發(fā)的人形機(jī)器人Ameca讓人直呼恐懼。
近年來,柔性機(jī)器人結(jié)合柔性電子、力感知與控制、人工智能技術(shù),獲得了力覺、視覺、聲音等感知能力,應(yīng)對多任務(wù)的通用性與應(yīng)對環(huán)境變化的自適應(yīng)性大幅提升。
預(yù)計(jì)未來5年,兼具柔性和類人感知的機(jī)器人將逐步替代傳統(tǒng)工業(yè)機(jī)器人,成為產(chǎn)線上的主力設(shè)備,并在服務(wù)機(jī)器人領(lǐng)域開始規(guī)模化應(yīng)用。
綠色能源AI :人工智能助力大規(guī)模綠色能源消納,實(shí)現(xiàn)多能互補(bǔ)的電力體系
高精度醫(yī)療導(dǎo)航 :人工智能與精準(zhǔn)醫(yī)療深度融合,助力診療精度與效率提升
全域隱私計(jì)算 :破解數(shù)據(jù)保護(hù)與流通兩難,隱私計(jì)算從小數(shù)據(jù)走向大數(shù)據(jù)
星地計(jì)算 :衛(wèi)星及地面一體化的通信與計(jì)算,促進(jìn)空天地海全面數(shù)字化
云網(wǎng)端融合 :云網(wǎng)端融合形成新計(jì)算體系,催生云上新物種
過去一年,我們見證了人工智能以全新的方式深入我們的生活,這些進(jìn)步賦予未來很多可能。
2022年,對于AI必將是令人興奮的一年。
未來可期。
本文來自微信公眾號 “新智元”(ID:AI_era),作者:新智元,編輯:桃子好困,36氪經(jīng)授權(quán)發(fā)布。