網易伏羲李仁杰:虛擬人是未來,元宇宙是真實世界的有益補償 | 2021WISE元宇宙·機器人峰會
2021年,隨著“元宇宙第一股”Roblox的上市,以及,這個源于科幻小說《雪崩》中的未來概念逐漸為人所知。
元宇宙(Metaverse)已然成為投資圈討論最為火熱的賽道,但建設這樣一個宏大的、高自由度的、極具幻想色彩的虛擬世界,需要AI、內容創作引擎、內容生態、網絡通訊技術、AR/VR生態、區塊鏈等不同領域的解決方案共同完成。
不少互聯網公司入局元宇宙。網易伏羲想將游戲和人工智能結合的經驗用到更廣闊的領域,“我們認為虛擬人是未來。元宇宙最有用的價值應該是真實世界的有益補償,能夠解決真實世界的問題,一定要用虛擬世界為真實世界服務,包括但不限于教育元宇宙、工業元宇宙和文化元宇宙等等。”
以下是網易伏羲聯席負責人李仁杰的現場演講:
我今天主要講三個方面,一是元宇宙的概念;二是我們在元宇宙的技術積累;三是網易伏羲基于元宇宙概念做了什么樣的事情。
在互聯網上,大家能搜到很多關于元宇宙的討論,定義也非常不一樣,我為什么選這樣一張圖,是因為我覺得它足夠open,生態非常多元化。這里說硬件是敲開元宇宙的大門的鑰匙,但是沒有說是AR還是VR;它說了支付服務,但是沒有說是基于區塊鏈,是不是要去中心化還是不要去中心化;說了內容和資產,但是沒有說一定UGC。因為現在元宇宙是百家爭鳴,百花齊放,我們覺得它一定是多樣性,就像今天上午蔡維德老師說的,不一定非得用數字資產,也不一定是AR或者VR,不一定是用戶創造的內容。比如微軟,就沒有強調是自己的內容。
第二元宇宙的價值應該怎么去衡量?我們覺得元宇宙最有用的價值應該是真實世界的有益補償,能夠解決真實世界的問題,一定要用虛擬世界為真實世界服務,包括但不限于教育元宇宙、工業元宇宙和文化元宇宙等等。
下面給大家介紹一下網易伏羲到底是做什么的,可能大家對這個名字比較陌生,我們的前身實際上叫伏羲實驗室,從這個名字可以看出來我們是做底層基礎研究,我們之前做的事情是探索游戲和人工智能的結合,幫助我們的開發者降本增效,以及幫助我們的玩家提高游戲體驗。
經過這幾年的沉淀、探索,伏羲幫助游戲做了非常多的事情,我們覺得到了一個階段,可以把游戲和人工智能結合的能力開始運用到更廣闊的地方,不僅局限于游戲,甚至包括文化娛樂,甚至工業界。于是進入我們第二個階段,希望把這種沉浸式的交互體驗帶到每個領域,豐富每個人的精神世界。
這個是我們主要做的6個方向,其中包括強化學習、自然語言處理、視覺智能、虛擬人、用戶畫像以及支撐所有5個研究方向底層的大數據和人工智能的計算平臺,我們做了非常非常多各種各樣的事情,因為今天時間有限,主要給大家介紹一下我們在虛擬人方向的一些探索。我們認為虛擬人一定是未來,不僅是游戲,包括虛擬世界中一個非常非常重要的組成部分,為了實現降本增效,它所有的鏈路可能在未來都要實現全部人工智能化。
說到虛擬人,可能大家第一個想到的是希望虛擬人和自己相像。我不知道在座的有多少游戲玩家?我是一個老游戲迷,從早期的MMORPG開始,那時候大家還不能去創造自己的角色,到后面我們國內的游戲發展得越來越好,我們可以在游戲里面自定義很多的角色,甚至可以在200個緯度上把自己的角色調整得惟妙惟肖,但是并不是所有人都有非常好的藝術細胞,比如我就沒辦法創造一個跟我非常像的人物形象,以至于在淘寶上出現了一個“捏臉師”的職業,50塊錢一次,他可以幫你捏一個形象。我們想怎么把人工智能應用到這上面來,用戶只要上傳一張2D的照片,可以捏出3D的圖象,我們在很多的游戲都已經實現了智能捏臉,我們最近和《永劫無間》合作,有的玩家希望像自己,有的人希望比自己做得更好看,我們做了非常多版本的迭代,現在能做到只要玩家上傳一張照片,就可以實現游戲中的虛擬形象。
有了臉之后還缺什么?發型也是我們現在做的,比如我在現實生活中對發型已經沒有追求了,可能越來越差,但是我仍然希望在虛擬世界中的發型比較好,包括它可以生成你的身體和服飾。我們還可以用無人機掃一遍,可以生成場景三維的建模。
有了你的模型形象之后,下一步怎么讓這個模型說話,以及怎么讓它動起來,現在讓虛擬人動起來無非有三種方法,第一就是大家看到的電影級別的制作,需要人穿上緊身服,通過演員的表演把它遷移進去,第二種就是通過攝像頭,你在攝像頭前面做一些動作,表情也可以嵌入進去,但是這兩種都需要中植人去表演,我想如果大家要發展虛擬人的話,甚至成千上萬的虛擬人,成千上萬的元宇宙,不可能讓每個虛擬人都是人去表演,唯一就是通過AI實現,我們給AI語言、文字,就可以實現動畫、表情等的實現。
表情包括動作,只要給文字,他就可以自己說出來,以及玩家可以去調她的情緒,比如調她是開心的情緒或者悲傷的情緒,這樣的虛擬人在自動表演以及做游戲NPC角色時,成本降得非常的多。
我們有了形象,能說話,能動起來之后,我們想怎么把這些東西串起來,我們現在嘗試一首歌曲從作詞到編曲再到演唱、動作,全部是AI自動完成。這首歌曲叫《醒來》,是我們去年網易大會上發布的一首歌曲。傳統做一首歌至少兩個月的時間,但是有了AI一分鐘就可以全部實現。他有了表情,動作,會說話之外,我們會希望他更加聰明起來,這也是我們在強化學習方面的研究。
我們在游戲中可以體會到,可以跟NPC進行對戰,這個用的是強化自動學習,開始不會打,后面慢慢學習,后來還學會了欺騙。
剛才是我們在虛擬人方面的一些探索和研究,有了人之后,我們還希望有一些場景,于是我們又做了一個叫“瑤臺”的產品,我們希望大家在虛擬的世界中去舉辦會議或者是活動。它的背景背景是去年突如其來的疫情。疫情來了之后,大家可能有很多人都會有一兩個月的時間居家辦公,會用到很多線上的會議系統,但是我們發現雖然會議系統帶來很多的高效。但是還是有很多線下會議所需要的儀式感、沉浸感和社交感是取代不了的。
比如我們今天舉辦的36氪的大會,其實完全可以在線上舉行,但是為什么我們不在線上舉行呢?首先我們需要儀式感,因為36氪邀請大家參加大會,邀請大家來,甚至他們希望在末尾發布一些東西。還要有社交感,比如我剛才就認識了坐在我旁邊,柳葉熙的爸爸,我非常想認識他,于是加了好友,但是大家平時在線上會議是非常難得有這樣的體驗的,所以我們就想我們是不是可以做這樣的一些事情,讓我們傳統的線上會議變得更豐富起來。
于是在去年10月份,元宇宙的概念還沒有那么火的時候我們做了第一次嘗試,只是想驗證一下我們的想法。沒想到雖然是很多學者舉行的會議,但是大家在里面玩得還挺開心,于是更加堅定我們的信心,沉浸式的活動系統是有很多可以做的。這邊是一張當時會議結束之后的一張合影,有點看不清,實際上大家是用AI捏臉做的合照,這就是我剛才說的傳統會議與線上會議的一些區別。
所以我們其實根據那個之后又開始進行了更多的思考,我們重新做了整個的會議系統,現在已經跟剛才大家看到去年10月份完全不一樣,比如我們加入了很多全新的參會體驗,你可以有你自己專屬的角色,我們加了動作遷移、表情遷移,你在攝像頭做了各種各樣的動作,是可以通過虛擬傳輸出去的,大大家也不可能為了一場會議下載幾十G的客戶端,我們通過云游戲的技術,做到即點即用無延遲。
我們還做了虛擬人講解的新人教學,在會場有瞬移的功能;模仿我們線下,比如兩個人湊在一起就自動打開攝像頭,你的虛擬形象就出現;各種國家的語言的翻譯,為會議實施方提供的會議系統,比如對講師的復盤、反饋,哪一場會議怎么樣;甚至加了抽獎系統。我們也做了很多的風格,比如古風、幻想、現實,還有未來展會的風格,我們在不斷完善這一套沉浸式的活動系統,希望未來它不僅可以做會議,可以做展會,當更多的資源加入時,個人可以隨意在里面搭配,創建自己活動的場景。你可以安排一場家庭聚會,甚至可以做一場屬于你自己的劇本殺。
因為時間有限,今天給大家介紹的就是這么多,如果大家對這個感興趣,可以搜索或者聯系我們,謝謝。