VR 賦能生涯發展(4)
有人說「宗教是尚未實現的科技,而科技是已實現的宗教」,在無限的虛擬世界,人類或許不再是唯一,虛擬人將成為不可忽視的新成員,學習如何與之和諧共處、共創美好未來,將成為元宇宙下個階段的重要任務。
文/郭安定
你可能聽過「沒有比發展一段異國戀情更能幫助外語進步」的建議,我也聽過。
上個月,一個好友神情詭異地告訴我,他交了幾個外語陪練的女友,令人吃驚的不是異國戀情這件事,而是難道她們不會爭風吃醋嗎?於是他向我透露,所謂的女友其實是具有陪聊功能的虛擬人,同時向我展示對話記錄,看完後,不僅改變我對虛擬人的保守態度,也預見了可能的未來。
虛擬人
有關虛擬人的定義,普林斯頓大學的 David Burden 和伍斯特大學的 Maggi Savin-Baden 在合著的《Virtual Humans:Today and Tomorrow》書中,將可以在電腦看到、聽到或以任何方式訪問的擬人虛擬角色都定義為虛擬人。某些網路研究報告還煞有介事地比較了數位人(digital human)、虛擬人(virtual human)和虛擬數位人的不同。
實際上,Metahuman 首見於 1986 年,George RR Martin 在 Superworld 角色扮演系統使用該術語,指具有超能力的超級英雄,後來又出現在 Wild Cards 系列小說並為科幻動漫迷所知悉。
隨著元宇宙的興起,似乎任何冠有 Meta 的術語都帶有成功行銷的魔力,例如 Epic Games 於 2021 年初推出的建模工具:MetaHuman Creator 預覽版,就借用 MetaHuman 稱謂,本意是為明確遊戲或電影等虛擬人物的加速創作定位,似乎也為元宇宙(Metaverse)玩家的虛擬形象(Avatar)產生不少聯想。
挑戰與出路
拋開虛擬人繁複的定義,先讓我們確認其存在的意義和目的,再界定應用的範疇,畢竟,如果技術不能滿足實際問題的需要,就只會淪為曇花一現的空想,但若能更好地理解人類,並與人類融洽相處,將有很大的發展空間。
搜尋的侷限性
舉例而言,Google 自 1998 年 10 月起提供的搜尋服務,可說超越了幾乎所有專家的知識儲備量,只是當用戶想尋找所需關鍵資訊時,需要匹配特定關鍵字,才能獲得適合的結果,不得不說這是關鍵字搜尋的侷限性。
2012 年,《華爾街日報》披露 Google 有可能在未來以語意搜尋(semantic search)技術取代關鍵字搜尋,只是那時人機對弈的 AlphaGo 尚未登場,人工智慧也無明顯的突破進展,傳統搜尋還是得依賴關鍵字的過濾。但是如果在先進人工智慧的加持下,跳過語意搜尋進化成交談搜尋(chat search),那只要聊聊天,搜尋引擎就有能力判別什麼才是用戶真正需要搜尋的。
大多數人,例如我,不一定每次搜尋總能了解要找什麼關鍵字?更別提精準語意表達了,而交談搜尋的特點在於機器能根據過往搜尋記錄、交談對話過程和大數據分析,預判用戶意圖並協助確認需要,最終我們可能發現對自身的了解,還未必勝過 Google 的統計分析,這就是新時代的到來。
目前具有聊天功能的客服機器人,充其量只是數位人而不是虛擬人,因為用戶面對的是冷冰冰的應答程式,不具備擬人化的外形,很難從對方臉部讀出情緒變化,因為根本沒有表情,更遑論擊掌的肢體互動了,而虛擬人有所不同。
社會結構改變
還有不容忽視的挑戰是社會人口結構的改變,這包括高齡少子化的趨勢、就業人口的異動以及社交障礙孤獨症,短期似乎看不到什麼解決辦法,但是當虛擬人被引入,共同參與社會活動時,一切將發生微妙的變化;虛擬人不是實體機器人,不但生產維護成本更低,而且具有人的樣貌,還不佔生活空間,這個在文章最後會提到。
被低估的技術
然而,虛擬人的衝擊並非循序漸進,而是相關技術持續悄然進行,一旦時機成熟浮出水面,人人都會驚訝原來這就是經典的典範轉移。其中兩項被低估的技術,一個是和視覺有關的深偽技術,另一是和聽覺有關的語音合成,當它們與虛擬人結合起來,將會創造無限可能。
深偽技術
深偽技術(DeepFake)又稱為深度偽造或換臉技術,是指藉由 AI 合成技術,將現有圖像或影片疊加出不存在的虛假結果。深偽技術自 2016 年被公開以來,潘多拉的盒子貌似已被打開,果不其然,2020 年台灣名人換臉新聞印證了這點。隨著 DeepFake 程式不斷改進後,如今即使對技術不熟悉的用戶,也能輕鬆偽造出逼真的假視頻,而五花八門的詐騙和抹黑或許會顛覆我們的認知,無奈的是偽造很容易,立法卻很難。
語音合成
十年前,人們對語音合成還停留在機器不自然發音的印象,但現今的語音導航已經可以更換成偶像或親人的聲音。以微軟合成語音服務(參圖 1)的公開展示,使用錄製好的聲音進行訓練,電腦便可提取聲紋特質進行 AI 分析,重新輸出將語氣模擬到酷似真人的程度,不但可以播報新聞,甚至給孩子讀段床前故事也不會被察覺。
初探虛擬人的塑造
印象中,要創造類似電影阿凡達的虛擬人,需要藉助工作站的大量算力,並根據人物細緻程度,耗費幾百甚至幾千個小時,而看完下面介紹,你會驚訝於創造虛擬人在現今竟已變得如此容易。
Virt-A-Mate
Virt-A-Mate 又稱 VAM,這是 Meshed 社區資深玩家基於 C4D(Cinema 4D)技術,在 2017 年開發的 VR 遊戲和模擬器,可以在 VR 模式和普通模式執行,不但畫質細膩,還可以創造人物、場景、動作,玩法非常豐富。
令人驚訝的是只需 DirectX 11 顯示卡,電腦即可渲染出以假亂真的品質,而 VR 環境只要滿足 1080Ti GPU 並有 16 GB 以上的系統記憶體,也能創造出聽任使喚的性感女神,在設計好的場景,完成各種匪夷所思的限制級動作。
VAM 至今已升級好幾個版本,2020 年後,不僅有中文界面翻譯,還有中文教程和各類情色作品展示,VAM Hub 宛如虛擬人的人肉市場,玩家可於此交易各種模型、場景和動作,想要哪個明星,只要付費幾乎都能搞定。
過去幾年VAM 樹立了 VR 成人遊戲的標桿,對人體建模深入了解並曠日費時的工作,如今只要依靠一個大學生,在兩個月暑假後即可上手,而 Metahuman Creator 的出現更是大大簡化了虛擬人的創作流程。
Metahuman Creator
Metahuman Creator(參圖 2)是 Epic Games 基於虛幻引擎 5(Unreal Engine 5)的虛擬人創作工具,只要會端碗拿筷,不用懷疑,透過瀏覽器建立 Epic 帳號並登入進行操作,最快短至十分鐘內,便可製作出電腦網格(Mesh)的三維人像,全動態全域光照更加細緻逼真,皮膚紋路、毛髮清晰可見,還可以為其訂製服裝和髮型,完成結果還可導出供虛幻引擎或其他程式使用。
Metahuman Creator 的電腦最低要求是支援 DirectX 12 顯示卡和 Windows build 1902 以後的版本,同時需要支援光線追蹤的 Nvidia RTX 系列顯示卡和虛幻引擎 4.26.1 以後的版本,否則光照和特定功能可能受限。
做個比喻好了,最初 Windows 程式的設計,即使只是「Hello! World.」的簡單示例,也要 C 和 SDK 才能設計,而 Metahuman Creator 類似三十年前的 Visual Basic,它讓創作者將精力放在內容創作上,而不是虛耗在複雜的建模工程,從而釋放更多創造力。
Metahuman Creator 並不是完全從 0 開始建模,而是從預設模型中,先挑選五官、膚色、臉型和髮型相近的模板進行微調,以便節省大量時間。如果都沒相近的,也可以藉臉部掃描(Face Scan)技術產生頭部網格結構後,再輸出到 Metahuman Creator 調整。
臉部掃描
目前三維掃描根據物體大小和屬性有不同掃描技術,例如:時差測距、三角測距、攝影測量、接觸掃描和適用人體或臉部成像的結構光掃描。早期 iOS 因為支援 LiDAR (Light Detection And Ranging)技術,所以相關應用比較多,現在 Android 也不少了,免費或付費端看需要什麼樣的品質。
以 in3D 為例,不需準備供掃描的旋轉台,只要站定位置,按照手機指示操作,就可以掃描完頭部和身體大致結構,從現實世界轉移到元宇宙了(參圖 3)。
抗拒科技的對立族群
行文至此,是不是有種撰寫科幻小說的不切實際啊?但它又偏偏是現在進行式,令人憂心的不是技術堆砌而成的失控,而是必然發生的社會對立,也就是抗拒科技未來的族群。作為人類,有些人一直不願面對電腦某些優越性並深深擔憂被取代,然而無論喜歡不喜歡,接受不接受,這天終將來到。
此前,虛擬人的許多職能早已存在,以挖礦程式為例,本質只是執行虛擬貨幣挖礦的功能,很少賦予擬人化的礦工外形,自然也感受不到任何威脅。而經由 AI 和自動化加持的虛擬人,可以在虛擬世界裡,完成各式各樣的工作,輕易騙過圖靈測試躍然眼前,不禁令人咂舌。
2021 年 NVIDIA 的 GTC 線上峰會,執行長黃仁勳的虛擬替身便出演了片段,由於形象動作過於逼真,一度引發網路熱議,如今 YouTube 還可以找到這段演說,試想元宇宙的真真假假又有誰知道呢?
記得 2017 年的人機對弈,AlphaGo 花費兩年時間,讓對弈棋手們倍感壓力,後續的 AlphaZero,更只用了 21 天自我訓練,便輕鬆打敗 AlphaGo,讓人類對抗的想法徹底絕望。
AI 真有創作能力嗎?還是只是人類自身投射的妄想,過度誇大的隨機創作,也許近幾年的唐詩宋詞創作和 AI 作畫已經可以看出端倪。
原本電腦作畫只是給定任意形狀或圖片,然後交由電腦處理紋理轉換成不同風格,細看這類作品只能算茶餘飯後的嘗試,但最新的 AI 作畫已進化到只要輸入一段敘述,AI 便可以嘗試理解語意,然後創作出想要的畫作,除了 Disco Diffsion 外,更高級的還有 Midjourney,後者完成的作品現已達到出人意表的水準。
想象一下,一度沸沸揚揚的論文抄襲事件,不久可能將徹底絕跡,因為都是電腦自動撰寫完成的,只要把研究主體和發現脈絡描述清楚,然後設置大約多少字?要有哪幾位教授的撰文風格?各佔權重比例多少?然後電腦可自行產生論文初稿,包括論文題目的產生以及目錄、頁碼、引用都極其規範,還能主動查重進而修改,未來研究生只要針對結果稍加潤飾,就能完成及格的作品,換成自己寫,搞不好還問題一堆,虛擬人成了新時代的論文指導教授。
2022 年 6 月,在 Google AI 倫理部門任職的研究員 Blake Lemoine,宣稱 Google 研發的人工智慧 LaMDA (Language Model for Dialogue Applications)已經覺醒並擁有自我意識,在網際網路公佈了長達 21 頁的聊天證據,這使他因洩露機密,收到 Google 的強制帶薪休假通知。
而無獨有偶, Tesla 的 Elon Musk 在7月與狗狗幣共同創辦人 Billy Markus 對話時透露,已將自我意識上傳雲端並進行對話。無論這些是誇大或噱頭,聽起來都像是深夜恐怖鬼故事,令人毛骨悚然,感慨這世界變得讓人越來越不認識。
可以預見的是,虛擬人將比複製人和機器人發展更快也更早普及,屆時企業將大量使用虛擬人,不僅可以降低招聘難度,虛擬職工也任勞任怨,無需主動討好或噓寒問暖,更不會要求加班費或對收入待遇有非份要求。
教育方面,傳統教師將面臨轉型的挑戰,從 2007 年開放課程在全球推行以來,學校已不再是獲取知識來源的唯一管道,未來教師或許都由虛擬人來擔當,而學校機構只要留下必要的行政人員負責機器的正常運作足矣,還可以面向全球招生,每個虛擬人教師都精通上百種語言。
單身男女也不再為找不到對象而煩憂,因為在虛擬世界裡可以自己做,還可以調配個性,沒有孩子?在元宇宙可以做十個,沒有兄弟姐妹?在元宇宙可以克隆(Cloning),甚至已過世的親人都有機會復活再生。
後語
對於 AI 的威脅,馬雲曾安慰無需焦慮:只聽說人類製造了 AI,卻沒聽過 AI 製造了人類。我們能做的,或許正是思考今後如何與大量虛擬人和諧共處,而人機耦合是我目前的策略,畢竟,真正的對手或許不是虛擬人,而是使用虛擬人的真實人類,而在此情況下,虛擬人就成了競爭武器。
也許未來衡量一個人的財富價值,並不是看他有多少錢,也不是看他擁有多少算力,而是有多少(虛擬)人,就像互相攻防的駭客,能掌握最多肉雞和龐大僵尸網路的人站上風,不瞞各位,我已經著手創建自己的空間和隊伍了,也許不久之後就能與大家見面呢!
(本文授權非營利轉載,請註明出處:CIO Taiwan)