讀而思
duersi
VR作為文字、圖片、視頻之后新的一種信息傳遞的載體,其關(guān)鍵屬性是連接人和人的工具,如何在連接人和人上面實(shí)現(xiàn)高效浸入式的交互是VR最核心的未來。當(dāng)下,我們應(yīng)該關(guān)注交互技術(shù)背后必然要求的全新硬件構(gòu)架和軟件語言,其巨大的發(fā)展?jié)摿εc遠(yuǎn)大的前景已經(jīng)畫下了美好的發(fā)展藍(lán)圖。
陳建文 電子科技大學(xué)媒體與視覺研究中心主任,教授/博士生導(dǎo)師, 入選中
組部千人計(jì)劃和四川省千人計(jì)劃,中國多媒體視頻領(lǐng)域國際專家。
本文發(fā)表于《中國工業(yè)評(píng)論》雜志2016年第8期
Facebook CEO扎克伯格稱虛擬現(xiàn)實(shí)(VR,Virtual Reality)為“下一代計(jì)算機(jī)平臺(tái)”,而VR這個(gè)在世界突然火熱的話題,早在1935年的《皮格馬利翁的眼鏡》這部小說中就有所提及,文中描述戴上這種眼鏡后,就能“看到”、聽到、摸到各種東西。1957年,Morton Heilig發(fā)明的Sensorama提出了VR的概念,從上世紀(jì)60年代到80年代的早期探索,從80年代末到90年代初的爆點(diǎn)和沉寂,到今天全面進(jìn)入大眾視野。2016年可以說開啟了VR潮流的第三個(gè)元年。
VR是人類夢(mèng)想的實(shí)現(xiàn),而很多富有想象力的作家則是預(yù)言家。雷布萊伯利在他1951年發(fā)表的小說《大草原》講述了一對(duì)嬰孩和一個(gè)虛擬育兒所的故事,而弗雷得里克波爾1955年的小說《地底下的隧道》則提到了一個(gè)永遠(yuǎn)重復(fù)體驗(yàn)同一天的男人,這個(gè)男人最后發(fā)現(xiàn)自己原來被困在了一個(gè)可怕的行銷虛擬體驗(yàn)中。簡單來說,虛擬現(xiàn)實(shí)技術(shù)是指利用計(jì)算機(jī)生成一種模擬環(huán)境,并通過多種專用設(shè)備使用戶“投入”到該環(huán)境中,實(shí)現(xiàn)用戶與該環(huán)境直接進(jìn)行自然交互。VR讓用戶使用人的自然技能對(duì)虛擬現(xiàn)實(shí)中的物體進(jìn)行操作,并能提供視覺、聽覺、觸覺等直觀自然的實(shí)時(shí)感知。
開啟VR潮流第三個(gè)元年
不可否認(rèn),作為第三個(gè)元年,2016年是VR快速發(fā)展的一年。VR是一項(xiàng)融合了計(jì)算機(jī)圖形學(xué)、人機(jī)接口技術(shù)、傳感技術(shù)、心理學(xué)、人機(jī)工程學(xué)及人工智能的綜合技術(shù)。它帶給人們的感受是:虛擬和現(xiàn)實(shí)之間已沒有明顯界限。通過某種方式,比如佩戴VR設(shè)備,來使用戶產(chǎn)生處于虛擬世界的感覺,包括視覺聽覺,甚至延伸到觸覺及嗅覺。VR技術(shù)可以直接將我們投入虛擬的三維空間中,與交互的環(huán)境融為一體?;蛘哒f,讓我們主觀感受到我們本體是沉浸于一個(gè)三維的虛擬空間的。例如,可以通過眼睛看到三維立體圖像,通過手和空間的物體進(jìn)行操作支配,通過在真實(shí)世界的行走實(shí)現(xiàn)在三維虛擬世界的移動(dòng)。顯然,這樣的技術(shù)具備三個(gè)主要特征:
沉浸感:用戶能夠沉浸于由高性能處理器產(chǎn)生的逼真的三維畫面中。這需要一個(gè)封閉的視野范圍,才能夠使用戶沉浸于構(gòu)建的虛擬世界中,并不會(huì)有明顯的虛擬和現(xiàn)實(shí)的差別。這也是許多VR設(shè)備都需要讓用戶佩戴一個(gè)封閉小盒子的原因。但單純滿足于沉浸感,把左右格式的3D視頻搬到眼罩上,并不屬于VR范疇。
交互性:用戶與環(huán)境之間的交流可以被視作交互。利用傳感器、眼球識(shí)別、動(dòng)作捕捉等實(shí)現(xiàn)人機(jī)交互。VR系統(tǒng)可以說就是一種高級(jí)的人機(jī)交互系統(tǒng),因此人機(jī)交互是虛擬現(xiàn)實(shí)的核心,同時(shí)也是VR技術(shù)的突破口和技術(shù)難點(diǎn)。
構(gòu)想性:用戶能構(gòu)想客觀不存在或者不可能發(fā)生的事情,通過想象與虛擬現(xiàn)實(shí)的結(jié)合來提高效率。虛擬現(xiàn)實(shí)技術(shù)給我們描繪的是一個(gè)充滿想象的第二個(gè)世界,在這個(gè)虛擬的世界中,一切都是剛剛開始,目前社會(huì)中所有的商業(yè)模式和社交行為,在虛擬的空間中都可以得到復(fù)制甚至增強(qiáng)的體驗(yàn)。
基于以上三個(gè)特點(diǎn),VR技術(shù)阻斷了人原有的視覺輸入,達(dá)到沉浸性;用虛擬構(gòu)想的影像光線占據(jù)全部視覺,實(shí)現(xiàn)與影像的交互,達(dá)到欺騙大腦的效果。實(shí)際上,VR技術(shù)的本質(zhì)是連接方式,處于不同空間位置的用戶可以通過VR,與其他用戶連接在一起,多人同時(shí)出現(xiàn)在所構(gòu)想的虛擬世界中。
實(shí)際上早在20世紀(jì)90年代,VR的概念就已經(jīng)出現(xiàn)在軍事、工業(yè)、科研、醫(yī)療等領(lǐng)域。然而由于當(dāng)時(shí)的技術(shù)條件有限,對(duì)于VR的理解還局限在平面模擬的層面,雖然有一定的促進(jìn)作用,但是整體上不能算是革命性質(zhì)的變革。
從技術(shù)發(fā)展的本質(zhì)上看,虛擬現(xiàn)實(shí)經(jīng)歷了下面幾個(gè)階段的演進(jìn):第一,桌面虛擬現(xiàn)實(shí):這個(gè)階段是以電腦仿真和顯示為基礎(chǔ)的相關(guān)應(yīng)用;第二,沉浸的虛擬現(xiàn)實(shí):包括頭顯顯示、虛擬空間的內(nèi)容消費(fèi);第三,增強(qiáng)現(xiàn)實(shí)性的虛擬現(xiàn)實(shí):頭顯和相關(guān)體感設(shè)備的使用,讓虛擬現(xiàn)實(shí)有了初步的交互體驗(yàn);第四,分布式虛擬現(xiàn)實(shí)系統(tǒng):前面的所有虛擬現(xiàn)實(shí)場(chǎng)景都是單人單用戶的虛擬場(chǎng)景,虛擬現(xiàn)實(shí)的目標(biāo)是連接人和人,因此多用戶協(xié)同共享虛擬現(xiàn)實(shí)才是虛擬現(xiàn)實(shí)的未來。
核心技術(shù)難點(diǎn)在于實(shí)現(xiàn)VR交互
人們想要進(jìn)入虛擬現(xiàn)實(shí)的VR世界,終端設(shè)備是一個(gè)重要工具。當(dāng)下,谷歌、微軟、Oculus、三星、索尼、HTC已率先占據(jù)市場(chǎng)的一席之地,在中國大陸,暴風(fēng)影音、樂相科技等也搶先推出了自己的相關(guān)設(shè)備。隨著終端設(shè)備的市場(chǎng)逐步成熟,將會(huì)呈現(xiàn)千軍萬馬過獨(dú)木橋的特點(diǎn),而最后勝出的往往是擁有強(qiáng)悍的技術(shù)和芯片能力的公司。所以,終端設(shè)備已成紅海,市場(chǎng)很快趨于飽和,終端設(shè)備的體驗(yàn)和成本問題在硬件巨頭入局的情況下會(huì)逐步得到解決。目前虛擬現(xiàn)實(shí)產(chǎn)業(yè)標(biāo)準(zhǔn)嚴(yán)重缺失,導(dǎo)致產(chǎn)業(yè)鏈發(fā)展不健全,硬件制作五花八門。不過此問題已經(jīng)引起國際各方關(guān)注,行業(yè)標(biāo)準(zhǔn)將會(huì)逐步出臺(tái)。
筆者認(rèn)為,當(dāng)下VR發(fā)展的核心技術(shù)難點(diǎn)在于實(shí)現(xiàn)VR交互??紤]到各種VR設(shè)備的推出以及VR內(nèi)容制造商的逐步統(tǒng)一,步入2016年,VR的交互性將會(huì)成為核心。VR作為新一代多媒體手段,將帶給人們更真實(shí)的視覺體驗(yàn)。不同的應(yīng)用場(chǎng)景將存在不同的應(yīng)用界面以供選擇,而且在各個(gè)場(chǎng)景中也有很多的人機(jī)交互需求。VR的多維特點(diǎn)決定了它的交互要比平面圖形交互擁有更加豐富的形式。目前市面上VR交互方式大致有以下幾種:動(dòng)作捕捉、觸覺反饋、眼球追蹤、肌電模擬、手勢(shì)跟蹤、方向追蹤、語音交互、傳感器這幾個(gè)方面,其中手勢(shì)追蹤、眼球追蹤、動(dòng)作捕捉均是目前VR主流的交互方式。
然而交互方式各有優(yōu)缺點(diǎn),在短期內(nèi)很難實(shí)現(xiàn)統(tǒng)一。首先,VR設(shè)備和手機(jī)、PC等不一樣,它還不是一個(gè)標(biāo)準(zhǔn)化的交互載體,所以交互模式很難達(dá)到標(biāo)準(zhǔn)化;其次,VR是三維世界,這必將提高交互的復(fù)雜性與多樣性。若想在三維世界實(shí)現(xiàn)沉浸感,VR交互自然應(yīng)該包含現(xiàn)實(shí)世界所有的交互方式。著眼于現(xiàn)實(shí),現(xiàn)有的VR技術(shù)主要仍依賴于手柄來進(jìn)行界面選擇和交互操作,同時(shí)運(yùn)用各種傳感器和機(jī)械器件來實(shí)現(xiàn)人體動(dòng)作的捕捉和識(shí)別以及人體運(yùn)動(dòng)的采集。然而這種交互方式很難讓人擁有最好的體驗(yàn)和最高的用戶普及使用率。
對(duì)于創(chuàng)業(yè)者來說,應(yīng)該提供差異化的服務(wù)和創(chuàng)造新的需求,以此來面對(duì)新的挑戰(zhàn)。殊途同歸,大家的目的都是能夠理解用戶并使用戶擁有更加方便的體驗(yàn)。與所有高新技術(shù)的發(fā)展趨勢(shì)一樣,解放雙手永遠(yuǎn)是人們追求的目標(biāo)。沉浸在虛擬現(xiàn)實(shí)體驗(yàn)中的用戶,現(xiàn)在主要靠手柄來實(shí)現(xiàn)VR界面選擇和交互操作,而通過手柄進(jìn)行交互操作會(huì)有很強(qiáng)的帶出感,并且長時(shí)間的手柄操作將帶來較強(qiáng)的疲勞感和束縛感。
而通過動(dòng)作捕捉來取代手柄解放雙手,將現(xiàn)實(shí)中手的動(dòng)作導(dǎo)入虛擬界面之中,用戶仿佛置身現(xiàn)實(shí)一般,通過自己的雙手選取界面,參與交互。眼球識(shí)別追蹤則可以獲知人眼的真實(shí)注視點(diǎn),使得用戶獲得更加真實(shí)的視覺體驗(yàn),另外通過眼球運(yùn)動(dòng)調(diào)整視界,選取功能將會(huì)更加便捷。這種基于視頻圖像處理的動(dòng)作捕捉和眼球追蹤則能很好地提高用戶的參與度和沉浸感,甚至未來可以通過腦電波識(shí)別來統(tǒng)一用戶的意識(shí)和VR交互操作,以便獲得更具沉浸性的交互體驗(yàn)。VR交互手段將不斷向著更現(xiàn)實(shí)化更簡潔的操作模式邁進(jìn),人的機(jī)體將更多地參與交互,浸入感將不斷增強(qiáng)。
關(guān)注全新的硬件構(gòu)架和軟件語言
縱觀當(dāng)下VR市場(chǎng),硬件部分格局顯現(xiàn),內(nèi)容部分即將爆發(fā)。將VR運(yùn)用到各個(gè)領(lǐng)域中,即“VR+行業(yè)”模式潛力巨大。游戲、開發(fā)者服務(wù)、周邊產(chǎn)業(yè)、影視、直播、房產(chǎn)、社交,醫(yī)療、教育等領(lǐng)域?qū)⑹呛芎玫那腥朦c(diǎn)。高盛的分析中指出:“VR可應(yīng)用的幾個(gè)領(lǐng)域,從視頻游戲到零售。其中視頻游戲占比最大,但從醫(yī)療到房地產(chǎn)的各行各業(yè)都可能受到?jīng)_擊。”伴隨著VR頭顯以及游戲內(nèi)容分發(fā)平臺(tái)等的成熟,標(biāo)志著VR整體技術(shù)進(jìn)入了成熟期,并且用戶社交習(xí)慣已經(jīng)養(yǎng)成,對(duì)內(nèi)容的需求會(huì)更加旺盛,將推動(dòng)電影、短視頻、直播、房產(chǎn)、教育等品類逐漸成熟。
鑒于終端移動(dòng)化和網(wǎng)絡(luò)速度的提升,互聯(lián)網(wǎng)未來的數(shù)據(jù)80%都會(huì)集中在視頻上,它是整合了文字、圖片、音頻的綜合信息形式。所以,視頻VR,也就是虛擬現(xiàn)實(shí)視頻,將會(huì)改變整個(gè)產(chǎn)業(yè)。視頻技術(shù)將是VR行業(yè)的核心基礎(chǔ)技術(shù)。目前行業(yè)中存在浮躁的現(xiàn)象,我們不能草率地認(rèn)為內(nèi)容是VR的核心競(jìng)爭力。因?yàn)閺男袠I(yè)來看,內(nèi)容畢竟屬于少數(shù)具有內(nèi)容創(chuàng)造能力的團(tuán)體所具有的能力,潛力有限。我們對(duì)VR的看法是,VR作為文字、圖片、視頻之后新的一種信息傳遞的載體,其關(guān)鍵屬性是連接人和人的工具。如何在連接人和人上面實(shí)現(xiàn)高效浸入式的交互是VR最核心的未來??梢灶A(yù)計(jì),當(dāng)VR連接了醫(yī)生和病人,這個(gè)在線醫(yī)療的體驗(yàn)將會(huì)超越目前所有的互聯(lián)網(wǎng)醫(yī)療產(chǎn)品;當(dāng)VR連接了老師和學(xué)生,再偏遠(yuǎn)的山區(qū)的孩子也可以跟最優(yōu)秀的教師一起上課,在線教育的愿景會(huì)再次被改寫。
基于以上的市場(chǎng)分析,我們認(rèn)為,提升終端計(jì)算力并不是目前科技發(fā)展的主流趨勢(shì),大家更希望借助于速度越來越快的網(wǎng)絡(luò),將主要計(jì)算放在云端進(jìn)行,而直接向終端下發(fā)計(jì)算結(jié)果。與此同時(shí),減小計(jì)算量、應(yīng)用更有效的視頻處理及壓縮算法也是同樣的道理。我們可以以視頻視覺技術(shù)為切入口,以云計(jì)算和高并發(fā)的處理平臺(tái)為依托,以視頻分析、視頻感知技術(shù)為交互方式入局VR。VR背后的技術(shù),代表的是在網(wǎng)絡(luò)中直接向人類或者機(jī)器人提供感官輸入,這個(gè)感官輸入需要更高數(shù)量級(jí)的計(jì)算能力、更高數(shù)量級(jí)的數(shù)據(jù)傳輸能力,自然也會(huì)要求全新的硬件構(gòu)架和軟件語言。
目前,電子科大成立的MediaLab就是專注于VR交互的研究和演進(jìn),提供在虛擬環(huán)境中人和人連接的最高效交互方式,其形態(tài)包括了視頻交互、全景交互、VR交互等擁有極大潛力的交互方式。同時(shí),作為VR的基礎(chǔ)核心技術(shù),視頻技術(shù)的研究不容忽視。例如視頻壓縮、視頻處理、視頻無線網(wǎng)絡(luò)自適應(yīng)編碼、視頻存儲(chǔ)優(yōu)化等方面的技術(shù)仍可繼續(xù)深入優(yōu)化。目前VR的終端產(chǎn)品一般需要插入手機(jī)、PC或者用手柄操作,筆者認(rèn)為這只是階段性的。未來的VR眼鏡應(yīng)該是一體式的,直接和云端的內(nèi)容、應(yīng)用和計(jì)算能力相連。所以,交互云平臺(tái)的搭建也是一個(gè)重要環(huán)節(jié)。比如,實(shí)現(xiàn)云平臺(tái)動(dòng)態(tài)負(fù)載均衡、服務(wù)器端多碼率轉(zhuǎn)碼,提供移動(dòng)端流暢度,實(shí)現(xiàn)錄播云存儲(chǔ),提供實(shí)時(shí)錄播發(fā)布等,這些都是云平臺(tái)的搭建指標(biāo),可以作為我們攻克的方向,同時(shí)也是入局VR的機(jī)會(huì)。
虛擬現(xiàn)實(shí)是一場(chǎng)交互方式的新革命,人們正在實(shí)現(xiàn)由界面到空間的交互方式變遷。在基礎(chǔ)設(shè)備端,與智能手機(jī)和平板電腦的采納過程相比,我們必須承認(rèn)VR在一兩年內(nèi)難以走向大眾,但我們堅(jiān)信它會(huì)在5年內(nèi)像當(dāng)年的智能手機(jī)一樣實(shí)現(xiàn)井噴。分析師指出:“隨著科技進(jìn)步、零售價(jià)下降以及出現(xiàn)全新的企業(yè)和個(gè)人應(yīng)用市場(chǎng),我們相信VR有望孵化成為數(shù)十億美元的產(chǎn)業(yè),并可能和PC一樣具有劃時(shí)代的意義。”所以在當(dāng)下,我們應(yīng)該關(guān)注交互技術(shù)背后必然要求的全新硬件構(gòu)架和軟件語言,其巨大的發(fā)展?jié)摿εc遠(yuǎn)大的前景已經(jīng)畫下了美好的發(fā)展藍(lán)圖,讓我們拭目以待。
(來源:中國工業(yè)評(píng)論)