如果你的電腦因為注意到你沒有坐在辦公桌前而決定不響起通知鈴聲,會怎么樣?如果你的電視看到你離開沙發去開門,并自動暫停 Netflix,然后在你坐下來的時候繼續播放,會怎么樣?如果我們的電腦能從我們的動作中獲得更多的社交線索,并學會成為更體貼的伙伴,會怎么樣?
這聽起來很有未來感,當然,或許還有點侵入性——一臺電腦在監視你的一舉一動?但是,如果你知道這些技術不必依靠攝像頭來觀察你的位置和行為,就不會覺得那么恐怖了。作為替代,它們使用了雷達。谷歌的先進技術和產品部門—也就是我們常說的 ATAP,該部門是諸如 觸控式牛仔夾克 等古怪項目的幕后推手——在過去一年里,他們一直在探索計算機如何 利用雷達 來了解我們的需求或意圖,并作出適當的反應。
這并不是第一次了,谷歌使用雷達為其小設備提供空間感知能力。2015 年,谷歌 發布了 Soli,這是一個可以使用雷達電磁波的傳感器,可以精確地捕捉到手勢和動作。它首次出現在谷歌 Pixel 4 中,可以檢測簡單的手勢,使用戶不需要實際觸摸智能手機就可以休眠鬧鐘或暫停音樂。最近,第二代 Nest Hub 智能顯示器 也嵌入了雷達傳感器,可以檢測睡在它旁邊的人的動作和呼吸模式。這樣,該設備就能夠跟蹤該人的睡眠,而且不需要他們戴上智能手表。
同樣的 Soli 傳感器也被用在了新一輪的研究中,但是,ATAP 不是使用傳感器輸入直接控制計算機,而是使用傳感器數據使計算機能夠識別我們的日常動作并做出新的選擇。
ATAP 設計主管 Leonardo Giusti 說,“我們相信,隨著技術越來越多地進入我們的生活,要求技術從我們這里獲得更多的線索,是公正的”。就像你媽媽可能會在你出門前提醒你拿好雨傘一樣,也許恒溫器可以在你走過時傳達同樣的信息,或者是電視機檢測到你在沙發上睡著了時降低音量。
人類進入計算機的個人空間(圖片由谷歌提供)
Giusti 說,許多研究都是基于 空間關系學,即研究人們如何利用他們周圍的空間來促成社會互動。當你離一個人越近,就越期望增加參與度和親密感。ATAP 團隊利用這一點和其他社會線索證實,人和設備都有自己的個人空間概念。
雷達可以探測到你向電腦靠近并進入其個人空間。這可能意味著電腦可以選擇執行某些動作,如啟動屏幕,這個過程不需要你按下按鈕。目前,谷歌 Nest 智能顯示器 已經具備了這種互動能力,不過谷歌用的不是雷達,而是 超聲波 來測量人與設備的距離。當 Nest Hub 檢測到你正在靠近時,它會高亮顯示當前的提醒事項、日歷活動或其他重要通知。
僅僅靠近還不夠。如果你最終看著不同的方向,從機器旁邊走了過去,怎么辦?為了解決這個問題,Soli 會捕捉到動作和手勢中的更多細節,如身體的方向,你可能走哪條路以及頭的朝向——并在機器學習算法的幫助下,進一步完善這些數據。雷達獲取的這些豐富的信息有助于它更好地預測你是否真的要開始與設備互動,以及可能的互動類型。
這種感知改進來自于該團隊在自己的起居室內執行一系列精心設計的任務(他們在大流行期間呆在家里),并使用了頭戴攝像機(跟蹤自己的行動)和實時雷達感應。
ATAP 高級交互設計師 Lauren Bedal 說,“我們以不同的方式移動,變換不同的動作,然后——鑒于我們當時使用的是一個實時系統——我們即興發揮,在某種程度上,是基于實時發現完成的”。
Bedal 有舞蹈背景。她說,這個過程非常類似于編舞者選取一個基本的動作理念(即運動主題),并探索其變化,如舞者如何移動他們的重心,或改變身體的位置和方向。基于這些研究,團隊正式確定了一套動作,而靈感都來自于非語言交流和與設備的自然互動:靠近或離開,經過,朝向或背向,以及掃視。
Bedal 舉了幾個計算機對這些動作做出反應的例子。如果設備感知到你在靠近,它可以調出觸摸控制;走近設備,它會加亮顯示收到的電子郵件;離開房間,電視記錄你離開時的進度,并在你回來時從那個位置繼續播放。如果設備確定你只是路過,它就不會用低優先級的通知來打擾你。如果你在廚房里照著視頻烹飪,那么設備可以在你走開去拿材料時暫停,在你回來時恢復播放,并表達繼續進行的意圖。如果你在打電話時瞥了一眼智能顯示器,那么該設備可以提供轉到視頻通話的選項,這樣你就可以放下手機了。
“從所有這些動作中,我們可以窺見未來與計算機交互的一種方式,利用我們的自然動作,感覺非常隱蔽,其理念是,計算機有點退居幕后,只在適當的時候幫助我們,”Bedal 說。“我們真正地推動了人們所認為的人機互動的可能性界限。”
利用雷達來影響計算機對我們的反應是有一些挑戰的。例如,雖然雷達可以探測到房間里的多個人,但如果被測者靠得太近,傳感器就會把一群人看成是形狀不固定的一團,這就導致了決策混亂。還有很多工作要做,這就是為什么 Bedal(多次)強調,這項工作在很大程度上尚處于研究階段——所以現在還不要指望它出現在下一代智能顯示器中。
ATAP 的雷達技術不使用攝像頭就可以感知你在往哪看(圖片由谷歌提供)
有充分的理由認為,雷達也可以幫助學習你日常的生活模式。ATAP 的 Giusti 說,這是他們研究路線圖上的一個領域,或許可以提供與個人目標相關的健康習慣建議。我想象我的智能顯示器在發現我半夜要去吃零食的時候,變出一個巨大的停止標志。
在執行它認為你想要的一系列動作時,這些設備也需要尋求一種平衡。例如,如果我在廚房做飯時想讓電視開著怎么辦?雷達會檢測到沒人在看電視,并把電視暫停,而不是讓它開著。“當我們開始研究這些感覺非常隱蔽、流暢無卡頓的交互模式時,就需要在用戶控制和自動化之間進行適當的平衡了,”Bedal 說。“這似乎不是很麻煩,但我們應該考慮用戶可能想要的控制或配置的數量。”
ATAP 團隊選擇使用雷達,因為這種方法在收集豐富的空間數據時可以更好的保護隱私。(它的延遲非常低,可以在黑暗中工作,而且聲音或溫度等外部因素對它沒影響)。與攝像頭不同,雷達不會捕捉和存儲可辨別的身體、面部或其他身份標識圖像。“它更像是一個先進的運動傳感器,”Giusti 說。Soli 探測范圍約為 9 英尺——比大多數攝像頭要小——但如果家里有多個帶有 Soli 傳感器的小設備,就可以有效地覆蓋你的空間,并創建一個有效的網狀網絡來追蹤你在家中的行蹤。(值得注意的是,目前,谷歌 Nest Hub 中的 Soli 傳感器數據是在本地處理的,原始數據從未被發送到云端)。
一個內部裝有 ATAP 新技術的設備可以感應到你的靠近,然后推測你可能想做的事情并改變其狀態。(圖片由谷歌提供)
卡內基梅隆大學人機交互研究員、未來界面小組 負責人 Chris Harrison 說,消費者將不得不在個人隱私方面做出權衡——畢竟,谷歌是 "將數據貨幣化的世界領導者"——但他仍然認為谷歌的無攝像頭方法在很大程度遵循了用戶至上和隱私至上的原則。“不存在是否侵犯隱私的問題,”Harrison 說。“一切都在波譜上。”
設備必然會配備像 Soli 這樣的傳感器來收集更多的數據,以便更好地理解我們。最終,Harrison 期望看到,ATAP 基于各種技術設想所進行的人機互動改善。
Harrison 說:“人類能真正地理解人類的行為,而計算機在理解時,確實會額外導致些令人沮喪的 [情況] 。把社會科學家和行為科學家帶入計算機領域,可以使得這類體驗更加令人愉快,更具人文關懷。”
本文最初發布于 WIRED 博客,由 InfoQ 中文站翻譯并分享。