本書摘編自《炒作機器》,作者:[美]錫南·阿拉爾著,36氪經授權發布。
在數字社交網絡、機器智能和智能手機這三個領域里的設計和開發共同決定了炒作機器將如何構建我們這個世界。
(相關資料圖)
在很大程度上,數字社交網絡構建了當今社會的信息流;通過好友推薦和在饋送算法引導下的網絡信息流動,機器智能引領了當今數字社交網絡的演化;而智能手機為炒作機器的運作創造了一個“永遠在線”的環境。
從我們的行為與表達的觀點中,智能手機和數字社交網絡每時每刻都在搜集各種數據,然后將這些數據輸入機器智能中,機器智能構建了我們獲取信息的渠道,限制了我們可以接觸的觀點和信念。數字社交網絡、機器智能和智能手機的三位一體已經改變了我們生產與消費信息的方式,改變了我們的日常行為以及獲取信息的方式,也改變了炒作機器對我們產生影響的方式。
要想真正理解這樣一臺信息處理機器,我們必須首先了解它的三個基本組成部分:底層、處理層以及媒介層。
底層指的是數字社交網絡,這個網絡構建起了我們進行互動的方式;處理層又被稱作“炒作環路”,它通過機器智能和人類智能的互動來控制信息在底層的流動;最后是媒介層,也就是智能手機(至少目前是智能手機),它是主要的輸入與輸出設備,大多數人都是通過智能手機向炒作機器提供或接收有關信息的。任何我們可以用來進行解釋的理論或分析,比如,為什么虛假新聞在網上傳播的速度會比真相更快,或者為什么炒作機器以其目前的形式會破壞“群體智慧”,都需要我們對這三個組成部分有基本的了解(見圖 3.3)。
這里所謂的“底層”實際上是網絡本身,而底層就是炒作機器的核心。這種網絡是一種不斷演化的、數量達到了人口規模的各種鏈接的集合,它通過臉書、推特、領英以及其他社交網站把我們連接在一起。底層塑造了炒作機器當下的形態,并且在很大程度上構建了能夠決定“誰能知道什么,以及在什么時候知道”的基礎架構。與炒作機器連接的網絡結構決定了信息流動的方式,所以只要了解了這些結構以及它們是如何演化的,那么無論是面對政治兩極分化的興起、社會運動發展的勢頭,還是面對虛假新聞的傳播或定位廣告的成功,我們都可以從中獲得關于這個社會運作方式的洞見。
具體規范網絡的演化并管理信息在網絡上的流動的“處理層”就是我所說的炒作環路。
正是機器智能和人類智能的循環互動決定了我們會關注什么,以及信息和知識如何在世界各地傳播。推動人和機器互動的是機器智能的興起,以及我們已經擁有的在人口規模上搜集有關人類思想、行為和觀點的數據的能力。機器智能吸收了我們的思想、行為和觀點,反過來又策劃了我們在信息流中看到的那些故事、在Instagram上看到的圖片、在領英上被推薦的同事和在Tinder上被推薦的約會對象,以及我們在這些內容旁看到的廣告。隨后,我們就會消費這些信息并在這些信息的基礎上進行決策。我們會點擊一些被推送給我們的鏈接和圖片,然后放棄其他的鏈接和圖片;我們會對一些帖子進行評論或點贊,但同時會完全無視其他帖子和內容;我們甚至會在投票站和大型購物中心依照我們在網上看到的內容改變我們的線下行為。
炒作機器會在一旁觀察我們的決策過程,了解我們喜歡什么,我們會喜歡誰,以及我們是如何進行思考的。這樣,等到下一次在同樣的場合,它在調整后給出的建議就會更符合我們的心意。這種人類和機器循環互動的過程,也就是被我稱作炒作環路的處理層。在它左右我們決策的同時,我們實際上也對它產生了影響。但是這種循環互動的結果是非常真實的,你會決定買下它推薦的產品、投票給網上曾經提到過的那個人,你還會跟隨其他人出現在市內的廣場上進行抗議。當然,有時候事情還會像發生在巴格達的塔利爾廣場上的那些事情一樣具有戲劇性的效果。
媒介層指的是我們與炒作機器進行互動時使用的輸入與輸出設備。今天,媒介層主要指的是智能手機,但明天,它或許會是AR或者VR頭盔、數字隱形眼鏡、虛擬人、室內音響設備或上述這些設備的某種組合。無論實際采用的是什么設備,媒介層都是極其重要的一環,因為它決定了炒作機器會在什么樣的背景下了解我們,并隨后影響我們。
我們在網上會和誰建立聯系,這在很大程度上是由一系列的好友推薦算法推動的,這種算法幾乎在炒作機器的所有平臺上都可以找到,無論是臉書的好友推薦算法,還是領英的PYMK算法以及其他各種各樣的算法,所有算法都會向我們建議應該和誰約會、和誰做生意或者和誰交往。
拉爾斯·巴克斯托姆在成為臉書的工程副總裁之前,具體負責臉書的PYMK算法。正如他在2010年指出的那樣,“在臉書上,大多數互加好友的行為”都是由臉書的好友推薦算法推動的。盡管PYMK算法是領英公司在2006年發明的,但現在,在炒作機器上把陌生人相互聯系在一起的機器智能幾乎無所不在。
雖然這些算法的細節屬于技術專利,但毫無疑問的是,我們都知道它們會利用我們的朋友和他們的朋友的信息,以及關于我們在哪里工作、去哪里上學等這樣一些信息來向我們推薦新的聯系人。還有一種普遍的看法認為,炒作機器會利用不在其平臺上的人的電子郵件和電話號碼來增強它們對真實的、潛在的人類社交網絡的理解。
2014年,臉書申請了一項專利,這項新的技術可以通過嗅探網絡數據包來推斷兩部手機是否在同一時間出現在了同一地點,然后再以此為依據來進行好友推薦。這項專利還描述了臉書如何通過比較手機的加速度計和陀螺儀的數據來推斷兩個人正面對面行走,還是正朝同方向一起行走。2015年,臉書又申請了一項專利,新的專利可以通過用戶拍攝照片的相機鏡頭上的灰塵顆粒,推斷出兩個人上傳的照片是否出自同一臺相機。我們知道,PYMK算法中的“鏈接預測算法”需要整個系統向其提供大量的數據,而數據的采集過程對隱私造成的影響很可能是一件非常麻煩的事情,但是在炒作機器的內部,這一部分機器智能產生的更加系統化的結果或許會帶來更加廣泛的影響,那就是PYMK算法會更傾向于促成“三元閉包”。
炒作機器的智能程序不僅僅通過推薦好友來塑造社交圖譜,還通過推薦我們消費的內容,即通過推薦新聞、圖片、視頻、故事以及廣告來塑造我們的思維方式。毫不夸張地說,饋送算法在很大程度上決定了我們可以知道什么以及在什么時候知道。理解這些算法的設計可以幫助我們理解它們可能帶來的后果。盡管不同的平臺有不同的饋送算法,但所有的饋送算法在設計上都非常相似(雖然有些平臺,比如推特,現在依然允許我們選擇不參與算法的內容管理)。
當內容的供應超過了我們消費內容所需的認知能力時,主動推送的需求就自然而然地出現了。剛開始的時候,炒作機器用倒序的方式來顯示內容就足夠了,但是隨著社交媒體上內容的數量逐漸超過了我們認知的容量,炒作機器不得不開始為我們安排這些內容的優先級。雖然這樣的優先排序可以幫助我們發現與我們最密切相關的東西,但與此同時,這使得炒作機器有了巨大的權力來決定我們可以看到哪些信息。
信息流算法會根據內容的相關性對其進行排序。首先,對于每一篇內容,信息流算法都會給出一個對每個人來說都獨一無二的“相關性評分”。隨后,在推送給我們的新聞中,這些內容會被按照相關性評分依次遞減的順序進行排列。這個相關性評分是由一些預測模型給出的,而這些模型會去了解是什么驅使著我們與某一段內容進行互動。
在這里,互動是通過我們在處理這些內容的過程中表現出來的數十種行為來定義的。例如,我們可以點贊、點擊、分享、花時間仔細閱讀或觀看、針對具體的內容撰寫簡短的評論等。預測模型會基于是誰上傳了相關的內容、內容涉及了哪些領域或行業、其中是否包含了圖片或視頻、視頻中有什么樣的內容、是否是最新的內容,以及我們有多少朋友曾經點贊或分享了這些內容等,來預測我們是否也會參與這些內容互動。在根據數十種不同的參與度衡量標準得出了我們會參與互動的概率后,所有這些參與互動的概率都會被匯總成唯一的相關性評分。一旦每一篇內容都有了一個相關性評分(每一次當你打開信息流服務時,臉書的算法就會針對2000篇不同的內容為你計算出所有的相關性評分),它們就會被按照相關性評分逐次降低的順序進行排列并顯示在你的信息流服務中。
臉書在2006年推出信息流服務的時候,其主要目的還是向用戶提供朋友的資料、照片以及狀態的更新信息。在2009年點贊按鈕被發明出來之前,信息流是根據有關內容發布的時間以及我們有多少個朋友曾經提到過某個帖子等因素來進行排序的。當然,這項服務的推出(站在臉書的角度)從根本上還是為了最大限度地提高用戶的留存率和他們在網站上滯留的時間。點贊按鈕的推出把信息流中的每一條新聞的價值和某種衡量“流行度”的標準捆綁在了一起,從而使優化的重點轉向了那些具有更高的流行度的項目。
點贊按鈕成了某種衡量流行度的公共標準,這一事實意味著出版商和普通的用戶可以通過調整自己的內容來獲取更多的點贊,而這又可以讓內容贏得更高的“收視率”。很多顧問公司聲稱自己可以“玩弄”算法,比如通過提高帖子的流行度使帖子在網上火起來,而現在這已經成了司空見慣的事。
但是,如果你認為信息流只考慮了點贊、評論和分享這些因素,那就過于簡單了。臉書的工程師們很早就意識到,這些衡量指標并沒有完全捕捉到人們想要從信息流中得到的東西,因此,他們決定通過直接提問來衡量用戶的滿意度。剛開始的時候,整個項目還只是一個針對1000個客戶的小型“焦點小組”,項目人員的辦公室位于田納西州的諾克斯維爾,而諾克斯維爾只不過是一個試點項目隨意選取的“具有某些歷史意義”的地址而已。但這個項目很快就成長為一個全球性的“信息推送質量論壇”,這已經相當于一個針對臉書的信息流服務而設立的“尼爾森評級小組”了。
具體來講,世界各地的用戶可以就他們的信息流的內容和質量,有償地參與評估并回答一系列的問題。通過將定量和定性的指標結合起來,臉書了解到,那些用戶花了很多時間去閱讀但并沒有點贊的帖子對他們來講依然是有價值的。比較典型的是,用戶在看到關于他們自己朋友和家人的悲慘消息時,他們當然不會點贊(為了應對這一類情形,有關憤怒、悲傷和驚訝的反應后來也被添加了進來)。在上述實驗中,臉書還設置了一個控制組,用戶在這個組中是無法看到任何新的設計變更的,這樣他們就能夠具體評估哪些做法是有用的,而哪些做法根本沒有效果。
當炒作機器通過感知并向人類推薦好友和內容的方式來架構我們人類的現實時,我們會通過消費炒作機器給出的建議,并按照這些建議采取行動的方式使整個過程都受到人類的主觀能動性的影響。在炒作環路中,與人類能動性有關的“消費和行動”環路是我們將建議轉變為行動,并將由此而產生的行為、反應以及觀點反饋給炒作機器的過程。
書名:《炒作機器:社交時代的群體盲區》作者:[美]錫南·阿拉爾(Sinan Aral),出版社:中信出版集團
[美]錫南·阿拉爾
l數據科學家,麻省理工學院社會分析實驗室負責人。他在社交網絡與傳播領域探索了20多年,專注于研究資訊如何透過社交媒體擴散,影響市場與消費者行為。
l企業家、投資人。他曾聯合創辦風險投資基金Manifest Capital,并與臉書、推特、微軟等企業密切合作。
l他還是英國艾倫·圖靈數據科學研究所、英國國家數據科學研究所顧問委員會的成員。