你正在使用的智慧音箱,可能偷聽了你的所有對話
彭博社 / 劉琳 / 何渝婷編譯
2019-12-16 13:25

(取自pixabay)

自2014年亞馬遜發布智慧音箱Echo以來,亞馬遜Echo、谷歌Home和Apple HomePod等「智慧音箱」設備,已經銷售了數以百萬台,大科技公司正在將亞馬遜Alexa、蘋果Siri、谷歌Assistant、微軟Cortana,以及Facebook的類似服務,整合到人們生活中。諮詢公司Juniper Research估計,到2023年,全球智慧音箱年市場規模將達到110億美元,全球約有74億部語音控制設備。

科技公司表示,智慧音箱只有在用戶使用時才會錄音,但事實上,他們正在把永遠開著的麥克風引入私密空間。亞馬遜及其競爭對手表示,絕大多數語音請求,都是由電腦自動執行的,無需人工審核。然而,這些智慧型設備都在依賴成千上萬的低薪員工進行人工轉錄,用戶私密對話已經成為他們最有價值的數據集之一。所有科技公司都認為,這是改善他們產品的一種合理方式。

其實我們一直在被偷聽

Ruthy Hope Slatis簡直不敢相信她所聽到的。她曾被波士頓郊外的一家臨時機構雇用,為亞馬遜轉錄音訊文件,這是一項被亞馬遜所模糊的工作。作為每小時只拿12美元薪酬的臨時工,她和同事(正式名稱為數據助理)需要聽取隨機交談的片段,並在自己的筆電裡記下聽到的每個單詞。

亞馬遜對外只會說,這項工作對其絕密的語音辨識產品至關重要,然而,這些語音片段中卻包含著用戶親密時刻的錄音。

2014年秋天,亞馬遜推出了Echo智慧音箱,該設備帶有語音助理軟體Alexa。亞馬遜在其首個Echo廣告中,將Alexa視為人工智慧的奇跡。在該廣告中,一個幸福的家庭正在命令Alexa接收新聞更新、回答問題答案,並幫助孩子們做作業。但是,Slatis很快就開始意識到,人類在這款產品背後的影響力。

她記得當時自己在想:「天啊!這就是我正在做的事情。」亞馬遜會捕獲雲端中的每個語音指令,並依靠像她這樣的數據助理來訓練系統。一開始,Slatis認為自己所聽取的片段來自有酬勞的測試人員,這些測試人員自願用自己的語音模式來換取幾美元的獎勵。然而,她很快意識到這個想法是錯誤的。

她和她的同事正在聽取的錄音通常很激烈、很尷尬,而用戶也會在音箱面前承認自己的秘密和恐懼。隨著轉錄項目的發展以及Alexa的流行,錄音中透露的私人資訊也隨之增加。其他臨時工回憶說,自己聽過孩子分享了他們的家庭住址和電話號碼,聽到一名男子試圖訂購情趣用品,甚至聽到一名晚宴客人大聲地想知道亞馬遜當時是否正在偷聽。Slatis說:「用戶往往只是開玩笑,但其實完全不知道自己正在被偷聽。」她於2016年選擇了辭職。

科技公司們說他們正在改正

雷鋒網瞭解到,自從Slatis第一次感到毛骨悚然以來的五年中,四分之一的美國人購買了「智慧音箱」設備,例如Echo、Google Home和Apple HomePod。到目前為止,亞馬遜已經贏得了這場銷售大戰,據報導,用戶已經購買了超過1億個Alexa設備。

但是如今,這些全球最大的公司之間,正在展開一場新的戰爭,通過將麥克風內置於手機、智慧型手錶、電視、冰箱、SUV等各種物品中,把Alexa、Siri、Google Assistant和Cortana嵌入到人們的生活中。諮詢公司Juniper Research估計,到2023年,全球智慧音箱的年市場規模,將達到110億美元,語音控制設備將達到約74億個,這相當於地球上的每個人都擁有一個設備。

而現在的問題是,我們要如何處理這樣的規模呢?

按照科技公司的聲明,這些機器並沒有每時每刻都在創建音訊文件,因為智慧音箱僅在用戶使用它們時,才錄製音訊。但是,當始終在線的麥克風被引入廚房和臥室中時,它們可能會無意間捕獲到用戶不想共享的聲音。

然而,這些所謂的智慧型設備無疑需要依賴成千上萬的低薪人群,他們需要在這些聲音片段中添加註釋,以便技術公司可以升級其「電子耳朵」。至此,我們最微弱的耳語,竟成為科技公司最有價值的數據集之一。

今年早些時候,彭博社首先報導了技術產業使用人類來審查從用戶那裡收集的音訊(並且沒有向用戶披露這一事實)。這其中就包括了蘋果、亞馬遜和Facebook。相關高管和工程師表示,建立龐大的人類監聽網路會帶來問題或干擾,儘管這一直是改善其產品的明顯方法。

除此之外,雷鋒網也注意到,在過去的幾年中,蘋果在收集和分析人們的聲音方面變得更加激進,擔心Siri的理解力和速度,落後於Alexa和Google Assistant。蘋果將Siri視為語音搜尋引擎,因此它必須做好準備,以應付無休止的用戶查詢,並加大對音訊分析的依賴。

2015年,當蘋果執行長庫克(Tim Cook)宣稱,隱私是一項「基本人權」之時,蘋果的機器每周需要處理超過十億次請求。當時,用戶可以開啓一項功能,保持語音助理始終在線,這樣他們就不再需要按下按鈕來打開語音助理。蘋果在其用戶協議法律條款中表示,可能會記錄和分析語音數據以改善Siri,但沒有任何地方提到會是人類員工在監聽。一位前臨時工說:「監聽別人的語音,讓我感到非常不舒服。」

許多臨時工表示,儘管大多數Siri要求都是很普通的,但他們仍然會聽到色情化的語音,以及種族歧視或恐同性言論。

蘋果表示,只有不到0.2%的Siri請求需要進行人類分析。前任經理將臨時工的指控視為誇張。曾帶領開發團隊的Siri聯合創始人格魯伯(Tom Gruber)說:「實際上,我們要處理的很多都是噪音,並不是說機器打算錄製某些聲音,這只是某種意義上的概率問題。」

到2019年,蘋果將Siri引入其無線耳機和HomePod揚聲器等產品後,每月需要處理150億條語音命令。0.2%意味著,人類臨時工每個月需要處理3000萬條語音指令,一年下來就會是3.6億條。

Siri團隊的前首席研究科學家Mike Bastian說,隨機錄製的風險隨著用例的增加也在不斷成長。他提到了Apple Watch的「抬起喚醒」功能,該功能在檢測到佩戴者的手腕被抬起時會自動喚醒Siri。他說:「這就導致假陽性率很高。」

2016年,亞馬遜創建了Frequent Utterance Database(FUD),以幫助Alexa為常見請求添加答案。與FUD合作的前員工表示,渴望更積極挖掘數據的產品團隊與負責保護用戶資訊的安全團隊之間,存在緊張關係。2017年,亞馬遜推出了配備鏡頭的Echo Look,該產品被稱為AI造型師,可以推薦服裝搭配。知情人士說,它的開發者考慮將相機編輯程式碼,為在用戶要求Alexa講笑話時自動開機。他們的想法是錄製用戶臉部的影片,並評估用戶是否在笑。這些人說,亞馬遜最終擱置了這個想法。該公司表示,Alexa目前沒有使用臉部辨識技術。

該公司已在世界各地設立了轉錄「農場」。今年,它舉行了多次面向海外轉錄員的入門招聘活動。一位花了數十年時間為科技公司開發辨識系統的語音技術專家說,最近的招聘規模,暗示亞馬遜音訊數據分析的規模令人震驚。亞馬遜表示,它「認真對待客戶及其錄音的安全性」,並且需要全面瞭解區域性口音和口語化,才能使Alexa走向全球。

微軟在今年8月承認,它使用人類幫助審查通過語音辨識技術生成的語音數據。BMW、惠普和Humana等企業,正在將這一技術集成到自己的產品和服務中。包括阿里巴巴、搜尋巨頭百度和手機製造商小米在內的中國科技公司,每個季度都在收集數百萬個智慧音箱的語音數據。

Google搜尋向Google Assistant,提供了來自數十億種可用設備的查詢,這些設備包括Android智慧型手機和平板電腦、Nest恆溫器和Sony TV。谷歌已經雇用了海外的臨時工來轉錄片段,以提高系統的準確性。谷歌已承諾,審閱的錄音不會與任何個人資訊相關聯。但是今年夏天,一家谷歌承包商向比利時廣播公司VRT NWS,分享了1000多個用戶記錄。

這家媒體能夠根據用戶所說的話,找出錄音中的某些人是誰,這讓那些被查明的用戶感到震驚。這些記錄中的10%,是因為設備錯誤地檢測到關鍵字,並在未經用戶同意的情況下進行了錄音。

在相關新聞報導不斷出現之後,這些大型科技公司於今年調整了他們的虛擬助理項目。

谷歌暫停了人類對Assistant音訊的轉錄,蘋果開始允許用戶刪除他們的Siri歷史記錄,並選擇不共享更多內容,使共享錄音成為可選內容,並直接雇用了許多前承包商,來增強其對人類監聽的控制力。

Facebook和微軟在其隱私政策中,添加了更明確的免責聲明。

亞馬遜也引入了類似的披露方式,並開始允許Alexa用戶選擇不進行人工審核。

一些研究人員說,智慧型手機處理能力的提高,和一種稱為聯合學習的電腦建模形式,可能最終會淘汰這些監聽行為,因為這些機器將變得足夠聰明,可以在沒有臨時工幫助的情況下解決問題。

目前,由於沒有更嚴格的法律或消費者的強烈反對,隨著語音設備的激增,人類音訊審核隊伍幾乎肯定會繼續成長。

本文為雷鋒網授權刊登,原文標題為「你正在使用的智能音箱,可能偷聽了你的所有對話