你的隱私正在被矽谷竊聽

鉛筆道 發佈 2019-12-15T04:29:44+00:00

據報導,用戶已經購買了超過1億個Alexa設備。但是如今,這些全球最大的公司之間正在展開一場新的戰爭,通過將麥克風內置於手機、智能手錶、電視、冰箱、SUV等各種物品中,把Alexa、Siri、Google Assistant和Cortana嵌入到人們的生活中。

據報導,用戶已經購買了超過1億個Alexa設備。但是如今,這些全球最大的公司之間正在展開一場新的戰爭,通過將麥克風內置於手機、智能手錶、電視、冰箱、SUV等各種物品中,把Alexa、Siri、Google Assistant和Cortana嵌入到人們的生活中。

這些機器並沒有每時每刻創建音頻文件,因為智能音箱僅在用戶激活它們時才錄製音頻。但是,當始終在線的麥克風被引入廚房和臥室中時,它們可能會無意間捕獲到用戶不想共享的聲音。隱私的不斷侵蝕正在不斷發展。人們不知道如何保護自己。

來源:獵雲網

Ruthy Hope Slatis簡直不敢相信她所聽到的。她曾被波士頓郊外的一家臨時機構雇用,為亞馬遜轉錄音頻文件,這是一項被亞馬遜所模糊的工作。作為每小時只拿12美元薪酬的合同工,她和同事(正式名稱為數據助理)需要聽取隨機交談的片段,並在自己的筆記本電腦里記下聽到的每個單詞。亞馬遜對外只會說這項工作對其絕密的語音識別產品至關重要,然而,這些語音片段中卻包含著用戶親密時刻的錄音。

2014年秋天,亞馬遜推出了Echo智能音箱,該設備帶有語音激活虛擬助手軟體Alexa。亞馬遜在其首個Echo廣告中將Alexa視為人工智慧的奇蹟。在該廣告中,一個幸福的家庭正在命令Alexa接收新聞更新、回答問題答案,並幫助孩子們做作業。但是,Slatis很快就開始意識到人類在這款產品背後的影響力。她記得當時自己在想:「天哪,這就是我正在做的事情。」亞馬遜會捕獲雲中的每個語音命令,並依靠像她這樣的數據助理來訓練系統。一開始,Slatis認為自己所聽取的片段來自有酬勞的測試人員,這些測試人員自願用自己的語音模式來換取幾美元的獎勵。然而,她很快意識到這個想法是錯誤的。

她和她的同事正在聽取的錄音通常很激烈、很尷尬,而用戶也會在音箱面前承認自己的秘密和恐懼。隨著轉錄項目的發展以及Alexa的流行,錄音中透露的私人信息也隨之增加。其他合同工回憶說,自己聽過孩子分享了他們的家庭住址和電話號碼,聽到一名男子試圖訂購性玩具,甚至聽到一名晚宴客人大聲地想知道亞馬遜當時是否正在偷聽。Slatis說:「用戶往往只是開玩笑,但其實完全不知道自己正在被偷聽。」她於2016年選擇了辭職。

自從Slatis第一次感到毛骨悚然以來的五年中,四分之一的美國人購買了「智能音箱」設備,例如Echo、Google Home和Apple HomePod。到目前為止,亞馬遜已經贏得了這場銷售大戰,據報導,用戶已經購買了超過1億個Alexa設備。但是如今,這些全球最大的公司之間正在展開一場新的戰爭,通過將麥克風內置於手機、智能手錶、電視、冰箱、SUV等各種物品中,把Alexa、Siri、Google Assistant和Cortana嵌入到人們的生活中。諮詢公司Juniper Research估計,到2023年,全球智能音箱的年市場規模將達到110億美元,語音控制設備將達到約74億個,這相當於地球上的每個人都擁有一個設備。

而現在的問題是,我們要如何處理這樣的規模呢?按照科技公司的聲明,這些機器並沒有每時每刻創建音頻文件,因為智能音箱僅在用戶激活它們時才錄製音頻。但是,當始終在線的麥克風被引入廚房和臥室中時,它們可能會無意間捕獲到用戶不想共享的聲音。「麥克風始終在線是一件令人憂心的事情。我們發現這些設備的用戶往往會很相信公司不會對其記錄的數據做任何壞事,」密西根大學教授Florian Schaub說道,他主要研究語音命令軟體背後的人類行為。「隱私的不斷侵蝕正在不斷發展。人們不知道如何保護自己。」

亞馬遜拒絕了對此事的採訪請求。一位女發言人在一封電子郵件聲明中寫道:「隱私是每個團隊和員工設計與開發Alexa功能和Echo設備的基礎。作為我們安全培訓的一部分,所有Alexa員工都接受了客戶數據處理方面的培訓。」該公司及其競爭對手皆表示,計算機無需人工審核即可執行絕大多數語音請求。

然而,這些所謂的智能設備無疑需要依賴成千上萬的低薪人群,他們需要在這些聲音片段中添加注釋,以便技術公司可以升級其「電子耳朵」。至此,我們最微弱的耳語竟成為科技公司最有價值的數據集之一。今年早些時候,彭博社首先報導了技術行業使用人類來審查從用戶那裡收集的音頻(並且沒有向用戶披露這一事實)。這其中就包括了蘋果、亞馬遜和Facebook。相關高管和工程師表示,建立龐大的人類監聽網絡會帶來問題或干擾,儘管這一直是改善其產品的明顯方法。

包括Slatis在內的眾多合同工都清楚地表示,普及音頻監視的弊端對於那些財務風險要小得多的公司來說是顯而易見的。「從來沒有感覺到這樣做是正確的,」一位為Alexa競品工作的轉錄員說道。他與大多數合同工一樣,簽署了保密協議並以匿名為由發言,以免遭到報復。「他們真正在向客戶銷售什麼?」

程式設計師們認為,語音命令將成為未來半個多世紀的計算技術,但是在大部分時間裡,用於識別和響應口語句子的教學機器需要將音頻文件逐字匹配到轉錄的文本,這是一個緩慢而昂貴的過程。早期的先驅者購買或建立了龐大的錄音庫,讓人們將報紙或其他預寫的材料轉換成語音。這些項目的徒勞本質最終成為一個行業笑話。蘋果語音團隊的一位前產品經理回憶道,在90年代,蘋果為願意在他們的實驗室錄製語音模式的每個志願者提供了一件T恤,上面印有「I Helped Apple Wreck a Nice Beach」(這是經典的語音識別例句)。

蘋果後來成為第一家推出語音模式的大型公司,當時它在iPhone 4S中嵌入了Siri。顯然至此,蘋果不再需要在實驗室編寫腳本和累計錄音了。該公司在幾天之內售出了超過400萬部4S,並很快開始獲得無數的免費自然語音數據。在最初的幾年中,該公司在很大程度上依靠外部語音軟體專家使用這些數據來提高Siri的功能,但蘋果在2014年左右取回了控制權。「這樣的工作非常繁瑣:在經過15或30分鐘的聆聽後,你唯一會得到的是頭痛,」Siri前高級語音科學家Tao Ma談到轉錄用戶錄音時說道。這一內部團隊將大部分工作分發給歐洲的IT承包商,包括總部位於愛爾蘭的GlobeTech。

在過去的幾年中,蘋果在收集和分析人們的聲音方面變得更加激進,擔心Siri的理解力和速度落後於Alexa和Google Assistant。蘋果將Siri視為語音搜尋引擎,因此它必須做好準備以應付無休止的用戶查詢,並加大對音頻分析的依賴。

前承包商將這一系統描述為聖經中的巴別塔。在愛爾蘭科克機場附近的Globetech辦公室里,無數的合同工戴著耳機靜靜地坐在MacBook前,每天要轉錄1300個剪輯片段,每個剪輯可以是一個句子,也可以是整個對話。當合同工點擊播放時,計算機在一個文本框中填充了Siri認為「聽到」的字詞,然後提示員工批准或更正翻譯,然後重複繼續。GlobeTech沒有回應置評請求。

員工們使用的一個名為CrowdCollect的程序,包括用於由於各種原因而跳過錄音的按鈕,但他們也表示,沒有特定的機制來報告或刪除令人反感或不適當地的音頻。而當詢問經理是否可以跳過過於私人的片段時,他們被告知沒有剪輯片段會太過於私人,他們必須轉錄聽到的所有內容。由於合同工的工作通常只維持幾個月,所以有關隱私問題的培訓會很少。

2015年,當蘋果執行長蒂姆·庫克宣稱隱私是一項「基本人權」之時,蘋果的機器每周需要處理超過十億次請求。當時,用戶可以開啟一項功能,保持語音助手始終在線,這樣他們就不再需要按下按鈕來激活語音助手。蘋果在其用戶協議法律條款中表示,可能會記錄和分析語音數據以改善Siri,但沒有任何地方提到會是人類員工在監聽。一位前合同工說:「監聽別人的語音,讓我感到非常不舒服。」

蘋果Siri部門的十位前蘋果高管表示,他們沒有而且仍然不會將此系統視為侵犯隱私權的行為。這些前高管說,錄音不會與蘋果用戶ID相關聯,而且他們認為用戶理解公司正在處理他們的音頻剪輯,所以即使是人類在處理音頻剪輯又有什麼關係呢?「我們並不認為這是錯誤的做法,」曾在Siri高級開發團隊工作的John Burkey說。「這不是間諜行為。這與應用崩潰並詢問是否要將報告發送給蘋果的行為是相同的。」

然而,這樣的行為是有區別的,因為MacOS會明確詢問用戶是否希望在程序崩潰後立即提交報告。這是每次出現故障時都會彈出的提示,而在Siri的情況下卻變成了默認同意。許多合同工表示,儘管大多數Siri要求都是很普通的,但他們仍然會聽到的色情化的語音,以及種族歧視或恐同性言論。

蘋果表示,只有不到0.2%的Siri請求需要進行人類分析。前任經理將合同工的指控視為誇張。曾帶領開發團隊的Siri聯合創始人Tom Gruber說:「實際上,我們要處理的很多都是噪音,並不是說機器打算錄製某些聲音,這只是某種意義上的機率問題。」

到2019年,蘋果將Siri引入其無線耳機和HomePod揚聲器等產品後,每月需要處理150億條語音命令。0.2%意味著每月,人類合同工需要處理3000萬條語音命令,一年下來就會是3.6億條。Siri團隊的前首席研究科學家Mike Bastian說,隨機錄製的風險隨著用例的增加也在不斷增長。他提到了Apple Watch的「抬起激活」功能,該功能在檢測到佩戴者的手腕被抬起時會自動激活Siri。他說:「這就導致假陽性率很高。」

在智能音箱業務中,蘋果的HomePod估計僅占美國市場的5%,亞馬遜估計有70%。2011年,傑夫·貝佐斯命令一個團隊向他展示早期的語音控制音樂應用,以將該軟體構建為硬體產品。於是,他們製作了Echo,它的七個麥克風需要不斷聽著,當出現包含「喚醒詞」的聲音時,就會觸發新的錄音。與蘋果一樣,每個語音剪輯都會進入該公司的伺服器,然後將其中的一部分路由到數百個數據助理進行審核。

貝佐斯和亞馬遜設備高級副總裁David Limp很清楚這樣的行為。早期Alexa產品經理說,他們做出了一些設計選擇,目的是防止Echo用戶對錄製感到驚訝。當用戶說「Alexa」時,Echo周圍會出現一圈光環,仿佛助手正在重生。一支專門的「個性化團隊」編寫了腳本,用於回答數百個常見問題。開發人員創建了一個在線門戶,用戶可以在其中播放和刪除他們的音頻剪輯。亞馬遜的一位發言人說,隱私標準從一開始就內置在Alexa中。

這樣的設計賦予了亞馬遜保留語音剪輯並對其進行試驗的權利,遠遠超出了蘋果對Siri的處理能力。默認情況下,該公司會無限期保留錄音。亞馬遜沒有透露有關如何使用這些數據的細節,只是說其人類轉錄已證明在將Alexa轉換為全球新語言並擴展其響應能力方面具有巨大優勢。

2016年,亞馬遜創建了Frequent Utterance Database(FUD),以幫助Alexa為常見請求添加答案。與FUD合作的前員工表示,渴望更積極挖掘數據的產品團隊與負責保護用戶信息的安全團隊之間存在緊張關係。2017年,亞馬遜推出了配備攝像頭的Echo Look,該產品被稱為AI造型師,可以推薦服裝搭配。知情人士說,它的開發者考慮將相機編程為在用戶要求Alexa講笑話時自動開機。他們的想法是錄製用戶面部的視頻並評估用戶是否在笑。這些人說,亞馬遜最終擱置了這個想法。該公司表示,Alexa目前沒有使用面部識別技術。

該公司已在世界各地設立了轉錄「農場」。今年,它舉行了多次面向海外轉錄員的入門招聘活動。一位花了數十年時間為科技公司開發識別系統的語音技術專家說,最近的招聘規模暗示亞馬遜音頻數據分析的規模令人震驚。亞馬遜表示,它「認真對待客戶及其錄音的安全性」,並且需要全面了解區域性口音和口語化才能使Alexa走向全球。

微軟在今年8月承認,它使用人類幫助審查通過語音識別技術生成的語音數據。寶馬、惠普和Humana等企業正在將這一技術集成到自己的產品和服務中。包括阿里巴巴、搜索巨頭百度和手機製造商小米在內的中國科技公司每個季度都在收集數百萬個智能音箱的語音數據。業內分析師表示,谷歌和Facebook同樣認為音頻數據將極大地增強其龐大的廣告業務。密西根大學教授Schaub說,網頁瀏覽告訴這些公司很多有關人的信息,但是錄音可以使AI更加容易地估計年齡、性別、情感甚至位置和興趣。他說:「人們通常不會意識到他們的語音命令所顯示的內容。如果你經常問橄欖球,那麼你很可能是NFL球迷。如果背景音中有嬰兒在哭泣,那麼則可以推斷你有一個家庭。」

谷歌搜索向Google Assistant提供了來自數十億種可用設備的查詢,這些設備包括Android智慧型手機和平板電腦、Nest恆溫器和Sony TV。谷歌已經雇用了海外的臨時工來轉錄片段,以提高系統的準確性。谷歌已承諾,審閱的錄音不會與任何個人信息相關聯。但是今年夏天,一家谷歌承包商向比利時廣播公司VRT NWS分享了1000多個用戶記錄。這家媒體能夠根據用戶所說的話找出錄音中的某些人是誰,這讓那些被查明的用戶感到震驚。這些記錄中的10%,是因為設備錯誤地檢測到激活詞,並在未經用戶同意的情況下進行了錄音。

一位谷歌發言人說:「自從聽到這些顧慮後,我們一直致力於在增強隱私控制的同時暫停Assistant音頻的人為轉錄。」該公司拒絕對此事置評。一位與Google Assistant有關的高級工程師最近離開了該公司,他說,如果語音助手能夠更好地幫助用戶,人們很有可能會忽略對監聽的擔憂。

在相關新聞報導不斷出現之後,這些大型科技公司於今年調整了他們的虛擬助手項目。谷歌暫停了人類對Assistant音頻的轉錄,蘋果開始允許用戶刪除他們的Siri歷史記錄並選擇不共享更多內容,使共享錄音成為可選內容,並直接雇用了許多前承包商來增強其對人類監聽的控制力。Facebook和微軟在其隱私政策中添加了更明確的免責聲明。亞馬遜也引入了類似的披露方式,並開始允許Alexa用戶選擇不進行人工審核。亞馬遜的Limp最近談到人類轉錄小組時說:「這在業界是一件眾所周知的事情。無論是在新聞界還是在客戶中都廣為人知,很顯然這樣的做法還不夠好。」

一些研究人員說,智慧型手機處理能力的提高和一種稱為聯合學習的計算機建模形式可能最終會淘汰這些監聽行為,因為這些機器將變得足夠聰明,可以在沒有合同工幫助的情況下解決問題。目前,由於沒有更嚴格的法律或消費者的強烈反對,隨著語音設備的激增,人類音頻審核隊伍幾乎肯定會繼續增長。

關鍵字: