關(guān)注微信公眾號(hào)
創(chuàng)頭條企服版APP
【獵云網(wǎng)(微信號(hào):)】12月15日?qǐng)?bào)道(編譯:油人)
Ruthy Hope Slatis簡(jiǎn)直不敢相信她所聽到的。她曾被波士頓郊外的一家臨時(shí)機(jī)構(gòu)雇用,為亞馬遜轉(zhuǎn)錄音頻文件,這是一項(xiàng)被亞馬遜所模糊的工作。作為每小時(shí)只拿12美元薪酬的合同工,她和同事(正式名稱為數(shù)據(jù)助理)需要聽取隨機(jī)交談的片段,并在自己的筆記本電腦里記下聽到的每個(gè)單詞。亞馬遜對(duì)外只會(huì)說這項(xiàng)工作對(duì)其絕密的語音識(shí)別產(chǎn)品至關(guān)重要,然而,這些語音片段中卻包含著用戶親密時(shí)刻的錄音。
2014年秋天,亞馬遜推出了Echo智能音箱,該設(shè)備帶有語音激活虛擬助手軟件Alexa。亞馬遜在其首個(gè)Echo廣告中將Alexa視為人工智能的奇跡。在該廣告中,一個(gè)幸福的家庭正在命令A(yù)lexa接收新聞更新、回答問題答案,并幫助孩子們做作業(yè)。但是,Slatis很快就開始意識(shí)到人類在這款產(chǎn)品背后的影響力。她記得當(dāng)時(shí)自己在想:“天哪,這就是我正在做的事情。”亞馬遜會(huì)捕獲云中的每個(gè)語音命令,并依靠像她這樣的數(shù)據(jù)助理來訓(xùn)練系統(tǒng)。一開始,Slatis認(rèn)為自己所聽取的片段來自有酬勞的測(cè)試人員,這些測(cè)試人員自愿用自己的語音模式來換取幾美元的獎(jiǎng)勵(lì)。然而,她很快意識(shí)到這個(gè)想法是錯(cuò)誤的。
她和她的同事正在聽取的錄音通常很激烈、很尷尬,而用戶也會(huì)在音箱面前承認(rèn)自己的秘密和恐懼。隨著轉(zhuǎn)錄項(xiàng)目的發(fā)展以及Alexa的流行,錄音中透露的私人信息也隨之增加。其他合同工回憶說,自己聽過孩子分享了他們的家庭住址和電話號(hào)碼,聽到一名男子試圖訂購性玩具,甚至聽到一名晚宴客人大聲地想知道亞馬遜當(dāng)時(shí)是否正在偷聽。Slatis說:“用戶往往只是開玩笑,但其實(shí)完全不知道自己正在被偷聽。”她于2016年選擇了辭職。
自從Slatis第一次感到毛骨悚然以來的五年中,四分之一的美國人購買了“智能音箱”設(shè)備,例如Echo、Google Home和Apple HomePod。到目前為止,亞馬遜已經(jīng)贏得了這場(chǎng)銷售大戰(zhàn),據(jù)報(bào)道,用戶已經(jīng)購買了超過1億個(gè)Alexa設(shè)備。但是如今,這些全球最大的公司之間正在展開一場(chǎng)新的戰(zhàn)爭(zhēng),通過將麥克風(fēng)內(nèi)置于手機(jī)、智能手表、電視、冰箱、SUV等各種物品中,把Alexa、Siri、Google Assistant和Cortana嵌入到人們的生活中。咨詢公司Juniper Research估計(jì),到2023年,全球智能音箱的年市場(chǎng)規(guī)模將達(dá)到110億美元,語音控制設(shè)備將達(dá)到約74億個(gè),這相當(dāng)于地球上的每個(gè)人都擁有一個(gè)設(shè)備。
而現(xiàn)在的問題是,我們要如何處理這樣的規(guī)模呢?按照科技公司的聲明,這些機(jī)器并沒有每時(shí)每刻創(chuàng)建音頻文件,因?yàn)橹悄芤粝鋬H在用戶激活它們時(shí)才錄制音頻。但是,當(dāng)始終在線的麥克風(fēng)被引入廚房和臥室中時(shí),它們可能會(huì)無意間捕獲到用戶不想共享的聲音。“麥克風(fēng)始終在線是一件令人憂心的事情。我們發(fā)現(xiàn)這些設(shè)備的用戶往往會(huì)很相信公司不會(huì)對(duì)其記錄的數(shù)據(jù)做任何壞事,”密歇根大學(xué)教授Florian Schaub說道,他主要研究語音命令軟件背后的人類行為。“隱私的不斷侵蝕正在不斷發(fā)展。人們不知道如何保護(hù)自己。”
亞馬遜拒絕了對(duì)此事的采訪請(qǐng)求。一位女發(fā)言人在一封電子郵件聲明中寫道:“隱私是每個(gè)團(tuán)隊(duì)和員工設(shè)計(jì)與開發(fā)Alexa功能和Echo設(shè)備的基礎(chǔ)。作為我們安全培訓(xùn)的一部分,所有Alexa員工都接受了客戶數(shù)據(jù)處理方面的培訓(xùn)。”該公司及其競(jìng)爭(zhēng)對(duì)手皆表示,計(jì)算機(jī)無需人工審核即可執(zhí)行絕大多數(shù)語音請(qǐng)求。
然而,這些所謂的智能設(shè)備無疑需要依賴成千上萬的低薪人群,他們需要在這些聲音片段中添加注釋,以便技術(shù)公司可以升級(jí)其“電子耳朵”。至此,我們最微弱的耳語竟成為科技公司最有價(jià)值的數(shù)據(jù)集之一。今年早些時(shí)候,彭博社首先報(bào)道了技術(shù)行業(yè)使用人類來審查從用戶那里收集的音頻(并且沒有向用戶披露這一事實(shí))。這其中就包括了蘋果、亞馬遜和Facebook。相關(guān)高管和工程師表示,建立龐大的人類監(jiān)聽網(wǎng)絡(luò)會(huì)帶來問題或干擾,盡管這一直是改善其產(chǎn)品的明顯方法。
包括Slatis在內(nèi)的眾多合同工都清楚地表示,普及音頻監(jiān)視的弊端對(duì)于那些財(cái)務(wù)風(fēng)險(xiǎn)要小得多的公司來說是顯而易見的。“從來沒有感覺到這樣做是正確的,”一位為Alexa競(jìng)品工作的轉(zhuǎn)錄員說道。他與大多數(shù)合同工一樣,簽署了保密協(xié)議并以匿名為由發(fā)言,以免遭到報(bào)復(fù)。“他們真正在向客戶銷售什么?”
程序員們認(rèn)為,語音命令將成為未來半個(gè)多世紀(jì)的計(jì)算技術(shù),但是在大部分時(shí)間里,用于識(shí)別和響應(yīng)口語句子的教學(xué)機(jī)器需要將音頻文件逐字匹配到轉(zhuǎn)錄的文本,這是一個(gè)緩慢而昂貴的過程。早期的先驅(qū)者購買或建立了龐大的錄音庫,讓人們將報(bào)紙或其他預(yù)寫的材料轉(zhuǎn)換成語音。這些項(xiàng)目的徒勞本質(zhì)最終成為一個(gè)行業(yè)笑話。蘋果語音團(tuán)隊(duì)的一位前產(chǎn)品經(jīng)理回憶道,在90年代,蘋果為愿意在他們的實(shí)驗(yàn)室錄制語音模式的每個(gè)志愿者提供了一件T恤,上面印有“I Helped Apple Wreck a Nice Beach”(這是經(jīng)典的語音識(shí)別例句)。
蘋果后來成為第一家推出語音模式的大型公司,當(dāng)時(shí)它在iPhone 4S中嵌入了Siri。顯然至此,蘋果不再需要在實(shí)驗(yàn)室編寫腳本和累計(jì)錄音了。該公司在幾天之內(nèi)售出了超過400萬部4S,并很快開始獲得無數(shù)的免費(fèi)自然語音數(shù)據(jù)。在最初的幾年中,該公司在很大程度上依靠外部語音軟件專家使用這些數(shù)據(jù)來提高Siri的功能,但蘋果在2014年左右取回了控制權(quán)。“這樣的工作非常繁瑣:在經(jīng)過15或30分鐘的聆聽后,你唯一會(huì)得到的是頭痛,”Siri前高級(jí)語音科學(xué)家Tao Ma談到轉(zhuǎn)錄用戶錄音時(shí)說道。這一內(nèi)部團(tuán)隊(duì)將大部分工作分發(fā)給歐洲的IT承包商,包括總部位于愛爾蘭的GlobeTech。
在過去的幾年中,蘋果在收集和分析人們的聲音方面變得更加激進(jìn),擔(dān)心Siri的理解力和速度落后于Alexa和Google Assistant。蘋果將Siri視為語音搜索引擎,因此它必須做好準(zhǔn)備以應(yīng)付無休止的用戶查詢,并加大對(duì)音頻分析的依賴。
前承包商將這一系統(tǒng)描述為圣經(jīng)中的巴別塔。在愛爾蘭科克機(jī)場(chǎng)附近的Globetech辦公室里,無數(shù)的合同工戴著耳機(jī)靜靜地坐在MacBook前,每天要轉(zhuǎn)錄1300個(gè)剪輯片段,每個(gè)剪輯可以是一個(gè)句子,也可以是整個(gè)對(duì)話。當(dāng)合同工點(diǎn)擊播放時(shí),計(jì)算機(jī)在一個(gè)文本框中填充了Siri認(rèn)為“聽到”的字詞,然后提示員工批準(zhǔn)或更正翻譯,然后重復(fù)繼續(xù)。GlobeTech沒有回應(yīng)置評(píng)請(qǐng)求。
員工們使用的一個(gè)名為CrowdCollect的程序,包括用于由于各種原因而跳過錄音的按鈕,但他們也表示,沒有特定的機(jī)制來報(bào)告或刪除令人反感或不適當(dāng)?shù)氐囊纛l。而當(dāng)詢問經(jīng)理是否可以跳過過于私人的片段時(shí),他們被告知沒有剪輯片段會(huì)太過于私人,他們必須轉(zhuǎn)錄聽到的所有內(nèi)容。由于合同工的工作通常只維持幾個(gè)月,所以有關(guān)隱私問題的培訓(xùn)會(huì)很少。
2015年,當(dāng)蘋果首席執(zhí)行官蒂姆·庫克宣稱隱私是一項(xiàng)“基本人權(quán)”之時(shí),蘋果的機(jī)器每周需要處理超過十億次請(qǐng)求。當(dāng)時(shí),用戶可以開啟一項(xiàng)功能,保持語音助手始終在線,這樣他們就不再需要按下按鈕來激活語音助手。蘋果在其用戶協(xié)議法律條款中表示,可能會(huì)記錄和分析語音數(shù)據(jù)以改善Siri,但沒有任何地方提到會(huì)是人類員工在監(jiān)聽。一位前合同工說:“監(jiān)聽別人的語音,讓我感到非常不舒服。”
蘋果Siri部門的十位前蘋果高管表示,他們沒有而且仍然不會(huì)將此系統(tǒng)視為侵犯隱私權(quán)的行為。這些前高管說,錄音不會(huì)與蘋果用戶ID相關(guān)聯(lián),而且他們認(rèn)為用戶理解公司正在處理他們的音頻剪輯,所以即使是人類在處理音頻剪輯又有什么關(guān)系呢?“我們并不認(rèn)為這是錯(cuò)誤的做法,”曾在Siri高級(jí)開發(fā)團(tuán)隊(duì)工作的John Burkey說。“這不是間諜行為。這與應(yīng)用崩潰并詢問是否要將報(bào)告發(fā)送給蘋果的行為是相同的。”
然而,這樣的行為是有區(qū)別的,因?yàn)镸acOS會(huì)明確詢問用戶是否希望在程序崩潰后立即提交報(bào)告。這是每次出現(xiàn)故障時(shí)都會(huì)彈出的提示,而在Siri的情況下卻變成了默認(rèn)同意。許多合同工表示,盡管大多數(shù)Siri要求都是很普通的,但他們?nèi)匀粫?huì)聽到的色情化的語音,以及種族歧視或恐同性言論。
蘋果表示,只有不到0.2%的Siri請(qǐng)求需要進(jìn)行人類分析。前任經(jīng)理將合同工的指控視為夸張。曾帶領(lǐng)開發(fā)團(tuán)隊(duì)的Siri聯(lián)合創(chuàng)始人Tom Gruber說:“實(shí)際上,我們要處理的很多都是噪音,并不是說機(jī)器打算錄制某些聲音,這只是某種意義上的概率問題。”
到2019年,蘋果將Siri引入其無線耳機(jī)和HomePod揚(yáng)聲器等產(chǎn)品后,每月需要處理150億條語音命令。0.2%意味著每月,人類合同工需要處理3000萬條語音命令,一年下來就會(huì)是3.6億條。Siri團(tuán)隊(duì)的前首席研究科學(xué)家Mike Bastian說,隨機(jī)錄制的風(fēng)險(xiǎn)隨著用例的增加也在不斷增長(zhǎng)。他提到了Apple Watch的“抬起激活”功能,該功能在檢測(cè)到佩戴者的手腕被抬起時(shí)會(huì)自動(dòng)激活Siri。他說:“這就導(dǎo)致假陽性率很高。”
在智能音箱業(yè)務(wù)中,蘋果的HomePod估計(jì)僅占美國市場(chǎng)的5%,亞馬遜估計(jì)有70%。2011年,杰夫·貝佐斯命令一個(gè)團(tuán)隊(duì)向他展示早期的語音控制音樂應(yīng)用,以將該軟件構(gòu)建為硬件產(chǎn)品。于是,他們制作了Echo,它的七個(gè)麥克風(fēng)需要不斷聽著,當(dāng)出現(xiàn)包含“喚醒詞”的聲音時(shí),就會(huì)觸發(fā)新的錄音。與蘋果一樣,每個(gè)語音剪輯都會(huì)進(jìn)入該公司的服務(wù)器,然后將其中的一部分路由到數(shù)百個(gè)數(shù)據(jù)助理進(jìn)行審核。
貝佐斯和亞馬遜設(shè)備高級(jí)副總裁David Limp很清楚這樣的行為。早期Alexa產(chǎn)品經(jīng)理說,他們做出了一些設(shè)計(jì)選擇,目的是防止Echo用戶對(duì)錄制感到驚訝。當(dāng)用戶說“Alexa”時(shí),Echo周圍會(huì)出現(xiàn)一圈光環(huán),仿佛助手正在重生。一支專門的“個(gè)性化團(tuán)隊(duì)”編寫了腳本,用于回答數(shù)百個(gè)常見問題。開發(fā)人員創(chuàng)建了一個(gè)在線門戶,用戶可以在其中播放和刪除他們的音頻剪輯。亞馬遜的一位發(fā)言人說,隱私標(biāo)準(zhǔn)從一開始就內(nèi)置在Alexa中。
這樣的設(shè)計(jì)賦予了亞馬遜保留語音剪輯并對(duì)其進(jìn)行試驗(yàn)的權(quán)利,遠(yuǎn)遠(yuǎn)超出了蘋果對(duì)Siri的處理能力。默認(rèn)情況下,該公司會(huì)無限期保留錄音。亞馬遜沒有透露有關(guān)如何使用這些數(shù)據(jù)的細(xì)節(jié),只是說其人類轉(zhuǎn)錄已證明在將Alexa轉(zhuǎn)換為全球新語言并擴(kuò)展其響應(yīng)能力方面具有巨大優(yōu)勢(shì)。
2016年,亞馬遜創(chuàng)建了Frequent Utterance Database(FUD),以幫助Alexa為常見請(qǐng)求添加答案。與FUD合作的前員工表示,渴望更積極挖掘數(shù)據(jù)的產(chǎn)品團(tuán)隊(duì)與負(fù)責(zé)保護(hù)用戶信息的安全團(tuán)隊(duì)之間存在緊張關(guān)系。2017年,亞馬遜推出了配備攝像頭的Echo Look,該產(chǎn)品被稱為AI造型師,可以推薦服裝搭配。知情人士說,它的開發(fā)者考慮將相機(jī)編程為在用戶要求Alexa講笑話時(shí)自動(dòng)開機(jī)。他們的想法是錄制用戶面部的視頻并評(píng)估用戶是否在笑。這些人說,亞馬遜最終擱置了這個(gè)想法。該公司表示,Alexa目前沒有使用面部識(shí)別技術(shù)。
該公司已在世界各地設(shè)立了轉(zhuǎn)錄“農(nóng)場(chǎng)”。今年,它舉行了多次面向海外轉(zhuǎn)錄員的入門招聘活動(dòng)。一位花了數(shù)十年時(shí)間為科技公司開發(fā)識(shí)別系統(tǒng)的語音技術(shù)專家說,最近的招聘規(guī)模暗示亞馬遜音頻數(shù)據(jù)分析的規(guī)模令人震驚。亞馬遜表示,它“認(rèn)真對(duì)待客戶及其錄音的安全性”,并且需要全面了解區(qū)域性口音和口語化才能使Alexa走向全球。
微軟在今年8月承認(rèn),它使用人類幫助審查通過語音識(shí)別技術(shù)生成的語音數(shù)據(jù)。寶馬、惠普和Humana等企業(yè)正在將這一技術(shù)集成到自己的產(chǎn)品和服務(wù)中。包括阿里巴巴、搜索巨頭百度和手機(jī)制造商小米在內(nèi)的中國科技公司每個(gè)季度都在收集數(shù)百萬個(gè)智能音箱的語音數(shù)據(jù)。業(yè)內(nèi)分析師表示,谷歌和Facebook同樣認(rèn)為音頻數(shù)據(jù)將極大地增強(qiáng)其龐大的廣告業(yè)務(wù)。密歇根大學(xué)教授Schaub說,網(wǎng)頁瀏覽告訴這些公司很多有關(guān)人的信息,但是錄音可以使AI更加容易地估計(jì)年齡、性別、情感甚至位置和興趣。他說:“人們通常不會(huì)意識(shí)到他們的語音命令所顯示的內(nèi)容。如果你經(jīng)常問橄欖球,那么你很可能是NFL球迷。如果背景音中有嬰兒在哭泣,那么則可以推斷你有一個(gè)家庭。”
谷歌搜索向Google Assistant提供了來自數(shù)十億種可用設(shè)備的查詢,這些設(shè)備包括Android智能手機(jī)和平板電腦、Nest恒溫器和Sony TV。谷歌已經(jīng)雇用了海外的臨時(shí)工來轉(zhuǎn)錄片段,以提高系統(tǒng)的準(zhǔn)確性。谷歌已承諾,審閱的錄音不會(huì)與任何個(gè)人信息相關(guān)聯(lián)。但是今年夏天,一家谷歌承包商向比利時(shí)廣播公司VRT NWS分享了1000多個(gè)用戶記錄。這家媒體能夠根據(jù)用戶所說的話找出錄音中的某些人是誰,這讓那些被查明的用戶感到震驚。這些記錄中的10%,是因?yàn)樵O(shè)備錯(cuò)誤地檢測(cè)到激活詞,并在未經(jīng)用戶同意的情況下進(jìn)行了錄音。
一位谷歌發(fā)言人說:“自從聽到這些顧慮后,我們一直致力于在增強(qiáng)隱私控制的同時(shí)暫停Assistant音頻的人為轉(zhuǎn)錄。”該公司拒絕對(duì)此事置評(píng)。一位與Google Assistant有關(guān)的高級(jí)工程師最近離開了該公司,他說,如果語音助手能夠更好地幫助用戶,人們很有可能會(huì)忽略對(duì)監(jiān)聽的擔(dān)憂。
在相關(guān)新聞報(bào)道不斷出現(xiàn)之后,這些大型科技公司于今年調(diào)整了他們的虛擬助手項(xiàng)目。谷歌暫停了人類對(duì)Assistant音頻的轉(zhuǎn)錄,蘋果開始允許用戶刪除他們的Siri歷史記錄并選擇不共享更多內(nèi)容,使共享錄音成為可選內(nèi)容,并直接雇用了許多前承包商來增強(qiáng)其對(duì)人類監(jiān)聽的控制力。Facebook和微軟在其隱私政策中添加了更明確的免責(zé)聲明。亞馬遜也引入了類似的披露方式,并開始允許Alexa用戶選擇不進(jìn)行人工審核。亞馬遜的Limp最近談到人類轉(zhuǎn)錄小組時(shí)說:“這在業(yè)界是一件眾所周知的事情。無論是在新聞界還是在客戶中都廣為人知,很顯然這樣的做法還不夠好。”
一些研究人員說,智能手機(jī)處理能力的提高和一種稱為聯(lián)合學(xué)習(xí)的計(jì)算機(jī)建模形式可能最終會(huì)淘汰這些監(jiān)聽行為,因?yàn)檫@些機(jī)器將變得足夠聰明,可以在沒有合同工幫助的情況下解決問題。目前,由于沒有更嚴(yán)格的法律或消費(fèi)者的強(qiáng)烈反對(duì),隨著語音設(shè)備的激增,人類音頻審核隊(duì)伍幾乎肯定會(huì)繼續(xù)增長(zhǎng)。
2022-04-08 獵云網(wǎng)發(fā)布了 《俞敏洪流露退隱之意?稱自以為是的努力,已成為新東方發(fā)展的障礙》的文章
2022-04-08 獵云網(wǎng)發(fā)布了 《闊別五年重返網(wǎng)約車!周航掌舵曹操出行》的文章
2022-04-08 獵云網(wǎng)發(fā)布了 《加速布局芯片!小米入股芯片公司尊湃通訊》的文章
2021-12-27 獵云網(wǎng)發(fā)布了 《李彥宏:集度首款汽車機(jī)器人2022年上半年發(fā)布,2023年量產(chǎn)交付》的文章
2021-12-27 獵云網(wǎng)發(fā)布了 《虎牙推出首個(gè)虛擬偶像IP“雙馬尾”,創(chuàng)新技術(shù)助力探索廠商聯(lián)動(dòng)新路徑》的文章