Alexa變身竊聽(tīng)器,亞馬遜被爆雇傭數(shù)千員工監(jiān)聽(tīng)用戶對(duì)話
自2014年Echo問(wèn)世后,亞馬遜的圓柱形智能音箱使得語(yǔ)音軟件在家庭中的使用迅速普及。不久后,Alphabet 公司推出了自己的版本“谷歌Home”,隨后是蘋果公司的HomePod。在中國(guó)也有許多公司銷售自己推出的類似設(shè)備。根據(jù)研究機(jī)構(gòu)Canalys的數(shù)據(jù)顯示,去年全球消費(fèi)者購(gòu)買了7800萬(wàn)個(gè)智能揚(yáng)聲器。還有數(shù)百萬(wàn)人使用語(yǔ)音軟件與智能手機(jī)上的數(shù)字語(yǔ)音助手進(jìn)行互動(dòng)。
Alexa軟件被設(shè)計(jì)成聽(tīng)到一個(gè)喚醒詞后連續(xù)錄制音頻片段。喚醒詞默認(rèn)是“Alexa”。但人們可以將其更改為“Echo”或“computer”。當(dāng)檢測(cè)到喚醒詞時(shí),Echo頂部的光環(huán)會(huì)變?yōu)樗{(lán)色,表明該設(shè)備正在記錄并向亞馬遜服務(wù)器發(fā)送一條命令。
大多數(shù)現(xiàn)代語(yǔ)音識(shí)別系統(tǒng)依賴于模仿人類大腦的神經(jīng)網(wǎng)絡(luò)。該軟件通過(guò)在大量數(shù)據(jù)中發(fā)現(xiàn)模式來(lái)學(xué)習(xí)。驅(qū)動(dòng)Echo和其他智能揚(yáng)聲器的算法使用概率模型來(lái)進(jìn)行有根據(jù)的猜測(cè)。如果有人問(wèn)Alexa附近是否有希臘餐館,算法就知道用戶可能在尋找一家餐館,而不是教堂或社區(qū)中心。
但有時(shí)Alexa也會(huì)弄錯(cuò),尤其是在處理新的俚語(yǔ)、地區(qū)口語(yǔ)或英語(yǔ)以外的語(yǔ)言時(shí)。在法語(yǔ)中,avec sa的“with him”或“with her”會(huì)讓軟件誤以為有人在使用Alexa wake這個(gè)詞。Hecho在西班牙語(yǔ)中表示事實(shí)或行為,有時(shí)被誤解為Echo。這就是為什么亞馬遜招募人工助手來(lái)填補(bǔ)算法所遺漏的空白。
蘋果的Siri也有人工助手,主要負(fù)責(zé)判斷數(shù)字語(yǔ)音助手對(duì)請(qǐng)求的解釋是否與用戶所說(shuō)的相符。根據(jù)蘋果的一份安全白皮書所示,他們審查的錄音缺乏可識(shí)別個(gè)人身份的信息,并與隨機(jī)標(biāo)識(shí)符綁定存儲(chǔ)6個(gè)月。在此之后,數(shù)據(jù)將被剔除隨機(jī)識(shí)別信息,但可能會(huì)被存儲(chǔ)更長(zhǎng)時(shí)間,以提高Siri的語(yǔ)音識(shí)別能力。
該公司說(shuō),在谷歌,一些評(píng)估人員可以從谷歌語(yǔ)音助手那里獲得一些音頻片段,用來(lái)幫助訓(xùn)練和改進(jìn)產(chǎn)品,但它與任何可識(shí)別個(gè)人身份的信息都沒(méi)有關(guān)聯(lián),而且音頻是失真的。
亞馬遜最近發(fā)布了一份招聘啟事,為布加勒斯特的Alexa數(shù)據(jù)服務(wù)公司招聘一名質(zhì)保經(jīng)理。招聘啟事里對(duì)工作內(nèi)容這樣描述:“每天Alexa都要聽(tīng)成千上萬(wàn)的人談?wù)摬煌脑掝}和不同的語(yǔ)言,她需要我們的幫助來(lái)理解這一切。這是你從未見(jiàn)過(guò)的大數(shù)據(jù)處理。我們每天都在創(chuàng)造、標(biāo)注、策劃和分析大量的語(yǔ)音材料!
據(jù)一位知情人士透露,亞馬遜對(duì)語(yǔ)音數(shù)據(jù)的審核過(guò)程始于Alexa隨機(jī)抽取一小部分客戶語(yǔ)音記錄樣本,并將音頻文件發(fā)送給遙遠(yuǎn)的員工和承包商。
一些Alexa審核人員的任務(wù)是轉(zhuǎn)錄用戶的命令,將錄音與Alexa的自動(dòng)記錄進(jìn)行比較,或者對(duì)用戶與機(jī)器之間的交互進(jìn)行注釋。這個(gè)人問(wèn)了什么?Alexa是否提供了有效的響應(yīng)?
另一些人則記下偵聽(tīng)器所聽(tīng)到的一切,包括背景談話,即使是在孩子們說(shuō)話的時(shí)候。有時(shí)偵聽(tīng)器會(huì)聽(tīng)到用戶討論諸如姓名或銀行信息等私人細(xì)節(jié)。在這種情況下,他們應(yīng)該勾選一個(gè)表示“關(guān)鍵數(shù)據(jù)”的對(duì)話框,然后他們進(jìn)入下一個(gè)音頻文件。
根據(jù)亞馬遜網(wǎng)站上的說(shuō)法,除非Echo檢測(cè)到喚醒詞或按下按鈕激活,否則不會(huì)存儲(chǔ)音頻。但有時(shí)Alexa似乎在沒(méi)有任何提示的情況下就開始錄音了,音頻文件以刺耳的電視聲音或難以理解的噪音開始。無(wú)論激活是否錯(cuò)誤,審核人員都需要對(duì)其進(jìn)行轉(zhuǎn)錄。其中一名知情人士說(shuō),當(dāng)Alexa沒(méi)有收到喚醒命令或意外觸發(fā)時(shí),審核人員每人每天都會(huì)錄制多達(dá)100段錄音。
據(jù)兩位評(píng)論人士說(shuō),在世界各地的家庭中,Echo的主人經(jīng)常猜測(cè)誰(shuí)在偷聽(tīng)。他們會(huì)問(wèn)Alexa :“你是為國(guó)家安全局工作嗎?Alexa,有人在聽(tīng)我們說(shuō)話嗎?”

發(fā)表評(píng)論
請(qǐng)輸入評(píng)論內(nèi)容...
請(qǐng)輸入評(píng)論/評(píng)論長(zhǎng)度6~500個(gè)字
圖片新聞
最新活動(dòng)更多
-
免費(fèi)參會(huì)立即報(bào)名>> 7月30日- 8月1日 2025全數(shù)會(huì)工業(yè)芯片與傳感儀表展
-
精彩回顧立即查看>> 【線下會(huì)議】OFweek 2024(第九屆)物聯(lián)網(wǎng)產(chǎn)業(yè)大會(huì)
-
精彩回顧立即查看>> 松下新能源中國(guó)布局:鋰一次電池新品介紹
-
精彩回顧立即查看>> 2024 智能家居出海論壇
-
精彩回顧立即查看>> 2024中國(guó)國(guó)際工業(yè)博覽會(huì)維科網(wǎng)·激光VIP企業(yè)展臺(tái)直播
-
精彩回顧立即查看>> 【產(chǎn)品試用】RSE30/60在線紅外熱像儀免費(fèi)試用
編輯推薦