侵權(quán)投訴
訂閱
糾錯(cuò)
加入自媒體

Alexa變身竊聽(tīng)器,亞馬遜被爆雇傭數(shù)千員工監(jiān)聽(tīng)用戶對(duì)話

自2014年Echo問(wèn)世后,亞馬遜的圓柱形智能音箱使得語(yǔ)音軟件在家庭中的使用迅速普及。不久后,Alphabet 公司推出了自己的版本“谷歌Home”,隨后是蘋果公司的HomePod。在中國(guó)也有許多公司銷售自己推出的類似設(shè)備。根據(jù)研究機(jī)構(gòu)Canalys的數(shù)據(jù)顯示,去年全球消費(fèi)者購(gòu)買了7800萬(wàn)個(gè)智能揚(yáng)聲器。還有數(shù)百萬(wàn)人使用語(yǔ)音軟件與智能手機(jī)上的數(shù)字語(yǔ)音助手進(jìn)行互動(dòng)。

Alexa軟件被設(shè)計(jì)成聽(tīng)到一個(gè)喚醒詞后連續(xù)錄制音頻片段。喚醒詞默認(rèn)是“Alexa”。但人們可以將其更改為“Echo”或“computer”。當(dāng)檢測(cè)到喚醒詞時(shí),Echo頂部的光環(huán)會(huì)變?yōu)樗{(lán)色,表明該設(shè)備正在記錄并向亞馬遜服務(wù)器發(fā)送一條命令。

大多數(shù)現(xiàn)代語(yǔ)音識(shí)別系統(tǒng)依賴于模仿人類大腦的神經(jīng)網(wǎng)絡(luò)。該軟件通過(guò)在大量數(shù)據(jù)中發(fā)現(xiàn)模式來(lái)學(xué)習(xí)。驅(qū)動(dòng)Echo和其他智能揚(yáng)聲器的算法使用概率模型來(lái)進(jìn)行有根據(jù)的猜測(cè)。如果有人問(wèn)Alexa附近是否有希臘餐館,算法就知道用戶可能在尋找一家餐館,而不是教堂或社區(qū)中心。

但有時(shí)Alexa也會(huì)弄錯(cuò),尤其是在處理新的俚語(yǔ)、地區(qū)口語(yǔ)或英語(yǔ)以外的語(yǔ)言時(shí)。在法語(yǔ)中,avec sa的“with him”或“with her”會(huì)讓軟件誤以為有人在使用Alexa wake這個(gè)詞。Hecho在西班牙語(yǔ)中表示事實(shí)或行為,有時(shí)被誤解為Echo。這就是為什么亞馬遜招募人工助手來(lái)填補(bǔ)算法所遺漏的空白。

蘋果的Siri也有人工助手,主要負(fù)責(zé)判斷數(shù)字語(yǔ)音助手對(duì)請(qǐng)求的解釋是否與用戶所說(shuō)的相符。根據(jù)蘋果的一份安全白皮書所示,他們審查的錄音缺乏可識(shí)別個(gè)人身份的信息,并與隨機(jī)標(biāo)識(shí)符綁定存儲(chǔ)6個(gè)月。在此之后,數(shù)據(jù)將被剔除隨機(jī)識(shí)別信息,但可能會(huì)被存儲(chǔ)更長(zhǎng)時(shí)間,以提高Siri的語(yǔ)音識(shí)別能力。

該公司說(shuō),在谷歌,一些評(píng)估人員可以從谷歌語(yǔ)音助手那里獲得一些音頻片段,用來(lái)幫助訓(xùn)練和改進(jìn)產(chǎn)品,但它與任何可識(shí)別個(gè)人身份的信息都沒(méi)有關(guān)聯(lián),而且音頻是失真的。

亞馬遜最近發(fā)布了一份招聘啟事,為布加勒斯特的Alexa數(shù)據(jù)服務(wù)公司招聘一名質(zhì)保經(jīng)理。招聘啟事里對(duì)工作內(nèi)容這樣描述:“每天Alexa都要聽(tīng)成千上萬(wàn)的人談?wù)摬煌脑掝}和不同的語(yǔ)言,她需要我們的幫助來(lái)理解這一切。這是你從未見(jiàn)過(guò)的大數(shù)據(jù)處理。我們每天都在創(chuàng)造、標(biāo)注、策劃和分析大量的語(yǔ)音材料!

據(jù)一位知情人士透露,亞馬遜對(duì)語(yǔ)音數(shù)據(jù)的審核過(guò)程始于Alexa隨機(jī)抽取一小部分客戶語(yǔ)音記錄樣本,并將音頻文件發(fā)送給遙遠(yuǎn)的員工和承包商。

一些Alexa審核人員的任務(wù)是轉(zhuǎn)錄用戶的命令,將錄音與Alexa的自動(dòng)記錄進(jìn)行比較,或者對(duì)用戶與機(jī)器之間的交互進(jìn)行注釋。這個(gè)人問(wèn)了什么?Alexa是否提供了有效的響應(yīng)?

另一些人則記下偵聽(tīng)器所聽(tīng)到的一切,包括背景談話,即使是在孩子們說(shuō)話的時(shí)候。有時(shí)偵聽(tīng)器會(huì)聽(tīng)到用戶討論諸如姓名或銀行信息等私人細(xì)節(jié)。在這種情況下,他們應(yīng)該勾選一個(gè)表示“關(guān)鍵數(shù)據(jù)”的對(duì)話框,然后他們進(jìn)入下一個(gè)音頻文件。

根據(jù)亞馬遜網(wǎng)站上的說(shuō)法,除非Echo檢測(cè)到喚醒詞或按下按鈕激活,否則不會(huì)存儲(chǔ)音頻。但有時(shí)Alexa似乎在沒(méi)有任何提示的情況下就開始錄音了,音頻文件以刺耳的電視聲音或難以理解的噪音開始。無(wú)論激活是否錯(cuò)誤,審核人員都需要對(duì)其進(jìn)行轉(zhuǎn)錄。其中一名知情人士說(shuō),當(dāng)Alexa沒(méi)有收到喚醒命令或意外觸發(fā)時(shí),審核人員每人每天都會(huì)錄制多達(dá)100段錄音。

據(jù)兩位評(píng)論人士說(shuō),在世界各地的家庭中,Echo的主人經(jīng)常猜測(cè)誰(shuí)在偷聽(tīng)。他們會(huì)問(wèn)Alexa :“你是為國(guó)家安全局工作嗎?Alexa,有人在聽(tīng)我們說(shuō)話嗎?”

<上一頁(yè)  1  2  
聲明: 本文系OFweek根據(jù)授權(quán)轉(zhuǎn)載自其它媒體或授權(quán)刊載,目的在于信息傳遞,并不代表本站贊同其觀點(diǎn)和對(duì)其真實(shí)性負(fù)責(zé),如有新聞稿件和圖片作品的內(nèi)容、版權(quán)以及其它問(wèn)題的,請(qǐng)聯(lián)系我們。

發(fā)表評(píng)論

0條評(píng)論,0人參與

請(qǐng)輸入評(píng)論內(nèi)容...

請(qǐng)輸入評(píng)論/評(píng)論長(zhǎng)度6~500個(gè)字

您提交的評(píng)論過(guò)于頻繁,請(qǐng)輸入驗(yàn)證碼繼續(xù)

  • 看不清,點(diǎn)擊換一張  刷新

暫無(wú)評(píng)論

暫無(wú)評(píng)論

    文章糾錯(cuò)
    x
    *文字標(biāo)題:
    *糾錯(cuò)內(nèi)容:
    聯(lián)系郵箱:
    *驗(yàn) 證 碼:

    粵公網(wǎng)安備 44030502002758號(hào)