訂閱
糾錯
加入自媒體

Facebook大中華區(qū)平臺合作負責人濮冠楠:人工智能-規(guī)模與創(chuàng)新

8月30-31日,由中國高科技行業(yè)門戶OFweek維科網(wǎng)、高科會主辦,OFweek人工智能網(wǎng)承辦的2018中國(上海)國際人工智能展覽會暨OFweek(第二屆)人工智能產(chǎn)業(yè)大會在上海成功舉辦。本次大會用全新視角透析行業(yè)動態(tài),解讀人工智能領(lǐng)域本年度海內(nèi)外最值得關(guān)注的學術(shù)與研發(fā)進展,與數(shù)千位人工智能領(lǐng)域的國際知名企業(yè)高層、行業(yè)資深專家、專家分析機構(gòu)等數(shù)千位精英進行多方分析與探討。

在30日AI技術(shù)專場主論壇上,F(xiàn)acebook大中華區(qū)平臺合作負責人濮冠楠發(fā)表了《人工智能-規(guī)模與創(chuàng)新》主題演講,介紹了Facebook在龐大的數(shù)據(jù)量下如何通過AI技術(shù)做到內(nèi)容審核、質(zhì)量監(jiān)控。同時共享了開源深度學習工具Torch、人工智能系統(tǒng)WIT.AI、深度學習框架PYTORCH、模塊化的深度學習框架caffe2。

Facebook大中華區(qū)平臺合作負責人濮冠楠

以下為Facebook大中華區(qū)平臺合作負責人濮冠楠的現(xiàn)場演講內(nèi)容,OFweek人工智能網(wǎng)作了不改變原意的整理和編輯:

大家好,首先謝謝今天有這個機會可以跟大家簡單的介紹一下Facebook在人工智能領(lǐng)域目前的一些進展和所做的一些嘗試。

我叫濮冠楠,在新加坡,主要是負責Facebook在大中華地區(qū)的和開發(fā)者合作關(guān)系。我今天簡單地先介紹一下。

Facebook在大家正常理解來說,其實就是一家軟件公司,是做移動的APP開發(fā)的。當然在這一點上我們確實擁有一些規(guī)模化比較大的應(yīng)用,比如說目前Facebook本身在全球的月活躍超過22億人,我們有一個比較完整的產(chǎn)品矩陣,整體產(chǎn)品矩陣的用戶數(shù)其實是非常大的。在這些內(nèi)容里,我們是如何做一些比如說內(nèi)容的審核、質(zhì)量的監(jiān)控,以及各種各樣的一些技術(shù)的支持呢?其實在很多基層架構(gòu)的底層里,我們使用了很多AI的一些技術(shù)支持。我們看簡單的一些例子,可以簡單的介紹一些具體飛速的AI是如何在我們的產(chǎn)品里使用的。大家可以看到最左邊這個例子,其實是Facebook的messenger。在這個例子里,我們看到其實它是聊天機器人,那就是messenger facebook。

相對于我們作為一個用戶來說,聊天機器人可以去搜索、定制自己的旅行,相當于一個智能聊天的方式,去選擇制定自己的旅行計劃,同時我們可以給一些推薦。在這里大家可以看到,在預(yù)訂過程過程中,它的AI的部分其實是相當于我們有一個nlp語義學習的分析,這一部分是Facebook的一個架構(gòu)。同時大家也可能知道在Facebook上我們有很多這種視頻的內(nèi)容,包括我們最近在Facebook推出的展示視頻的頁面。人工智能在這方面的應(yīng)用,其實就是說在用戶把視頻上傳到Facebook之后,可以快速的生成一個視頻的預(yù)覽,大概三秒鐘,這其實也是通過人工智能來實現(xiàn)的。除此之外,大家可以看到這是我們做的另一個嘗試,就是在大概一年半之前Facebook正式開放了自己的相機平臺,相當于我們有一個開放的相機平臺,開發(fā)者也可以在這個平臺上開發(fā)自己想要做的一些實踐,在這邊我們可以看到這個平面識別技術(shù),實際上就是通過AI的底層技術(shù)來打造的。

最后我們包括除AR、相機之外,虛擬現(xiàn)實的技術(shù)很多也會在底層中應(yīng)用。同時Facebook面對的一個比較大的挑戰(zhàn)也是剛才我說過,因為Facebook本身的用戶數(shù)在全球范圍內(nèi)是一個比較龐大的規(guī)模,在這個時候我們生成的虛假用戶的內(nèi)容其實非常多,我們很大程度上是依靠人工智能快速的去識別、刪除這些內(nèi)容。

接下來我簡單介紹一下Facebook在人工智能領(lǐng)域做的一些嘗試,我們在研究領(lǐng)域做的嘗試大概可以分為幾點。我們最新的一個在人工智能領(lǐng)域方面的嘗試,就是推出了pitch。它上線到現(xiàn)在已經(jīng)將近18個月時間了,在上線時間都是一個自然的增長。在2016年1月上線之后,大概18個月之前,大家可以看到它其實有一個非常大的自然的增長,尤其是在引用庫里、在研究方面,它的增長速度其實是非常快。那什么是pitch?其實就是我們低于人工智能推出的一個比較更偏向于快速部署的一個AI的forMark。

pitch可能比較適合做一些研究方面的應(yīng)用,因為Facebook畢竟自己也是一個基于用戶的APP開發(fā)者,所以我們內(nèi)部另外一個比較大的forMark叫咖啡兔,咖啡兔更像是一個偏向于應(yīng)用層面的forMark。大家如果知道咖啡兔的話,它幾乎是用在我們那公司內(nèi)部的所有的應(yīng)用里邊,就是我們自己的移動的APP都會使用咖啡兔的forMark,也就是說在這種情況下,我們大概可以知道咖啡兔的使用的量級是非常大的,每天咖啡兔使用的量級大概是200兆一次,同時因為它也隨著Facebook的APP預(yù)載在手機里,相當于在全世界大概會有10億到20億的手機已經(jīng)會使用到咖啡兔的技術(shù)。之前可能很多forMark的模型不能互相混用,將來我們希望打造開放的架構(gòu)規(guī)范,尤其是研究開發(fā)人員互相交換意見的時候可以更加簡單,模型遷移的成本可能也會更低一些。

最終我們也在今年年初的時候把這3個forMark共同的整合到一起,我們把這個平臺的名字稱為pitch1.0,相當于把這三個架構(gòu)綜合放到一起了,目前我們希望這一個架構(gòu)可以更多的滿足開發(fā)研究方面的需求。同時這方面其實也歸功很多我們合作伙伴的大力的支持,比如說微軟還有亞馬遜。

接下來我簡單的講一下,具體我們的應(yīng)用層面,對于Facebook來說,我們是如何通過參數(shù)去訓(xùn)練大數(shù)據(jù)的神經(jīng)網(wǎng)絡(luò)?

簡單來說,我們是有三個具體的應(yīng)用的層面,如果從應(yīng)用層面來分區(qū)的話,第一個大的就是視覺,就是Facebook在視覺方面是如何做AI的,同時就是語意語言分析。最后是推理。

我簡單的介紹一下這三個部分,到底我們具體做了一些嘗試是怎么樣的。

在具體的圖像視覺識別的時候,我們其實一直會有一個嘗試,從2012年最開始的,我們可能識別出來的只能是最左邊圖像里邊的一個人。大概五年之后,在2017年的時候,我們的識別已經(jīng)可以說相對的比較準確,可以識別出具體的每個物體,相當于我們識別出來這個物體多大程度上可以確信。不光是包括這個識別的準確率,同時因為很多時候大家應(yīng)用的場景,包括圖像識別,其實是在移動設(shè)備里,就是在手機里,那識別的效率其實也是更加重要的一部分。

這是我們在效率方面的做的一個提升,在2017年之前的時候,如果我們做肢體的具體識別的時候,識別度是比較低的。那在過了一年之后,在2018年的時候,我們就有一個非常高的準確率,同時即使在手機上運行的速度也是比較快的。

幾乎非常實時的準確的對整個人的身體建模,同時進行識別。具體我們是如何做到這些的呢?其實是通過海量的數(shù)據(jù)來進行connive。因為用戶在把他的照片上傳到Facebook的時候,一般會做一些標簽,如何把標簽跟照片聯(lián)系在一起,是一個我們進行模型訓(xùn)練的一個方式。在Facebook上目前公開設(shè)置高標貼的照片超過35億,比如說我們在connive之前可能在看實物,如果我們看照片來識別的話,只能識別出實物。之后經(jīng)過這些模型的確定之后,我們大概可以分析出來它具體實物的種類、包括地標、具體的地標名字,這些其實都是可以通過我們的圖形圖像的connive來做到的。

在一個就是語言,為什么語言對像Facebook這樣規(guī)模的公司比較重要。因為Facebook上的人數(shù)其實是非常多的,即使Facebook自己的APP就超過22億,而且同時用戶在上面使用的語言的種數(shù)也很多,可能也會超過200多種世界各地不同的語言。這些東西對我們都是一個很大的挑戰(zhàn),如何給用戶提供正確的翻譯,很簡單的說,可能要我們自動地提供機器的翻譯,這是其中一種。同時我們也希望盡力、盡量的可能支持全世界各種各樣不同的語言。

我剛才可能說過Facebook自己支持的語言,就是我們在UI界面上支持200種不同的語言,但是其實在世界各地大家使用的語言的種類,就是比較活躍的語言其實可能會超過6000種。我們在語言語音識別的時候,會有一些簡單的嘗試,就是說我們會把不同的語言做一個嵌入,就是把不同的語音打包進行學習。

最后一部分我簡單介紹一下,就是在推理這個環(huán)節(jié)我們做了一些嘗試。因為計算機,尤其包括人工智能可以做到的事情,就是幫我們在日常生活中解決很多問題。這方面其實每個公司都會有自己很多不同的嘗試。我們嘗試一些簡單的例子,如果我們看到一個圖片,不僅僅是做一個識別,我們可以進一步地推理,它可以做到事情是什么?比如說在不同的場景里,我們可以設(shè)置一個指令問浴缸的顏色是什么?我們通過機器學習可以算出來,它可能是淡灰色。是否可以準確視覺識別出房間大概功能是什么?就可能需要更深層次的一個東西,就是推理的功能。

當然大家可能也知道google在圍棋方面有很多的嘗試,F(xiàn)acebook其實也有自己在圍棋這邊的一些嘗試,我們在這邊做了蠻多的事情,我們在AI圍棋這邊的嘗試。同時我們也會使用一些游戲來做一些connivement,這邊的畫面就是一個已經(jīng)比較老的游戲,叫做星期爭霸。大家可以看到在這邊就相當于一個比較生動的模型,相當于你可以看到在游戲中的兩個種族的對戰(zhàn)。如果在機器在connive之前,我們可以看到右邊的這個部隊,它的作戰(zhàn)并沒有一個很清晰的邏輯,經(jīng)過機器訓(xùn)練之后,可以發(fā)現(xiàn)他們其實有自己的布局,包括布陣,這些其實都是并沒有很多輔導(dǎo),大部分都是它自己在訓(xùn)練領(lǐng)悟的。

Facebook在AI方面的投入還是蠻大的,尤其是目前的話,我們會在底層做很多不同的嘗試,剛才說過的不同的應(yīng)用的層級,視覺、語言、推理工具,我們都會有不同的freemarke,而這些都是開源的,大家可以直接在我們的網(wǎng)站上下載到這些不同的東西自己使用。

最后一點,就是對于這種層級的公司,如果要做一些AI的研究或者一些相關(guān)的東西的話,大規(guī)模的數(shù)據(jù)中心都是必不可少的。在這邊Facebook也在全世界各地建立了自己的數(shù)據(jù)中心,我們的數(shù)據(jù)中心的設(shè)計圖紙也是開源的,如果大家有興趣的話,也可以去研究一下我們的數(shù)據(jù)中心是如何設(shè)計的。那今天我的演講環(huán)節(jié)就到此為止,謝謝大家!

聲明: 本網(wǎng)站所刊載信息,不代表OFweek觀點?帽菊靖寮,務(wù)經(jīng)書面授權(quán)。未經(jīng)授權(quán)禁止轉(zhuǎn)載、摘編、復(fù)制、翻譯及建立鏡像,違者將依法追究法律責任。

發(fā)表評論

0條評論,0人參與

請輸入評論內(nèi)容...

請輸入評論/評論長度6~500個字

您提交的評論過于頻繁,請輸入驗證碼繼續(xù)

暫無評論

暫無評論

    掃碼關(guān)注公眾號
    OFweek人工智能網(wǎng)
    獲取更多精彩內(nèi)容
    文章糾錯
    x
    *文字標題:
    *糾錯內(nèi)容:
    聯(lián)系郵箱:
    *驗 證 碼:

    粵公網(wǎng)安備 44030502002758號