訂閱
糾錯(cuò)
加入自媒體

阿里達(dá)摩院包攬AI領(lǐng)域六大權(quán)威榜單冠軍:用人類的學(xué)習(xí)方式超越人類

2020-08-26 14:56
快科技
關(guān)注

讓AI模仿人類的學(xué)習(xí)方式,結(jié)果會(huì)怎樣?

8月26日,阿里達(dá)摩院語(yǔ)言技術(shù)實(shí)驗(yàn)室取得一系列突破,斬獲自然語(yǔ)言處理(NLP)領(lǐng)域6大權(quán)威技術(shù)榜單冠軍。據(jù)介紹,參與競(jìng)賽的6項(xiàng)自研AI技術(shù)均采用模仿人類的學(xué)習(xí)模式,全方位提升了機(jī)器的語(yǔ)言理解能力,部分能力甚至已超越人類。目前,這些技術(shù)均已大規(guī)模應(yīng)用于閱讀理解、機(jī)器翻譯、人機(jī)交互等場(chǎng)景。

據(jù)悉,過(guò)去幾年,AI在圖像識(shí)別、語(yǔ)音識(shí)別等方面已逐步超越人類水平,但在復(fù)雜文本語(yǔ)義的理解上,AI與人類尚有差距,其主要原因就是傳統(tǒng)AI學(xué)習(xí)文本知識(shí)效率較低。

為此,業(yè)界提出了一種模仿人類的學(xué)習(xí)思路,即先讓AI在大規(guī)模的網(wǎng)頁(yè)和書籍文字中進(jìn)行訓(xùn)練,學(xué)習(xí)基本的詞法、語(yǔ)法和語(yǔ)義知識(shí),然后再在固定領(lǐng)域內(nèi)的文本上進(jìn)行訓(xùn)練,學(xué)習(xí)領(lǐng)域?qū)S兄R(shí)。

這一思想就是預(yù)訓(xùn)練語(yǔ)言模型的核心創(chuàng)新。自Google提出模仿人類注意力機(jī)制的BERT模型以來(lái),預(yù)訓(xùn)練語(yǔ)言模型已成為NLP領(lǐng)域的熱點(diǎn)研究方向。

達(dá)摩院早在2018年就開始布局通用的預(yù)訓(xùn)練語(yǔ)言模型,并逐漸將該思路拓展到了多語(yǔ)言、多模態(tài)、結(jié)構(gòu)化和篇章文本理解和文本生成領(lǐng)域,如今已建立一套系統(tǒng)化的深度語(yǔ)言模型體系,其自研通用語(yǔ)言模型StructBERT、多語(yǔ)言模型VECO、多模態(tài)語(yǔ)言模型StructVBERT、生成式語(yǔ)言模型PALM等6大自研模型分別刷新了世界紀(jì)錄。

阿里達(dá)摩院包攬AI領(lǐng)域六大權(quán)威榜單冠軍:用人類的學(xué)習(xí)方式超越人類

達(dá)摩院自研模型位居GLUE榜單第一名

其中,StructBERT能讓機(jī)器更好地掌握人類語(yǔ)法,使機(jī)器在面對(duì)語(yǔ)序錯(cuò)亂或不符合語(yǔ)法習(xí)慣的詞句時(shí),仍能準(zhǔn)確理解并給出正確的表達(dá)和回應(yīng),大大提高機(jī)器對(duì)詞語(yǔ)、句子以及語(yǔ)言整體的理解力。該模型以平均分90.6分在自然語(yǔ)言處理領(lǐng)域權(quán)威數(shù)據(jù)集GLUE Benchmark中位居第一,顯著超越人類水平(87.1分)。

達(dá)摩院語(yǔ)言技術(shù)實(shí)驗(yàn)室團(tuán)隊(duì)表示:“實(shí)驗(yàn)室的目標(biāo)是讓AI掌握人類知識(shí)的基礎(chǔ)技術(shù),預(yù)訓(xùn)練語(yǔ)言模型的誕生使得AI像人一樣學(xué)習(xí)新知識(shí)成為可能,未來(lái)達(dá)摩院會(huì)全面對(duì)外開放這些技術(shù),讓特定領(lǐng)域的AI變得更加智能!

過(guò)去兩年,阿里獲得了30多項(xiàng)NLP領(lǐng)域頂級(jí)賽事世界冠軍,有100多篇相關(guān)頂會(huì)論文; 阿里自然語(yǔ)言技術(shù)已在金融、新零售、通訊、互聯(lián)網(wǎng)、醫(yī)療、電力、客服等領(lǐng)域服務(wù)超十億用戶和數(shù)萬(wàn)企業(yè)客戶。

聲明: 本文系OFweek根據(jù)授權(quán)轉(zhuǎn)載自其它媒體或授權(quán)刊載,目的在于信息傳遞,并不代表本站贊同其觀點(diǎn)和對(duì)其真實(shí)性負(fù)責(zé),如有新聞稿件和圖片作品的內(nèi)容、版權(quán)以及其它問(wèn)題的,請(qǐng)聯(lián)系我們。

發(fā)表評(píng)論

0條評(píng)論,0人參與

請(qǐng)輸入評(píng)論內(nèi)容...

請(qǐng)輸入評(píng)論/評(píng)論長(zhǎng)度6~500個(gè)字

您提交的評(píng)論過(guò)于頻繁,請(qǐng)輸入驗(yàn)證碼繼續(xù)

  • 看不清,點(diǎn)擊換一張  刷新

暫無(wú)評(píng)論

暫無(wú)評(píng)論

    掃碼關(guān)注公眾號(hào)
    OFweek人工智能網(wǎng)
    獲取更多精彩內(nèi)容
    文章糾錯(cuò)
    x
    *文字標(biāo)題:
    *糾錯(cuò)內(nèi)容:
    聯(lián)系郵箱:
    *驗(yàn) 證 碼:

    粵公網(wǎng)安備 44030502002758號(hào)