訂閱
糾錯(cuò)
加入自媒體

飛槳:百度為什么要做深度學(xué)習(xí)框架?

文/當(dāng)下君

無(wú)論是最近在上海車展引發(fā)轟動(dòng)的百度Apollo自動(dòng)駕駛技術(shù),還是榮獲2020世界人工智能大會(huì)最高榮譽(yù)SAIL獎(jiǎng)、在全球GLUE新排名中以90.9的分?jǐn)?shù)再登榜首的百度文心ERNIE、抑或是你每天都在使用的小度助手,其實(shí)身后都有一個(gè)堅(jiān)實(shí)的支撐,那就是飛槳。

更準(zhǔn)確的說(shuō),是飛槳深度學(xué)習(xí)框架支撐下的深度學(xué)習(xí)。

當(dāng)然,即使如此描述,對(duì)于大多人來(lái)說(shuō),“深度學(xué)習(xí)框架”仍然是一個(gè)太技術(shù)化的表達(dá),它因何出生、為何存在、能做什么,其實(shí)就是這篇小文想傳達(dá)的信息。

當(dāng)然,也有很多人對(duì)“飛槳”這個(gè)詞感到好奇,認(rèn)為指的是“飛機(jī)的螺旋槳”,其實(shí),對(duì)于“最像文科生的理科生”的百度來(lái)說(shuō),公司名稱固然來(lái)自宋詞里的“眾里尋他千百度”,深度學(xué)習(xí)框架的名稱其實(shí)也來(lái)自于宋代文人朱熹的“聞?wù)f雙飛槳,翩然下廣津”,“飛槳”直意其實(shí)是“很快的快船”,表達(dá)了人們希望借助飛槳助推AI走得更快更遠(yuǎn)的夢(mèng)想。

這樣一說(shuō),你是否對(duì)飛槳開(kāi)始有了興趣呢?

01

為中國(guó)智能產(chǎn)業(yè)革命而生

A

何為深度學(xué)習(xí)

要了解何為“深度學(xué)習(xí)框架”,就必須要解釋何為“深度學(xué)習(xí)”。

這本身是一個(gè)巨大的挑戰(zhàn),比如,在李開(kāi)復(fù)博士的《人工智能》一書(shū)中,盡管使用了大量的譬喻和圖表,也用了足足6頁(yè)共12面紙的篇幅,來(lái)試圖讓普通讀者了解何為“深度學(xué)習(xí)”,可見(jiàn)這是一個(gè)多么難以闡釋的概念。

還是舉個(gè)例子吧,如果我們要在街頭尋找流浪貓——通常有兩個(gè)辦法:

方法之一,是設(shè)定“何為流浪貓”的具體條件,而且越細(xì)越好,比如“體型瘦弱”、”毛發(fā)凌亂”“身上帶傷”等,為了精準(zhǔn)識(shí)別,可能還要設(shè)定“毛發(fā)長(zhǎng)度超過(guò)多少mm就算凌亂”等顆粒度越來(lái)越細(xì)的規(guī)則,直到規(guī)則可以覆蓋大多數(shù)識(shí)別條件。

用這個(gè)方法訓(xùn)練出的算法,最大的瓶頸在于要人為設(shè)定足夠多的規(guī)則和標(biāo)注足夠多的數(shù)據(jù),才能盡量讓結(jié)果精準(zhǔn)。

方法之二,是不設(shè)定“何為流浪貓”的具體條件,讓計(jì)算機(jī)自己去識(shí)別,系統(tǒng)只會(huì)告訴計(jì)算機(jī)“識(shí)別對(duì)了”或“錯(cuò)了”,那么在無(wú)數(shù)次的試錯(cuò)后,系統(tǒng)就會(huì)通過(guò)算法自己沉淀一套經(jīng)驗(yàn),即“選擇什么樣的特征是對(duì)的”,從而讓機(jī)器自己去學(xué)習(xí)和創(chuàng)造“流浪貓的特征是什么”的規(guī)則。

隨著數(shù)據(jù)的不斷累加,識(shí)別率會(huì)越來(lái)越精準(zhǔn);更重要的是,這個(gè)過(guò)程不是人為設(shè)定規(guī)則來(lái)進(jìn)行的,是機(jī)器“自己在學(xué)”,這就是“深度學(xué)習(xí)”,更符合我們?nèi)祟惖膶W(xué)習(xí)習(xí)慣。

這個(gè)譬喻,對(duì)專業(yè)人士絕對(duì)談不上準(zhǔn)確,但是大致可以讓人們對(duì)深度學(xué)習(xí)有個(gè)相對(duì)明確的感知。

在人工智能的發(fā)展歷史上,深度學(xué)習(xí)的起源可以追溯到好幾十年前,比如深度學(xué)習(xí)的核心計(jì)算模型——人工神經(jīng)網(wǎng)絡(luò)概念的誕生(1943年),甚至比通用計(jì)算機(jī)的出現(xiàn)(1946年)更早……經(jīng)過(guò)無(wú)數(shù)天才的完善,2006年深度學(xué)習(xí)大師杰弗里.辛頓用一篇名為《一種深度置信網(wǎng)絡(luò)的快速學(xué)習(xí)算法》宣告了深度學(xué)習(xí)浪潮的掀起,2010年后,隨著算法、算力以及廣泛的實(shí)踐,深度學(xué)習(xí)被認(rèn)為是目前實(shí)現(xiàn)人工智能的最主要的路徑之一。

讓機(jī)器具備智能的道路有千萬(wàn)條,深度學(xué)習(xí)絕不是唯一的一條,但卻是目前走的人最多、趟的最遠(yuǎn)的一條路。也可以說(shuō),在被新的革命性范式替代之前,深度學(xué)習(xí),是我們目前大規(guī)模建設(shè)智能社會(huì)的必由之路。

B

百度為什么要做深度學(xué)習(xí)框架?

大家都知道,計(jì)算機(jī)編程的產(chǎn)品是“程序”,深度學(xué)習(xí)工作的產(chǎn)品是“模型”,其實(shí)“模型”就是一種程序,創(chuàng)造AI能力的過(guò)程就是一種編程。

比如,絕大多數(shù)人都知道,人類最早的編程語(yǔ)言是“機(jī)器語(yǔ)言”,就是用帶有小孔的紙帶來(lái)編寫(xiě)程序,讓計(jì)算機(jī)開(kāi)始工作的。

但這樣帶來(lái)的一個(gè)問(wèn)題就是,使用機(jī)器語(yǔ)言的門(mén)檻高、難度大。

筆者曾經(jīng)采訪過(guò)物理學(xué)家楊振寧教授,他回憶過(guò)一個(gè)很有趣的細(xì)節(jié),上世紀(jì)50年代他有機(jī)會(huì)使用IBM的大型計(jì)算機(jī)進(jìn)行理論物理研究,但隨即發(fā)現(xiàn)使用機(jī)器語(yǔ)言來(lái)編程實(shí)在是太難了,為此他不得不發(fā)明一種專門(mén)給自己的語(yǔ)言。

換句話說(shuō),一種生產(chǎn)工具是否能夠流行,主要取決于它是否能提高工作效率。

在深度學(xué)習(xí)的早期,使用者大都是真正的高級(jí)研究人員,他們可以自己直接編寫(xiě)深度學(xué)習(xí)模型。然而,盡管如此,這些聰明人仍然發(fā)現(xiàn),每個(gè)深度學(xué)習(xí)模型的編寫(xiě),都需要做大量的重復(fù)性工作,寫(xiě)無(wú)數(shù)重復(fù)的代碼。

因此,這些研究者為了提高工作效率,就把編寫(xiě)深度學(xué)習(xí)模型的幾個(gè)必要過(guò)程,逐個(gè)提煉出來(lái),然后把前人的研究成果不斷的沉淀在其中,使得后來(lái)人可以直接調(diào)用某些成果,從而大幅度的降低了編寫(xiě)深度學(xué)習(xí)模型的門(mén)檻。

這些模塊的組合過(guò)程中,漸漸產(chǎn)生了一個(gè)相對(duì)穩(wěn)定、通用程度相對(duì)高的“最優(yōu)組合”,這就是我們所說(shuō)的“深度學(xué)習(xí)框架”。

而隨著歷史的演進(jìn),網(wǎng)上就出現(xiàn)了不同的框架。隨著時(shí)間的推移,最為好用的幾個(gè)框架被大量的人使用,從而流行了起來(lái),全世界最為流行的深度學(xué)習(xí)框架有PaddlePaddle(飛槳)、Tensorflow、PyTorch、Caffe、Theano、MXNet、Torch等,前三者號(hào)稱三大主流框架。

于是這里面就涉及一個(gè)問(wèn)題,為什么全世界最主流的三個(gè)框架——PaddlePaddle(來(lái)自百度)、Tensorflow(來(lái)自谷歌)、PyTorch(來(lái)自Facebook)都是來(lái)自于巨頭企業(yè),而不是科研院所或小公司呢?

簡(jiǎn)單說(shuō),開(kāi)發(fā)一個(gè)深度學(xué)習(xí)框架并不難,但要開(kāi)發(fā)一個(gè)能讓世界范圍內(nèi)開(kāi)發(fā)者廣泛使用的產(chǎn)業(yè)級(jí)深度學(xué)習(xí)框架,需要投入的人力和資源是極其巨大的,而且還需要海量的數(shù)據(jù)和強(qiáng)大的算力基礎(chǔ),后者更是大公司優(yōu)勢(shì)非常集中的領(lǐng)域。

接下來(lái)說(shuō)一點(diǎn)關(guān)于飛槳的問(wèn)題,大家可能注意到,飛槳對(duì)外開(kāi)源的時(shí)間是2016年。

這一年發(fā)生了什么呢?對(duì)AI行業(yè)來(lái)說(shuō),最重要的就是阿爾法Go戰(zhàn)勝李世石,掀起了全球?qū)τ谌斯ぶ悄艿牡谌ɡ顺?而且,和上世紀(jì)60年代和90年代的兩波浪潮相比,這一波浪潮有了算力、基礎(chǔ)設(shè)施和應(yīng)用場(chǎng)景的支持,是最接近于走入工業(yè)界,徹底改變數(shù)字世界運(yùn)行規(guī)則的一次。

而深度學(xué)習(xí)框架被認(rèn)為在AI領(lǐng)域的重要性,就相當(dāng)于PC時(shí)代的操作系統(tǒng)。

從微觀角度來(lái)看,對(duì)于百度這樣量級(jí)的企業(yè),通過(guò)開(kāi)源框架牢牢吸引開(kāi)發(fā)者,在自身平臺(tái)上不斷產(chǎn)生生態(tài)效應(yīng),孕育未來(lái)的AI時(shí)代現(xiàn)象級(jí)產(chǎn)品與應(yīng)用,是建立AI生態(tài)型企業(yè)的必由之路。

而從宏觀角度來(lái)看,在飛槳出現(xiàn)之前,中國(guó)的AI界在深度學(xué)習(xí)框架方面應(yīng)用的基本都是舶來(lái)品。

而就在飛槳開(kāi)源后不到1年的時(shí)間,國(guó)務(wù)院印發(fā)了《新一代人工智能發(fā)展框架》,明確提出在2030年中國(guó)要成為世界主要人工智能創(chuàng)新中心。

對(duì)于這一目標(biāo),飛槳就是基石和土壤,而且,絕不是一塊貧瘠的土壤。

在深度學(xué)習(xí)模型開(kāi)發(fā)、訓(xùn)練、預(yù)測(cè)和部署等方面,飛槳已可比肩TensorFlow、PyTorch等國(guó)際主流框架,并在多項(xiàng)技術(shù)上有優(yōu)于后者的表現(xiàn),而且,在中國(guó)市場(chǎng)范圍來(lái)看,PaddlePaddle有三個(gè)突出優(yōu)勢(shì)。

第一,飛槳擁有唯一提供適用中文文檔與數(shù)據(jù)集的開(kāi)發(fā)全棧服務(wù);

第二,飛槳的后發(fā)優(yōu)勢(shì),使得其模型庫(kù)、開(kāi)發(fā)套件、工具集甚至包括低代碼開(kāi)發(fā)工具都是最全的,這個(gè)對(duì)降低開(kāi)發(fā)難度的價(jià)值極大;

第三,也是我們后面還要著重講到的是,飛槳是基于在中國(guó)的千行百業(yè)中的產(chǎn)業(yè)實(shí)踐而誕生的,它從基因上和中國(guó)的智能化浪潮是同源的,也能夠更直接的適配中國(guó)的AI產(chǎn)業(yè)實(shí)踐。

今天的飛槳,已經(jīng)深深扎根于產(chǎn)業(yè)環(huán)境和開(kāi)發(fā)生態(tài)當(dāng)中,并且和產(chǎn)業(yè)形成了良性互動(dòng),開(kāi)發(fā)者面對(duì)的問(wèn)題,就是飛槳立刻會(huì)去解決的問(wèn)題。

因此,中國(guó)需要有自己的AI創(chuàng)新基礎(chǔ),有龐大的中國(guó)AI產(chǎn)業(yè)與開(kāi)發(fā)集群,這些產(chǎn)業(yè)和開(kāi)發(fā)者都需要適用于本土的框架體系,也自然會(huì)被飛槳的社區(qū)氛圍吸引。

這些年,中國(guó)的建設(shè)以前所未見(jiàn)的速度進(jìn)行,這也是中國(guó)之所以被稱作“基建狂魔”的原因。

而在AI時(shí)代,中國(guó)同樣也是“基建狂魔”,只不過(guò)這里的“基建”,已經(jīng)成了“新基建”,中國(guó)已經(jīng)錯(cuò)過(guò)了歷史上三次工業(yè)革命,顯然,“新基建”將幫助我們?cè)诘谒拇喂I(yè)革命開(kāi)始的時(shí)候,成為賽道里的頭部選手。

在過(guò)去30年里,中國(guó)制造解決了中國(guó)經(jīng)濟(jì)總量進(jìn)入世界前列的問(wèn)題,但在今天,傳統(tǒng)制造業(yè)的“動(dòng)能”已經(jīng)開(kāi)始減退,我們迫切需要改造千行百業(yè),不但升級(jí)制造業(yè),也通過(guò)通訊、AI與計(jì)算底層設(shè)施等的建造,更新整個(gè)社會(huì)的技術(shù)底座。

以深度學(xué)習(xí)為代表的第三代AI技術(shù),是中國(guó)引領(lǐng)第四次工業(yè)革命的重要推力,而飛槳?jiǎng)t是這一切的基石之一,未來(lái)的產(chǎn)業(yè)智能應(yīng)用,需要高度可用的“操作系統(tǒng)”作為底層算力、算法與行業(yè)應(yīng)用的協(xié)同樞紐——因此,無(wú)論是今天還是未來(lái),飛槳的戰(zhàn)略價(jià)值都與中國(guó)的發(fā)展期待緊密相連。

02

深度學(xué)習(xí)平臺(tái)的全景圖

A

深度學(xué)習(xí)平臺(tái)里有什么?

在2012年,百度將深度學(xué)習(xí)技術(shù)應(yīng)用于語(yǔ)音識(shí)別、OCR等領(lǐng)域,因?yàn)閼?yīng)用了AI技術(shù),百度“在語(yǔ)音識(shí)別準(zhǔn)確率方面,2012年一年的提升就比過(guò)去15年提升的總和還要多,也成為語(yǔ)音產(chǎn)品厚積薄發(fā)的最好機(jī)會(huì)。同樣,圖像識(shí)別技術(shù)應(yīng)用于全網(wǎng)搜索以后,以圖搜圖的準(zhǔn)確率一下子從20%提升到80%”,這兩個(gè)數(shù)字讓百度大為振奮。

深度學(xué)習(xí)的框架說(shuō)復(fù)雜也復(fù)雜,說(shuō)簡(jiǎn)單也簡(jiǎn)單,用一張圖就可以看明白,但弄懂就需要做些解釋。

簡(jiǎn)單的說(shuō),一切深度學(xué)習(xí)框架的共性,都是降低了開(kāi)發(fā)的門(mén)檻,不需要開(kāi)發(fā)者從復(fù)雜的神經(jīng)網(wǎng)絡(luò)開(kāi)始編代碼,可以根據(jù)需要選擇模型庫(kù)已有的模型,再通過(guò)訓(xùn)練得到模型參數(shù),當(dāng)然,開(kāi)發(fā)者也可以在已有模型的基礎(chǔ)上增加自己的優(yōu)化。

平臺(tái)最底層是被稱為“核心框架”的三大件,分別是開(kāi)發(fā)、訓(xùn)練和推理部署,所有的深度學(xué)習(xí)模型也都包含這三塊。

開(kāi)發(fā)最容易理解,其實(shí)就是編程。但是又不這么簡(jiǎn)單,這里涉及兩個(gè)小概念——?jiǎng)討B(tài)圖和靜態(tài)圖。

不論是動(dòng)態(tài)圖還是靜態(tài)圖,它們都屬于計(jì)算圖,本質(zhì)都是在描述運(yùn)算流程,過(guò)于技術(shù)化的差別在這里就不展開(kāi)了,但可以記住一點(diǎn),飛槳對(duì)于兩種模式都支持,還支持一鍵互轉(zhuǎn),這對(duì)于開(kāi)發(fā)者來(lái)說(shuō)很友好。

開(kāi)發(fā)完成的模型只是一個(gè)“半成品”,需要在數(shù)據(jù)上進(jìn)行學(xué)習(xí),這個(gè)過(guò)程就叫“訓(xùn)練”,這既是對(duì)開(kāi)發(fā)結(jié)果的檢驗(yàn),也是機(jī)器開(kāi)始產(chǎn)生“智能”的過(guò)程,因?yàn)橛?xùn)練的過(guò)程,既要關(guān)注如何搜索和求解模型參數(shù),又要發(fā)現(xiàn)訓(xùn)練數(shù)據(jù)中的規(guī)律,再反向優(yōu)化模型。

就好像一個(gè)設(shè)計(jì)師設(shè)計(jì)好了一套衣服,先手工縫紉,打出一些樣品,然后找些身形不同的模特來(lái)試穿,找到一些共性的問(wèn)題,然后不斷修正樣板,使之越來(lái)越“合身”。

這個(gè)過(guò)程是充滿挑戰(zhàn)的,因?yàn)榘殡S著大量的參數(shù)調(diào)整,而“調(diào)參”被認(rèn)為是能要開(kāi)發(fā)者半條命的難事兒。

但掌握了調(diào)參,更難的等在后面,那就是“模型部署”。

還是延續(xù)上面的例子,衣服“打樣”是手工的,主要是考慮是否合身、美觀,但要是上了生產(chǎn)線,那就是另一個(gè)問(wèn)題——這個(gè)模型到底適不適合大規(guī)模部署呢?

比如你給衣服設(shè)計(jì)了銅紐扣,但這個(gè)紐扣要安裝到服裝上特別耗時(shí),還容易脫落,那么它可能就不適合制衣廠的大規(guī)模流水線生產(chǎn),需要臨時(shí)修改設(shè)計(jì),改成塑料扣子。

人工智能模型也是,訓(xùn)練時(shí)你使用的是一套專有的硬件環(huán)境,但部署時(shí)可能是完全不一樣的另一套,那這里就有一個(gè)問(wèn)題——如何快速的、正確的把你辛辛苦苦訓(xùn)練得到的模型,部署到實(shí)際應(yīng)用環(huán)境中去。

我們?cè)谡劦斤w槳的時(shí)候,有一個(gè)詞其實(shí)很容易被忽略,那就是“產(chǎn)業(yè)級(jí)”深度學(xué)習(xí)平臺(tái)。

深度學(xué)習(xí)框架本身并不難,一個(gè)大學(xué)的實(shí)驗(yàn)室就可以搞出來(lái)一個(gè),但對(duì)于真正的產(chǎn)業(yè)級(jí)部署來(lái)說(shuō),要求的條件往往非常繁多而且苛刻,比如要適應(yīng)不同的硬件組合,所以真正的產(chǎn)業(yè)級(jí),都有一個(gè)硬標(biāo)準(zhǔn)——源于產(chǎn)業(yè)實(shí)踐。

換句話說(shuō),只有你參與過(guò)千行百業(yè)的AI模型部署的實(shí)踐,見(jiàn)過(guò)無(wú)數(shù)種千奇百怪的硬件組合,最后把和各種情況都能搭配的方案匯集起來(lái),產(chǎn)生一種類似于USB插口“即插即用”的特征,使得讓模型上線工作事半功倍,才能叫“產(chǎn)業(yè)級(jí)”。

飛槳在部署方面,就充分考慮到了這個(gè)問(wèn)題。比如,如果你的模型用于本地的服務(wù)器部署,那么Paddle Inference作為飛槳深度學(xué)習(xí)框架原生的高性能推理庫(kù),就可以做到即訓(xùn)即用。

有時(shí)候,模型并不部署在本地,而是在云端,飛槳就提供了Paddle Serving部署方案,允許把推理模塊放在云服務(wù)器上,客戶端發(fā)出請(qǐng)求,服務(wù)端返回推理結(jié)果。

還有的情況下,模型是部署在有一定計(jì)算能力的硬件如智能手機(jī)、智能攝像頭上,那飛槳就提供Paddle Lite部署方案,滿足高性能、輕量化的部署需求。

前面我們說(shuō)到了部署,其實(shí)這個(gè)問(wèn)題很復(fù)雜。如果你用過(guò)早期的電腦,你會(huì)發(fā)現(xiàn)一個(gè)問(wèn)題——每裝一個(gè)硬件,就要重新裝一遍驅(qū)動(dòng)程序。最后,微軟的Windows解決了這個(gè)問(wèn)題……怎么解決的呢,其實(shí)是用最笨的辦法,把市面上所有的主流硬件的驅(qū)動(dòng)程序都搜集起來(lái),裝在一個(gè)庫(kù)里,這樣你往電腦里添加任何主流硬件,都可以自動(dòng)安裝驅(qū)動(dòng)程序了。

AI模型的開(kāi)發(fā)也有這個(gè)問(wèn)題,因?yàn)閲@著提供AI算力這個(gè)問(wèn)題,有各種各樣的解決方案,有用CPU的、有GPU的、用專用AI加速芯片的、用手機(jī)上集成的超小型AI加速模塊的……而一個(gè)足夠?qū)I(yè)的學(xué)習(xí)框架,就是要重復(fù)前面說(shuō)到的微軟干過(guò)的事情,把每種主流硬件都找來(lái),一款款的適配,最終可以使得硬件可以高效運(yùn)行框架上的“算子”。

所謂算子(operator), 簡(jiǎn)單說(shuō)來(lái)就是進(jìn)行某種“操作“,比如做一次加法;與之對(duì)應(yīng)的,就是被操作的對(duì)象,稱之為操作數(shù)(operand),兩者的結(jié)合就是“算法”,算法則是“模型”的核心。

按照最新數(shù)據(jù),到2020年,飛槳共攜手20多家硬件廠商,適配芯片與IP型號(hào)29款。這個(gè)數(shù)字聽(tīng)起來(lái)不高,但是要考慮到每種硬件都要與基礎(chǔ)模型庫(kù)里的數(shù)百個(gè)模型適配,其實(shí)是極大的工作量。

為什么這么說(shuō)呢?因?yàn)檫m配不是只有一塊CPU或GPU就可以,它需要芯片廠商提供專業(yè)的團(tuán)隊(duì)和工具,而這些團(tuán)隊(duì)和工具總是優(yōu)先提供給開(kāi)發(fā)者多的框架的。所以,飛槳近年來(lái)適配硬件的直線上升,是這個(gè)框架越來(lái)越主流的一種外在表現(xiàn)。

值得一提的還有,在2020年里主動(dòng)提出要和飛槳適配的,有不少來(lái)自國(guó)產(chǎn)芯片企業(yè),原因也很簡(jiǎn)單,他們很擔(dān)心被迫與某些國(guó)際主流的框架脫鉤……而在這一刻,飛槳“自主可控”的深層次價(jià)值,顯露無(wú)疑。

總之,開(kāi)發(fā)、訓(xùn)練和部署,飛槳都一以貫之一個(gè)宗旨——從服務(wù)于實(shí)踐出發(fā),盡量的適合產(chǎn)業(yè)級(jí)開(kāi)發(fā)者真正的實(shí)戰(zhàn)級(jí)開(kāi)發(fā),有效、有用。

B

藏滿尖端武器的彈藥庫(kù)

深度學(xué)習(xí)框架存在的終極意義是什么呢?其實(shí)就是降低開(kāi)發(fā)的門(mén)檻,而要降低這個(gè)門(mén)檻,有兩個(gè)辦法——第一個(gè)是提供各種成熟的模型,讓你拿來(lái)改改就能用;另一個(gè)—-咱們稍后再說(shuō)。

所以,對(duì)于絕大多數(shù)不需要關(guān)注框架底層的開(kāi)發(fā)者來(lái)說(shuō),最關(guān)心的其實(shí)不是我們上面說(shuō)到的那些,而是關(guān)心一個(gè)深度學(xué)習(xí)框架究竟提供多少種模型。

而且,在底層框架上,飛槳提供了基礎(chǔ)模型庫(kù)、端到端開(kāi)發(fā)套件、工具組件以及飛槳企業(yè)版AI開(kāi)發(fā)雙平臺(tái),它們都是圍繞開(kāi)發(fā)而提供的“利器”,而且一個(gè)比一個(gè)具體和聚焦。

這里面的相互關(guān)系是怎么樣的呢?

基礎(chǔ)模型庫(kù)提供的是最基礎(chǔ)的模型,比如面對(duì)某個(gè)大領(lǐng)域,如NLP(自然語(yǔ)言處理),CV(圖像識(shí)別),這里面提供的就是最基礎(chǔ)、最必要的模型。打個(gè)比方說(shuō),如果你要開(kāi)個(gè)火鍋店,首先你要先去“基礎(chǔ)模型庫(kù)”,選擇一個(gè)基本模型,這個(gè)模型就叫《川菜大全》。

基礎(chǔ)模型庫(kù)上,是飛槳針對(duì)AI的某些熱門(mén)應(yīng)用門(mén)類,在基礎(chǔ)模型庫(kù)之上,更具體、指向性更強(qiáng)的某類模型和開(kāi)發(fā)工具。如果你需要進(jìn)階的、更專門(mén)的模型,就可以去端到端開(kāi)發(fā)套件里去找,比如,這里面可能可以找到《川菜火鍋配料大全》。

而工具組件針對(duì)是某些開(kāi)放式的領(lǐng)域,開(kāi)發(fā)者需要的不是固定的模型,而是某些研發(fā)的工具集的組合。這時(shí)候,要開(kāi)火鍋店的你,就可以去“工具組件”里轉(zhuǎn)一轉(zhuǎn),看能不能找到《火鍋店經(jīng)營(yíng)技巧》、《海底撈服務(wù)十四條》之類的參考書(shū)。

當(dāng)然,這個(gè)比喻又不免不太嚴(yán)密,但這里可以講一個(gè)數(shù)據(jù),基礎(chǔ)模型庫(kù)里有多少模型呢?真的不多,大概是270多種。

是的,飛槳官方支持超過(guò)270個(gè)的主流算法模型,涵蓋計(jì)算機(jī)視覺(jué)、自然語(yǔ)言處理、語(yǔ)音、推薦等多個(gè)領(lǐng)域,并且在動(dòng)態(tài)圖的訓(xùn)練效率和部署效率方面都有所提升。

也許你會(huì)說(shuō),太少了吧,不是某某平臺(tái)都說(shuō)自己有幾十萬(wàn)個(gè)模型么?

這里面需要注意的是,飛槳提出的是“基礎(chǔ)模型”,也就是最底層、覆蓋某一細(xì)分領(lǐng)域的“總綱”,而且這些模型都是經(jīng)過(guò)產(chǎn)業(yè)實(shí)踐長(zhǎng)期打磨、非常成熟、通用性非常強(qiáng)的;而有些平臺(tái)說(shuō)的十幾萬(wàn)、幾十萬(wàn)個(gè)模型,指的是開(kāi)發(fā)者基于這些基礎(chǔ)模型之上累計(jì)開(kāi)發(fā)過(guò)的具體模型。

因此,如果從更廣域的角度去看,2020年,飛槳帶來(lái)了全平臺(tái)的升級(jí)更新,已凝聚265萬(wàn)開(kāi)發(fā)者,基于飛槳平臺(tái)創(chuàng)建了超過(guò)34萬(wàn)個(gè)模型;服務(wù)企業(yè)超10萬(wàn)家,覆蓋金融、交通、物流等數(shù)十個(gè)行業(yè)。

△截圖自飛槳官網(wǎng)的部分服務(wù)行業(yè)

這一切都是中國(guó)在2030年成為世界級(jí)AI創(chuàng)新中心的基礎(chǔ)。

1  2  下一頁(yè)>  
聲明: 本文由入駐維科號(hào)的作者撰寫(xiě),觀點(diǎn)僅代表作者本人,不代表OFweek立場(chǎng)。如有侵權(quán)或其他問(wèn)題,請(qǐng)聯(lián)系舉報(bào)。

發(fā)表評(píng)論

0條評(píng)論,0人參與

請(qǐng)輸入評(píng)論內(nèi)容...

請(qǐng)輸入評(píng)論/評(píng)論長(zhǎng)度6~500個(gè)字

您提交的評(píng)論過(guò)于頻繁,請(qǐng)輸入驗(yàn)證碼繼續(xù)

  • 看不清,點(diǎn)擊換一張  刷新

暫無(wú)評(píng)論

暫無(wú)評(píng)論

    掃碼關(guān)注公眾號(hào)
    OFweek人工智能網(wǎng)
    獲取更多精彩內(nèi)容
    文章糾錯(cuò)
    x
    *文字標(biāo)題:
    *糾錯(cuò)內(nèi)容:
    聯(lián)系郵箱:
    *驗(yàn) 證 碼:

    粵公網(wǎng)安備 44030502002758號(hào)