機(jī)器學(xué)習(xí):開(kāi)啟智能創(chuàng)新之門(mén)
三、機(jī)器學(xué)習(xí):實(shí)現(xiàn)人工智能的高效方法
從廣義上來(lái)說(shuō),機(jī)器學(xué)習(xí)是一種能夠賦予機(jī)器學(xué)習(xí)的能力以此讓它完成直接編程無(wú)法完成的功能的方法。但從實(shí)踐的意義上來(lái)說(shuō),機(jī)器學(xué)習(xí)是一種通過(guò)利用數(shù)據(jù),訓(xùn)練出模型,然后使用模型預(yù)測(cè)的一種方法。國(guó)外有些學(xué)者對(duì)機(jī)器學(xué)習(xí)進(jìn)行了定義大同小異,有學(xué)者認(rèn)為,機(jī)器學(xué)習(xí)是對(duì)能通過(guò)經(jīng)驗(yàn)自動(dòng)改進(jìn)的計(jì)算機(jī)算法的研究;也有學(xué)者認(rèn)為,機(jī)器學(xué)習(xí)是指利用數(shù)據(jù)或以往的經(jīng)驗(yàn),以此優(yōu)化計(jì)算機(jī)程序的性能標(biāo)準(zhǔn)。由此可知,機(jī)器學(xué)習(xí)是通過(guò)經(jīng)驗(yàn)或數(shù)據(jù)來(lái)改進(jìn)算法的研究,通過(guò)算法讓機(jī)器從大量歷史數(shù)據(jù)中學(xué)習(xí)規(guī)律,得到某種模式并利用此模型預(yù)測(cè)未來(lái),機(jī)器在學(xué)習(xí)的過(guò)程中,處理的數(shù)據(jù)越多,預(yù)測(cè)結(jié)果就越精準(zhǔn)。
機(jī)器學(xué)習(xí)在人工智能的研究中具有十分重要的地位。它是人工智能的核心,是使計(jì)算機(jī)具有智能的根本途徑,其應(yīng)用遍及人工智能的各個(gè)領(lǐng)域。從20世紀(jì)50年代人們就開(kāi)始了對(duì)機(jī)器學(xué)習(xí)的研究,從最初的基于神經(jīng)元模型以及函數(shù)逼近論的方法研究,到以符號(hào)演算為基礎(chǔ)的規(guī)則學(xué)習(xí)和決策樹(shù)學(xué)習(xí)的產(chǎn)生,以及之后的認(rèn)知心理學(xué)中歸納、解釋、類(lèi)比等概念的引入,至最新的計(jì)算學(xué)習(xí)理論和統(tǒng)計(jì)學(xué)習(xí)的興起,機(jī)器學(xué)習(xí)一直都在相關(guān)學(xué)科的實(shí)踐應(yīng)用中起著主導(dǎo)作用,F(xiàn)在已取得了不少成就,并分化出許多研究方向,主要有符號(hào)學(xué)習(xí)、連接學(xué)習(xí)和統(tǒng)計(jì)學(xué)習(xí)等。
(一)機(jī)器學(xué)習(xí)的發(fā)展歷程
機(jī)器學(xué)習(xí)發(fā)展過(guò)程大體可分為以下四個(gè)階段:
1.50年代中葉到60年代中葉
在這個(gè)時(shí)期,所研究的是“沒(méi)有知識(shí)”的學(xué)習(xí),即“無(wú)知”學(xué)習(xí);其研究目標(biāo)是各類(lèi)自組織系統(tǒng)和自適應(yīng)系統(tǒng);其主要研究方法是不斷修改系統(tǒng)的控制參數(shù)以改進(jìn)系統(tǒng)的執(zhí)行能力,不涉及與具體任務(wù)有關(guān)的知識(shí)。指導(dǎo)本階段研究的理論基礎(chǔ)是早在40年代就開(kāi)始研究的神經(jīng)網(wǎng)絡(luò)模型。隨著電子計(jì)算機(jī)的產(chǎn)生和發(fā)展,機(jī)器學(xué)習(xí)的實(shí)現(xiàn)才成為可能。這個(gè)階段的研究導(dǎo)致了模式識(shí)別這門(mén)新科學(xué)的誕生,同時(shí)形成了機(jī)器學(xué)習(xí)的二種重要方法,即判別函數(shù)法和進(jìn)化學(xué)習(xí)。塞繆爾的下棋程序就是使用判別函數(shù)法的典型例子。不過(guò),這種脫離知識(shí)的感知型學(xué)習(xí)系統(tǒng)具有很大的局限性。無(wú)論是神經(jīng)模型、進(jìn)化學(xué)習(xí)或是判別函數(shù)法,所取得的學(xué)習(xí)結(jié)果都很有限,遠(yuǎn)不能滿(mǎn)足人們對(duì)機(jī)器學(xué)習(xí)系統(tǒng)的期望。在這個(gè)時(shí)期,我國(guó)研制了數(shù)字識(shí)別學(xué)習(xí)機(jī)。
2.60年代中葉至70年代中葉
本階段的研究目標(biāo)是模擬人類(lèi)的概念學(xué)習(xí)過(guò)程,并采用邏輯結(jié)構(gòu)或圖結(jié)構(gòu)作為機(jī)器內(nèi)部描述。機(jī)器能夠采用符號(hào)來(lái)描述概念(符號(hào)概念獲。,并提出關(guān)于學(xué)習(xí)概念的各種假設(shè)。本階段的代表性工作有溫斯頓(Winston)的結(jié)構(gòu)學(xué)習(xí)系統(tǒng)和海斯·羅思(Hayes Roth)等的基于邏輯的歸納學(xué)習(xí)系統(tǒng)。雖然這類(lèi)學(xué)習(xí)系統(tǒng)取得較大的成功,但只能學(xué)習(xí)單一概念,而且未能投入實(shí)際應(yīng)用。此外,神經(jīng)網(wǎng)絡(luò)學(xué)習(xí)機(jī)因理論缺陷未能達(dá)到預(yù)期效果而轉(zhuǎn)入低潮。因此,使那些對(duì)機(jī)器學(xué)習(xí)的進(jìn)展抱過(guò)大希望的人們感到失望。他們稱(chēng)這個(gè)時(shí)期為“黑暗時(shí)期”。
3.70年代中葉至80年代中葉
在這個(gè)時(shí)期,人們從學(xué)習(xí)單個(gè)概念擴(kuò)展到學(xué)習(xí)多個(gè)概念,探索不同的學(xué)習(xí)策略和各種學(xué)習(xí)方法。機(jī)器的學(xué)習(xí)過(guò)程一般都建立在大規(guī)模的知識(shí)庫(kù)上,實(shí)現(xiàn)知識(shí)強(qiáng)化學(xué)習(xí)。尤其令人鼓舞的是,本階段已開(kāi)始把學(xué)習(xí)系統(tǒng)與各種應(yīng)用結(jié)合起來(lái),并取得很大的成功,促進(jìn)機(jī)器學(xué)習(xí)的發(fā)展。在出現(xiàn)第一個(gè)專(zhuān)家學(xué)習(xí)系統(tǒng)之后,示例歸約學(xué)習(xí)系統(tǒng)成為研究主流,自動(dòng)知識(shí)獲取成為機(jī)器學(xué)習(xí)的應(yīng)用研究目標(biāo)。1980年,在美國(guó)的卡內(nèi)基梅隆大學(xué)(CMU)召開(kāi)了第一屆機(jī)器學(xué)習(xí)國(guó)際研討會(huì),標(biāo)志著機(jī)器學(xué)習(xí)研究已在全世界興起。此后,機(jī)器歸納學(xué)習(xí)進(jìn)入應(yīng)用。1986年,國(guó)際雜志《機(jī)器學(xué)習(xí)》(Machine Learning)創(chuàng)刊,迎來(lái)了機(jī)器學(xué)習(xí)蓬勃發(fā)展的新時(shí)期。70年代末,中國(guó)科學(xué)院自動(dòng)化研究所進(jìn)行質(zhì)譜分析和模式文法推斷研究,表明我國(guó)的機(jī)器學(xué)習(xí)研究得到恢復(fù)。1980年西蒙來(lái)華傳播機(jī)器學(xué)習(xí)的火種后,我國(guó)的機(jī)器學(xué)習(xí)研究出現(xiàn)了新局面。
4.機(jī)器學(xué)習(xí)最新階段始于1986年
一方面,由于神經(jīng)網(wǎng)絡(luò)研究的重新興起,對(duì)連接機(jī)制學(xué)習(xí)方法的研究方興未艾,機(jī)器學(xué)習(xí)的研究已經(jīng)在全世界范圍內(nèi)出現(xiàn)新的高潮,機(jī)器學(xué)習(xí)的基本理論和綜合系統(tǒng)的研究得到加強(qiáng)和發(fā)展。另一方面,對(duì)實(shí)驗(yàn)研究和應(yīng)用研究得到前所未有的重視,機(jī)器學(xué)習(xí)有了更強(qiáng)的研究手段和環(huán)境。從而出現(xiàn)了符號(hào)學(xué)習(xí)、神經(jīng)網(wǎng)絡(luò)學(xué)習(xí)、進(jìn)化學(xué)習(xí)和基于行為主義(actionism)的強(qiáng)化學(xué)習(xí)等百家爭(zhēng)鳴的局面。
圖2 機(jī)器學(xué)習(xí)的發(fā)展歷程
(二)機(jī)器學(xué)習(xí)的結(jié)構(gòu)模型
機(jī)器學(xué)習(xí)的本質(zhì)就是算法。算法是用于解決問(wèn)題的一系列指令。程序員開(kāi)發(fā)的用于指導(dǎo)計(jì)算機(jī)進(jìn)行新任務(wù)的算法是我們今天看到的先進(jìn)數(shù)字世界的基礎(chǔ)。計(jì)算機(jī)算法根據(jù)某些指令和規(guī)則,將大量數(shù)據(jù)組織到信息和服務(wù)中。機(jī)器學(xué)習(xí)向計(jì)算機(jī)發(fā)出指令,允許計(jì)算機(jī)從數(shù)據(jù)中學(xué)習(xí),而不需要程序員做出新的分步指令。
機(jī)器學(xué)習(xí)的基本過(guò)程是給學(xué)習(xí)算法提供訓(xùn)練數(shù)據(jù)。然后,學(xué)習(xí)算法基于數(shù)據(jù)的推論生成一組新的規(guī)則。這本質(zhì)上就是生成一種新的算法,稱(chēng)之為機(jī)器學(xué)習(xí)模型。通過(guò)使用不同的訓(xùn)練數(shù)據(jù),相同的學(xué)習(xí)算法可以生成不同的模型。從數(shù)據(jù)中推理出新的指令是機(jī)器學(xué)習(xí)的核心優(yōu)勢(shì)。它還突出了數(shù)據(jù)的關(guān)鍵作用:用于訓(xùn)練算法的可用數(shù)據(jù)越多,算法學(xué)習(xí)到的就越多。事實(shí)上,AI 的許多最新進(jìn)展并不是由于學(xué)習(xí)算法的激進(jìn)創(chuàng)新,而是現(xiàn)在積累了大量的可用數(shù)據(jù)。
圖3 機(jī)器學(xué)習(xí)的結(jié)構(gòu)模型
(三)機(jī)器學(xué)習(xí)的工作方式
1.選擇數(shù)據(jù):首先將原始數(shù)據(jù)分成三組:訓(xùn)練數(shù)據(jù)、驗(yàn)證數(shù)據(jù)和測(cè)試數(shù)據(jù);
2.?dāng)?shù)據(jù)建模:再使用訓(xùn)練數(shù)據(jù)來(lái)構(gòu)建使用相關(guān)特征的模型;
3.驗(yàn)證模型:使用驗(yàn)證數(shù)據(jù)輸入到已經(jīng)構(gòu)建的數(shù)據(jù)模型中;
4.測(cè)試模型:使用測(cè)試數(shù)據(jù)檢查被驗(yàn)證的模型的性能表現(xiàn);
5.使用模型:使用完全訓(xùn)練好的模型在新數(shù)據(jù)上做預(yù)測(cè);
6.調(diào)優(yōu)模型:使用更多數(shù)據(jù)、不同的特征或調(diào)整過(guò)的參數(shù)來(lái)提升算法的性能表現(xiàn)。
圖4 機(jī)器學(xué)習(xí)的工作方式
(四)機(jī)器學(xué)習(xí)發(fā)展的關(guān)鍵基石:
(1)海量數(shù)據(jù):人工智能的能量來(lái)源是穩(wěn)定的數(shù)據(jù)流。機(jī)器學(xué)習(xí)可以通過(guò)海量數(shù)據(jù)來(lái)“訓(xùn)練” 自己,才能開(kāi)發(fā)新規(guī)則來(lái)完成日益復(fù)雜的任務(wù)。目前全球有超過(guò)30億人在線(xiàn),約170 億個(gè)連接的設(shè)備或傳感器,產(chǎn)生了大量數(shù)據(jù),而數(shù)據(jù)存儲(chǔ)成本的降低,使得這些數(shù)據(jù)易于被使用。
(2)超強(qiáng)計(jì)算:強(qiáng)大的計(jì)算機(jī)和通過(guò)互聯(lián)網(wǎng)連接遠(yuǎn)程處理能力使可以處理海量數(shù)據(jù)的機(jī)器學(xué)習(xí)技術(shù)成為可能,具某媒體稱(chēng),ALPHGO之所以能在與對(duì)李世石的對(duì)決中取得歷史性的勝利,這與它硬件配置的1920個(gè)CPU和280個(gè)GPU超強(qiáng)運(yùn)算系統(tǒng)密不可分,可見(jiàn)計(jì)算能力對(duì)于機(jī)器學(xué)習(xí)是至關(guān)重要的。
(3)優(yōu)秀算法:在機(jī)器學(xué)習(xí)中,學(xué)習(xí)算法(learning algorithms)創(chuàng)建了規(guī)則,允許計(jì)算機(jī)從數(shù)據(jù)中學(xué)習(xí),從而推論出新的指令(算法模型),這也是機(jī)器學(xué)習(xí)的核心優(yōu)勢(shì)。新的機(jī)器學(xué)習(xí)技術(shù),特別是分層神經(jīng)網(wǎng)絡(luò),也被稱(chēng)為“深度學(xué)習(xí)”,啟發(fā)了新的服務(wù),刺激了對(duì)人工智能這一領(lǐng)域其他方面的投資和研究。
圖5 機(jī)器學(xué)習(xí)的關(guān)鍵基石

發(fā)表評(píng)論
登錄
手機(jī)
驗(yàn)證碼
立即登錄即可訪(fǎng)問(wèn)所有OFweek服務(wù)
還不是會(huì)員?免費(fèi)注冊(cè)
忘記密碼請(qǐng)輸入評(píng)論內(nèi)容...
請(qǐng)輸入評(píng)論/評(píng)論長(zhǎng)度6~500個(gè)字
圖片新聞
最新活動(dòng)更多
-
7月8日立即報(bào)名>> 【在線(xiàn)會(huì)議】英飛凌新一代智能照明方案賦能綠色建筑與工業(yè)互聯(lián)
-
7月22-29日立即報(bào)名>> 【線(xiàn)下論壇】第三屆安富利汽車(chē)生態(tài)圈峰會(huì)
-
7月31日免費(fèi)預(yù)約>> OFweek 2025具身機(jī)器人動(dòng)力電池技術(shù)應(yīng)用大會(huì)
-
7.30-8.1火熱報(bào)名中>> 全數(shù)會(huì)2025(第六屆)機(jī)器人及智能工廠(chǎng)展
-
免費(fèi)參會(huì)立即報(bào)名>> 7月30日- 8月1日 2025全數(shù)會(huì)工業(yè)芯片與傳感儀表展
-
即日-2025.8.1立即下載>> 《2024智能制造產(chǎn)業(yè)高端化、智能化、綠色化發(fā)展藍(lán)皮書(shū)》
推薦專(zhuān)題
- 1 AI 眼鏡讓百萬(wàn) APP「集體失業(yè)」?
- 2 一文看懂視覺(jué)語(yǔ)言動(dòng)作模型(VLA)及其應(yīng)用
- 3 豆包前負(fù)責(zé)人喬木出軌BP后續(xù):均被辭退
- 4 “支付+”時(shí)代,支付即生態(tài) | 2025中國(guó)跨境支付十大趨勢(shì)
- 5 中國(guó)最具實(shí)力AI公司TOP10
- 6 國(guó)家數(shù)據(jù)局局長(zhǎng)劉烈宏調(diào)研格創(chuàng)東智
- 7 AI的夏天:第四范式VS云從科技VS地平線(xiàn)機(jī)器人
- 8 深圳跑出40億超級(jí)隱形冠軍:賣(mài)機(jī)器人年入6.1億,港股上市
- 9 上海跑出80億超級(jí)獨(dú)角獸:獲上市公司戰(zhàn)投,干人形機(jī)器人
- 10 一場(chǎng)大廠(chǎng)關(guān)于人形機(jī)器人的“生態(tài)暗戰(zhàn)”