摘譯:認(rèn)知體系研究綜述|深蘭科技
作為人工智能的一個(gè)重要分支,認(rèn)知體系的研究和應(yīng)用經(jīng)過(guò)了近40年的發(fā)展,已取得了可見的成果。前兩期內(nèi)容對(duì)認(rèn)知體系的概念、感知和注意力進(jìn)行了介紹,本期將繼續(xù)分享關(guān)于行動(dòng)選擇和記憶的部分。
一般來(lái)說(shuō),行動(dòng)選擇決定在什么時(shí)間要做些什么,被分為“做什么”(即做什么決策)和“怎樣做”(即動(dòng)作如何控制)。例如,在MIDAS體系,行動(dòng)選擇包含了目標(biāo)任務(wù)和執(zhí)行這個(gè)選擇的動(dòng)作或行動(dòng)。同樣的,在MIDCA中,下一個(gè)動(dòng)作通常是從一個(gè)被計(jì)劃好的序列中選擇出來(lái)的(如果這個(gè)序列存在的話)。因?yàn)樵诓煌恼J(rèn)知體系中,行動(dòng)選擇的方法是不同的。在接下來(lái)的討論中,行動(dòng)選擇機(jī)制可應(yīng)用于決策和動(dòng)作。
圖1行動(dòng)選擇所涉及的機(jī)制
圖1顯示了所有被執(zhí)行的行動(dòng)選擇機(jī)制,根據(jù)相關(guān)的體系類型(符號(hào)、混合、涌現(xiàn))來(lái)組織。執(zhí)行行動(dòng)選擇的主要兩種方式:計(jì)劃和動(dòng)態(tài)。計(jì)劃是事先制定一系列的步驟以達(dá)到一個(gè)確定的目標(biāo)。在動(dòng)態(tài)的行動(dòng)選擇中,一個(gè)最好的動(dòng)作是從其他方案中被選擇出來(lái)的,基于當(dāng)時(shí)可獲得的知識(shí)。對(duì)于這個(gè)類別,我們考慮選擇的類別(贏者通吃、概率、預(yù)定義)和選擇的標(biāo)準(zhǔn)(相關(guān)性、效用、感情)。默認(rèn)選項(xiàng)一直是基于給定的標(biāo)準(zhǔn)做出的最好的動(dòng)作(有最高激活水平的動(dòng)作)。
最后,學(xué)習(xí)也可以影響行動(dòng)選擇,但會(huì)在第8節(jié)中討論。注意,這些行動(dòng)選擇機(jī)制并不互相排斥并且大多數(shù)體系中有不止一種機(jī)制。盡管很少的體系會(huì)執(zhí)行同樣的行動(dòng)選擇機(jī)制,可行的組合空間通常會(huì)很大。
圖1中可視化分為三列:符號(hào)、混合和涌現(xiàn)。注意,在這個(gè)圖中,排序順序強(qiáng)調(diào)具有相似動(dòng)作的選擇機(jī)制(或分別為記憶和學(xué)習(xí)方法)的體系結(jié)構(gòu)簇。
1.1 計(jì)劃與反應(yīng)式動(dòng)作
可以預(yù)見的是,計(jì)劃型行動(dòng)選擇在符號(hào)范式體系中更加常見,但是也能在一些混合的甚至是涌現(xiàn)范式體系中被發(fā)現(xiàn)。尤其是在任務(wù)分解中,當(dāng)目標(biāo)被遞歸地分解成子目標(biāo),任務(wù)分解是計(jì)劃動(dòng)作的一種非常常見的形式。
其他被使用的計(jì)劃動(dòng)作的類型有:暫時(shí)性的、連續(xù)性的、層級(jí)性任務(wù)網(wǎng)絡(luò)的、生成式的、基于搜索的、局部擇優(yōu)的等等。在我們的選擇中,很少有體系僅僅只依賴于計(jì)劃,例如OSCAR做邏輯推理和IMPRINT使用任務(wù)分解來(lái)模擬人類行動(dòng)。除此之外,計(jì)劃型行動(dòng)選擇經(jīng)常利用加強(qiáng)動(dòng)態(tài)的行動(dòng)選擇機(jī)制,來(lái)提升對(duì)變化的環(huán)境的適應(yīng)性。
1.2 動(dòng)態(tài)行動(dòng)選擇
動(dòng)態(tài)行動(dòng)選擇能提供更多靈活性,并且能被用來(lái)模擬人類和動(dòng)物。“贏者通吃”是神經(jīng)網(wǎng)絡(luò)中的一種選擇策略(最強(qiáng)的輸入被增強(qiáng)而其余的被抑制),它和它的變異體在各種新興體系中很常見。同樣的機(jī)制也被用來(lái)在所有體系中尋找最適合的動(dòng)作,通常行動(dòng)是多個(gè)并行過(guò)程的合作和競(jìng)爭(zhēng)的結(jié)果。
行動(dòng)選擇的預(yù)定義序(方式)可能服務(wù)于不同目的。比如,在Subsumption體系中,機(jī)器人行動(dòng)被附屬行動(dòng)等級(jí)所表示,高級(jí)行動(dòng)優(yōu)先于(包含)低級(jí)行動(dòng)的輸出。
在FORR中,做決策的部分根據(jù)遞增順序來(lái)從顧問(wèn)中考慮選項(xiàng),以達(dá)到與人類成員類似的學(xué)習(xí)。在YMIR中,優(yōu)先級(jí)首先被給與到反應(yīng)層中的過(guò)程中,然后是內(nèi)容層,再是過(guò)程控制層。這里,目的是提供一個(gè)平滑的實(shí)時(shí)行動(dòng)生成。每層有一個(gè)不同的認(rèn)知反應(yīng)時(shí)間上限,因此,反應(yīng)式模塊為用戶提供自動(dòng)的反饋(變化的臉部表情、自動(dòng)發(fā)聲),而審議性模塊生成更復(fù)雜的行動(dòng)。剩余的行動(dòng)選擇機(jī)制包含有限狀態(tài)機(jī)制,被經(jīng)常用來(lái)表示動(dòng)作的順序甚至來(lái)編譯整個(gè)系統(tǒng)的行動(dòng),概率行動(dòng)選擇也常見。
行動(dòng)選擇標(biāo)準(zhǔn)
在選擇下一個(gè)動(dòng)作時(shí),有多個(gè)標(biāo)準(zhǔn)要被考慮到:相關(guān)性、效用和感情(包括動(dòng)機(jī)、情感狀態(tài)、情緒、心情、積極性等)。
相關(guān)性反映出動(dòng)作有多么契合現(xiàn)在的情況,這主要應(yīng)用于有符號(hào)范式推理的系統(tǒng)和在應(yīng)用前測(cè)試規(guī)則前/后的條件。動(dòng)作的效用是測(cè)量為了達(dá)到現(xiàn)有目標(biāo)的期望貢獻(xiàn)。一些體系也會(huì)執(zhí)行候選動(dòng)作的“干運(yùn)行(dry run)”,并觀察他們的效果來(lái)決定他們的效用。效用也會(huì)考慮到過(guò)去動(dòng)作的表現(xiàn)并在將來(lái)通過(guò)強(qiáng)化學(xué)習(xí)來(lái)促進(jìn)行動(dòng)的成長(zhǎng)。其他機(jī)器學(xué)習(xí)技術(shù)也可以被用來(lái)把過(guò)去的成功行動(dòng)和目標(biāo)做關(guān)聯(lián)。最后,內(nèi)部因素并不直接決定下一個(gè)行動(dòng),但是會(huì)使選擇存在偏差。
簡(jiǎn)單來(lái)說(shuō),我們會(huì)考慮關(guān)聯(lián)到情緒、積極性和人類個(gè)性特征的短期、長(zhǎng)期和終身因素;谶@些因素對(duì)于人類的決策和其他認(rèn)知能力的影響,在認(rèn)知體系中模擬情緒和情感是重要的,特別在人機(jī)交互、社交機(jī)器人和虛擬代理的領(lǐng)域。

發(fā)表評(píng)論
請(qǐng)輸入評(píng)論內(nèi)容...
請(qǐng)輸入評(píng)論/評(píng)論長(zhǎng)度6~500個(gè)字
最新活動(dòng)更多
-
6月20日立即下載>> 【白皮書】精準(zhǔn)測(cè)量 安全高效——福祿克光伏行業(yè)解決方案
-
7月3日立即報(bào)名>> 【在線會(huì)議】英飛凌新一代智能照明方案賦能綠色建筑與工業(yè)互聯(lián)
-
7月22-29日立即報(bào)名>> 【線下論壇】第三屆安富利汽車生態(tài)圈峰會(huì)
-
7.30-8.1火熱報(bào)名中>> 全數(shù)會(huì)2025(第六屆)機(jī)器人及智能工廠展
-
7月31日免費(fèi)預(yù)約>> OFweek 2025具身機(jī)器人動(dòng)力電池技術(shù)應(yīng)用大會(huì)
-
免費(fèi)參會(huì)立即報(bào)名>> 7月30日- 8月1日 2025全數(shù)會(huì)工業(yè)芯片與傳感儀表展
推薦專題
- 1 AI 眼鏡讓百萬(wàn) APP「集體失業(yè)」?
- 2 大廠紛紛入局,百度、阿里、字節(jié)搶奪Agent話語(yǔ)權(quán)
- 3 深度報(bào)告|中國(guó)AI產(chǎn)業(yè)正在崛起成全球力量,市場(chǎng)潛力和關(guān)鍵挑戰(zhàn)有哪些?
- 4 上海跑出80億超級(jí)獨(dú)角獸:獲上市公司戰(zhàn)投,干人形機(jī)器人
- 5 一文看懂視覺語(yǔ)言動(dòng)作模型(VLA)及其應(yīng)用
- 6 國(guó)家數(shù)據(jù)局局長(zhǎng)劉烈宏調(diào)研格創(chuàng)東智
- 7 下一代入口之戰(zhàn):大廠為何紛紛押注智能體?
- 8 百億AI芯片訂單,瘋狂傾銷中東?
- 9 Robotaxi新消息密集釋放,量產(chǎn)元年誰(shuí)在領(lǐng)跑?
- 10 格斗大賽出圈!人形機(jī)器人致命短板曝光:頭腦過(guò)于簡(jiǎn)單