首頁 > 資訊 > 科技 > 正文

新舊知識難共存 治療AI“健忘癥”還難有良策

2020-04-22 16:35:55來源:科技日報

很多人在上學(xué)的時候都有這樣的經(jīng)歷,在經(jīng)過了一個寒假返校后,發(fā)現(xiàn)前一學(xué)期學(xué)到的內(nèi)容有的已經(jīng)忘了。在見識過人工智能PK人類的屢屢勝績后,...

很多人在上學(xué)的時候都有這樣的經(jīng)歷,在經(jīng)過了一個寒假返校后,發(fā)現(xiàn)前一學(xué)期學(xué)到的內(nèi)容有的已經(jīng)忘了。在見識過人工智能PK人類的屢屢勝績后,有人不免羨慕AI強大的學(xué)習(xí)本領(lǐng),但事實上人工智能的“記性”并不如你想象的那樣好,如果你像人工智能系統(tǒng)那樣學(xué)習(xí),很可能在學(xué)習(xí)新知識的同時,大腦便會逐漸忘了之前的內(nèi)容,其原因就在于人工智能遭遇了“災(zāi)難性遺忘”。

近日,來自谷歌大腦的最新研究發(fā)現(xiàn),在街機學(xué)習(xí)環(huán)境的由多個子任務(wù)組成的單任務(wù)場景中也存在著“災(zāi)難性遺忘”。特別像在“蒙特祖瑪復(fù)仇”這種探索型游戲里,場景變化較大,會出現(xiàn)學(xué)習(xí)完當(dāng)前游戲場景后,忘記上一個游戲場景知識的情況。

那么人工智能為什么會產(chǎn)生“災(zāi)難性遺忘”?目前解決“災(zāi)難性遺忘”的方案有哪些?難點在哪?就此,科技日報記者采訪了有關(guān)專家。

學(xué)一個忘一個 深度學(xué)習(xí)效率低下

自從阿爾法圍棋(AlphaGo)相繼戰(zhàn)勝多名圍棋冠軍后,深度學(xué)習(xí)已經(jīng)成為眾多實現(xiàn)人工智能的方法中最耀眼的“明星”,也是各大研發(fā)機構(gòu)角逐的主戰(zhàn)場。而谷歌大腦團隊這次面臨的“災(zāi)難性遺忘”,正是人工智能深度學(xué)習(xí)中所面臨的一個普遍且嚴(yán)重的問題。

“‘災(zāi)難性遺忘’指的是人工智能系統(tǒng),如深度學(xué)習(xí)模型,在學(xué)習(xí)新任務(wù)或適應(yīng)新環(huán)境時,忘記或喪失了以前習(xí)得的一些能力。”騰訊人工智能實驗室副主任俞棟博士在接受科技日報記者采訪時說,“災(zāi)難性遺忘”會造成人工智能系統(tǒng)在原有任務(wù)或環(huán)境中的性能大幅下降。

美亞柏科信息中心總經(jīng)理魏朝東介紹,在深度神經(jīng)網(wǎng)絡(luò)學(xué)習(xí)不同任務(wù)的時候,相關(guān)權(quán)重的快速變化會損害先前任務(wù)的表現(xiàn),通俗來說,就是在學(xué)習(xí)中像猴子搬苞谷,撿一個丟一個,記住了新知識,也有可能會忘掉了老知識。

正是源于此,“災(zāi)難性遺忘”的存在,一定程度上限制了人工智能在一些場景中的應(yīng)用。

福州大學(xué)數(shù)學(xué)與計算機科學(xué)學(xué)院、福建省新媒體行業(yè)技術(shù)開發(fā)基地副主任柯逍博士舉例說,如一個AI圖像識別系統(tǒng),當(dāng)需要添加一個新的類別的物體時,就不得不把原先的所有物體都再學(xué)習(xí)一次。如在文物鑒定系統(tǒng)中,當(dāng)有一天發(fā)現(xiàn)原始數(shù)據(jù)中有一個文物朝代錯了,便沒辦法單獨對這一個錯誤的文物進行修改學(xué)習(xí);再如讓AI系統(tǒng)學(xué)習(xí)英語之后,再讓它學(xué)習(xí)德語,它可能會把原來學(xué)習(xí)的英語語法全部忘光。

那么在谷歌大腦的最新研究中,“災(zāi)難性遺忘”又造成了哪些影響?其中又有何新發(fā)現(xiàn)?

“除了傳統(tǒng)的新知識學(xué)習(xí)會覆蓋舊知識之外,這次谷歌大腦還發(fā)現(xiàn),在如‘超級瑪麗’等探索型游戲里,‘災(zāi)難性遺忘’會阻礙模型對新知識的學(xué)習(xí)。”廈門大學(xué)科技處副處長、人工智能系教授紀(jì)榮嶸說。

紀(jì)榮嶸進一步解釋說,面向街機游戲?qū)W習(xí)的強化學(xué)習(xí)方法都會采用“經(jīng)驗回放”的訓(xùn)練方式,就是將模型在游戲探索時候的片段進行保存,然后給模型進行“回放”訓(xùn)練。而像“蒙特祖瑪復(fù)仇”這種游戲,游戲場景變化比較大,模型需要不間斷探索游戲場景,因此,在訓(xùn)練時候就必須不斷回放早期場景的游戲經(jīng)驗,不然會因為“災(zāi)難性遺忘”而忘記了早期的游戲知識。

“這也導(dǎo)致了新的游戲經(jīng)驗雖然能夠被采樣到‘經(jīng)驗回放’庫里,但因為學(xué)習(xí)方式的設(shè)定,導(dǎo)致學(xué)習(xí)效率低,同時由于不同階段的學(xué)習(xí)會互相干擾,使得AI無法一次通過該游戲的全部關(guān)卡。”紀(jì)榮嶸說。

AI“腦容量”存上限 新舊知識難共存

AI為什么會產(chǎn)生“災(zāi)難性遺忘”?

“深度學(xué)習(xí)的結(jié)構(gòu)一旦確定,在訓(xùn)練過程中很難調(diào)整。神經(jīng)網(wǎng)絡(luò)的結(jié)構(gòu)直接決定學(xué)習(xí)模型的容量。”柯逍說,AI“腦容量”存在上限,也就導(dǎo)致了人工智能只能有限地處理特定任務(wù)。就像水桶一半高的地方有個洞,以至于無論怎么增加水桶的高度,這個水桶只能裝一半高的水。

中科院自動化所腦網(wǎng)絡(luò)組研究中心研究員、模式識別國家重點實驗室副主任余山指出,這還涉及到神經(jīng)網(wǎng)絡(luò)學(xué)習(xí)知識的機制。在單個任務(wù)的訓(xùn)練過程中,網(wǎng)絡(luò)中各個神經(jīng)元之間的連接權(quán)重進行了專門的調(diào)整,以勝任當(dāng)前的任務(wù)。而在新任務(wù)的訓(xùn)練中,連接權(quán)重要針對新任務(wù)進行調(diào)整,這將“抹去”適應(yīng)舊任務(wù)的原有結(jié)構(gòu),導(dǎo)致在舊任務(wù)上的性能大大下降。

人類的記憶能力其實是有限的,但為何出現(xiàn)“災(zāi)難性遺忘”的情況卻比較少?“主要是人類在學(xué)習(xí)過程當(dāng)中,大腦能夠主動保留有用的知識和技巧,同時不影響新的信息獲取。” 紀(jì)榮嶸說,但現(xiàn)在的人工智能模型大部分是基于隨機梯度下降來更新模型參數(shù),這個過程主要服務(wù)于當(dāng)前任務(wù)的優(yōu)化,并不會去評估哪些參數(shù)權(quán)重對舊的知識是有用的,所以就很容易出現(xiàn)知識被覆蓋的情況。

紀(jì)榮嶸也表示,當(dāng)前像Siri或小愛這樣的人工智能助手產(chǎn)品,還不能算真正意義上的通用人工智能,一方面,這些人工智能助手只能在預(yù)設(shè)的知識范圍內(nèi)和人類互動,完成指令;另一方面,人類沒辦法像養(yǎng)寵物或養(yǎng)小孩一樣,通過互動去教導(dǎo)這些人工智能助手學(xué)習(xí)新的知識或新的指令。

有多個解決方案 但都治標(biāo)不治本

據(jù)了解,破解“災(zāi)難性遺忘”是實現(xiàn)通用人工智能的一個關(guān)鍵。解決了“災(zāi)難性遺忘”問題,就意味著模型具備了持續(xù)學(xué)習(xí)的能力, 可以像人類一樣不斷獲取新的知識、新的技能,同時能夠最大化地保持舊的經(jīng)驗知識和技巧。

那么,目前解決“災(zāi)難性遺忘”的方案有哪些?

“最常見的方式是多任務(wù)學(xué)習(xí), 就是把所有任務(wù)的訓(xùn)練數(shù)據(jù)同時放到一起,模型就可以針對多種任務(wù)進行聯(lián)合優(yōu)化。”紀(jì)榮嶸舉例說,如讓模型同時學(xué)習(xí)“坦克大戰(zhàn)”和“超級瑪麗”兩個任務(wù),等兩個任務(wù)同時學(xué)的差不多的時候,模型才停止訓(xùn)練。

但柯逍也指出,這種方式隨著任務(wù)增多,新任務(wù)樣本數(shù)量被稀釋,訓(xùn)練會拖慢學(xué)習(xí)新知識的效率,并且不是任何情況都能獲得先前任務(wù)的數(shù)據(jù)來復(fù)習(xí)的。

還有的解決方案是根據(jù)新的任務(wù)知識來擴充模型結(jié)構(gòu),保證舊的知識經(jīng)驗不被損害。此次,谷歌大腦所提出的“記憶碎片觀察”方法正是對不同任務(wù)(場景)構(gòu)建多個人工智能模型來進行學(xué)習(xí)。“模型擴充的方式從本質(zhì)上并沒有解決‘災(zāi)難性遺忘’的問題,只是用多個模型來替代單個模型去學(xué)習(xí)多種任務(wù),避免舊參數(shù)被覆蓋。”紀(jì)榮嶸說。

當(dāng)前,解決“災(zāi)難性遺忘”還存在著一對矛盾:在學(xué)習(xí)新任務(wù)的過程中,需要給予網(wǎng)絡(luò)足夠多的自由度進行連接權(quán)重調(diào)整,但是又要避免這樣的調(diào)整“抹去”原有的記憶。

“因此,科學(xué)家們開始設(shè)計新的學(xué)習(xí)算法解決上述矛盾,使得網(wǎng)絡(luò)在進行權(quán)重調(diào)整的時候,對已有知識的影響最小化。”余山表示,其團隊近期提出的正交權(quán)重修改算法,就屬于這類,主要通過限制權(quán)重修改只能在舊任務(wù)的解空間中進行,這一算法較好的克服了“災(zāi)難性遺忘”,使得同一個分類器網(wǎng)絡(luò)可以連續(xù)學(xué)習(xí)多達數(shù)千個類別的識別。

魏朝東認(rèn)為,雖然科學(xué)家們已經(jīng)探索出多種解決方案,但目前的AI學(xué)習(xí)只是從認(rèn)知科學(xué)中獲得了一小部分靈感,對大腦的模擬還沒達到人們想象的高度,大部分AI學(xué)習(xí)方案是“先天不足”的。“災(zāi)難性遺忘”是一個綜合性問題,不僅需要有理論支撐,未來還需要有可行的技術(shù)手段去實現(xiàn)。(記者 謝開飛 通訊員 歐陽桂蓮 許曉鳳 王憶希)

責(zé)任編輯:孫知兵

免責(zé)聲明:本文僅代表作者個人觀點,與太平洋財富網(wǎng)無關(guān)。其原創(chuàng)性以及文中陳述文字和內(nèi)容未經(jīng)本站證實,對本文以及其中全部或者部分內(nèi)容、文字的真實性、完整性、及時性本站不作任何保證或承諾,請讀者僅作參考,并請自行核實相關(guān)內(nèi)容。
如有問題,請聯(lián)系我們!

主站蜘蛛池模板: 亚洲成人高清在线观看| 成人av电影网站| 日韩成人精品日本亚洲| 欧美国产成人精品一区二区三区| 日本成人在线视频网站| 国产成人高清视频| 青青草国产精品欧美成人| 成人亚洲综合天堂| 噜噜噜亚洲色成人网站| 欧洲国产成人精品91铁牛tv| 国产成人综合久久亚洲精品| 亚洲国产成人久久一区二区三区| 欧美成人在线免费| 国产成人久久一区二区三区| 69国产成人精品午夜福中文| 国产成人愉拍精品| 最新69国产成人精品视频69| 国产成人亚洲毛片| 成人福利在线视频| 四虎影视永久地址四虎影视永久地址www成人 | 成人一级片在线观看| 国产成人AV免费观看| 欧美成人高清WW| 免费视频成人片在线观看| 成人免费男女视频网站慢动作| 7777奇米四色成人眼影| 亚洲成人免费网址| 国产成人18黄网站麻豆| 国产成人精品综合久久久久| 成人精品视频一区二区三区| 亚洲国产aⅴ成人精品无吗| 国产成人一区二区三区精品久久 | 国内成人精品亚洲日本语音| 欧美国产成人精品一区二区三区 | 国产成人高清亚洲一区app| 成人欧美一区二区三区黑人3p | 精品久久久久久成人AV| 蜜桃97爱成人| 成人黄色小说网站| 成人国产午夜在线视频| 成人午夜在线视频|