《電子技術(shù)應(yīng)用》
您所在的位置:首頁 > 可編程邏輯 > 業(yè)界動態(tài) > 深度森林第三彈:周志華組提出可做表征學(xué)習(xí)的多層梯度提升決策樹

深度森林第三彈:周志華組提出可做表征學(xué)習(xí)的多層梯度提升決策樹

2018-06-05

自去年周志華等研究者提出了「深度森林」以后,這種新型的層級表征方式吸引了很多研究者的關(guān)注。今日,南京大學(xué)的馮霽、俞揚(yáng)和周志華提出了多層梯度提升決策樹模型,它通過堆疊多個(gè)回歸 GBDT 層作為構(gòu)建塊,并探索了其學(xué)習(xí)層級表征的能力。此外,與層級表征的神經(jīng)網(wǎng)絡(luò)不同,他們提出的方法并不要求每一層都是可微,也不需要使用反向傳播更新參數(shù)。因此,多層分布式表征學(xué)習(xí)不僅有深度神經(jīng)網(wǎng)絡(luò),同時(shí)還有決策樹!


近十年來,深層神經(jīng)網(wǎng)絡(luò)的發(fā)展在機(jī)器學(xué)習(xí)領(lǐng)域取得了顯著進(jìn)展。通過構(gòu)建分層或「深層」結(jié)構(gòu),該模型能夠在有監(jiān)督或無監(jiān)督的環(huán)境下從原始數(shù)據(jù)中學(xué)習(xí)良好的表征,這被認(rèn)為是其成功的關(guān)鍵因素。成功的應(yīng)用領(lǐng)域包括計(jì)算機(jī)視覺、語音識別、自然語言處理等 [1]。


目前,幾乎所有的深層神經(jīng)網(wǎng)絡(luò)都使用具有隨機(jī)梯度下降的反向傳播 [2,3] 作為訓(xùn)練過程中更新參數(shù)的幕后主力軍。實(shí)際上,當(dāng)模型由可微分量(例如,具有非線性激活函數(shù)的加權(quán)和)組成時(shí),反向傳播似乎仍是當(dāng)前的最佳選擇。其他一些方法如目標(biāo)傳播 [4] 已經(jīng)被作為訓(xùn)練神經(jīng)網(wǎng)絡(luò)的替代方法被提出,但其效果和普及還處于早期階段。例如,[5_]_的研究表明,目標(biāo)傳播最多可達(dá)到和反向傳播一樣的效果,并且實(shí)際上常常需要額外的反向傳播來進(jìn)行微調(diào)。換句話說,老掉牙的反向傳播仍然是訓(xùn)練神經(jīng)網(wǎng)絡(luò)等可微分學(xué)習(xí)系統(tǒng)的最好方法。


另一方面,探索使用非可微模塊來構(gòu)建多層或深度模型的可能性的需求不僅僅是學(xué)界的興趣所在,其在現(xiàn)實(shí)應(yīng)用上也有很大的潛力。例如,基于樹的集成(例如隨機(jī)森林 [6] 或梯度提升決策樹(GBDT)[7] 仍然是多個(gè)領(lǐng)域中建模離散或表格數(shù)據(jù)的主要方式,為此在這類數(shù)據(jù)上使用樹集成來獲得分層分布式表征是個(gè)很有趣的研究方向。在這樣的案例中,由于不能使用鏈?zhǔn)椒▌t來傳播誤差,反向傳播不再可行。這引發(fā)了兩個(gè)基本的問題:首先,我們是否可以用非可微組件構(gòu)建多層模型,從而中間層的輸出可以被當(dāng)作分布式表征?其次,如果是這樣,如何在沒有反向傳播的幫助下,聯(lián)合地訓(xùn)練這種模型?本文的目的就在于提供這種嘗試。


近期 Zhou 和 Feng [8] 提出了深度森林框架,這是首次嘗試使用樹集成來構(gòu)建多層模型的工作。具體來說,通過引入細(xì)粒度的掃描和級聯(lián)操作(cascading operation),該模型可以構(gòu)建多層結(jié)構(gòu),該結(jié)構(gòu)具備適應(yīng)性模型復(fù)雜度,且能夠在多種類型的任務(wù)上取得有競爭力的性能。[8] 提出的 gcForest 模型利用了集成學(xué)習(xí)多樣性增強(qiáng)的各種策略,然而該方法僅適用于監(jiān)督學(xué)習(xí)設(shè)置。同時(shí),該論文仍然不清楚如何利用森林來構(gòu)建多層模型,并明確地測試其表征學(xué)習(xí)能力。由于很多之前的研究者認(rèn)為,多層分布式表征 [9] 可能是深度神經(jīng)網(wǎng)絡(luò)成功的關(guān)鍵,為此我們應(yīng)該對表征學(xué)習(xí)進(jìn)行這樣的探索。


該研究力求利用兩個(gè)方面的優(yōu)勢:樹集成的出色性能和分層分布式表征的表達(dá)能力(主要在神經(jīng)網(wǎng)絡(luò)中進(jìn)行探索)。具體來說,本研究提出了首個(gè)多層結(jié)構(gòu),每層使用梯度提升決策樹作為構(gòu)造塊,明確強(qiáng)調(diào)其表征學(xué)習(xí)能力,訓(xùn)練過程可以通過目標(biāo)傳播的變體進(jìn)行聯(lián)合優(yōu)化。該模型可以在有監(jiān)督和無監(jiān)督的環(huán)境下進(jìn)行訓(xùn)練。本研究首次證明,確實(shí)可以使用決策樹來獲得分層和分布式表征,盡管決策樹通常被認(rèn)為只能用于神經(jīng)網(wǎng)絡(luò)或可微分系統(tǒng)。理論論證和實(shí)驗(yàn)結(jié)果均表明了該方法的有效性。


3 提出的方法


這一部分機(jī)器之心并不詳細(xì)介紹,具體的方法讀者可參考原論文第三章。在一般的多層前饋結(jié)構(gòu)中,每一層都是可微函數(shù),因此我們可以使用反向傳播傳遞梯度并高效地更新參數(shù)。但是當(dāng)每一個(gè)層級函數(shù)都是不可微或者非參數(shù)化的,那么我們就不能使用反向傳播。所以這一部分重點(diǎn)在于解決當(dāng)層級函數(shù) F_i 是梯度提升決策樹時(shí),其參數(shù)的更新方法。


訓(xùn)練神經(jīng)網(wǎng)絡(luò)時(shí),初始化可以通過向每個(gè)參數(shù)分配隨機(jī)高斯噪聲來實(shí)現(xiàn),然后該步驟移動到下一階段,即參數(shù)更新。對于此處介紹的樹結(jié)構(gòu)模型來說,從所有可能的樹配置分布中繪制隨機(jī)樹結(jié)構(gòu)不是一件容易的事情,因此本論文沒有隨機(jī)初始化樹結(jié)構(gòu),而是生成一些高斯噪聲作為中間層的輸出,并訓(xùn)練一些非常小的樹來獲取,其中索引 0 表示該初始化階段獲取的樹結(jié)構(gòu)。之后訓(xùn)練步驟移動到迭代更新正向映射和逆向映射。圖 1 和算法 1 總結(jié)了該步驟。

微信圖片_20180605171636.jpg


圖 1:訓(xùn)練 mGBDT 步驟的示意圖。


值得注意的是,[23] 利用 GPU 加速訓(xùn)練 GBDT,Korlakai & Ran [24] 展示了一種實(shí)施 GBDT drop-out 技術(shù)的高效方式,進(jìn)一步提升了性能。至于多維輸出問題,使用 GBDT 的原始方法內(nèi)存效率較低。Si 等人 [25] 提出了解決該問題的有效方式,可以在實(shí)踐中將內(nèi)存降低一個(gè)數(shù)量級。

微信圖片_20180605171708.jpg



4 實(shí)驗(yàn)


4.1 合成數(shù)據(jù)


為了進(jìn)行完整性檢查,研究者在合成數(shù)據(jù)集上訓(xùn)練兩個(gè)小的多層 GBDT。


微信圖片_20180605171759.jpg


如圖 2a 所示,研究者在 R^2 上得到了 1.5 萬個(gè)點(diǎn),分為兩個(gè)類別(70% 用于訓(xùn)練,30% 用于測試)。用于訓(xùn)練的結(jié)構(gòu)是(輸入 ? 5 ? 3 ? 輸出),其中輸入點(diǎn)在 R^2 中,輸出是 0/1 分類預(yù)測。


研究者還進(jìn)行了一項(xiàng)自動編碼的無監(jiān)督學(xué)習(xí)任務(wù)。生成了 1 萬個(gè) 3D 點(diǎn),如圖 3a 所示。然后研究者用結(jié)構(gòu)為(3 - 5 - 3)的 mGBDT 構(gòu)建了一個(gè)自編碼器,MSE 為重建損失。


重建輸出如圖 3b 所示。輸入 3D 點(diǎn)的 5D 編碼不可能直接可視化,這里研究者使用一種通用策略來可視化 2D 中 5D 編碼的一些維度對,如圖 4 所示。


4.2 收入預(yù)測


收入預(yù)測數(shù)據(jù)集 [28] 包含 48, 842 個(gè)樣本(其中 32, 561 個(gè)是訓(xùn)練數(shù)據(jù),16, 281 個(gè)是測試數(shù)據(jù)),這些樣本是表格數(shù)據(jù),具備類別屬性和連續(xù)屬性。每個(gè)樣本包括一個(gè)人的社會背景,如種族、性別、工作種類等。這里的任務(wù)是預(yù)測這個(gè)人的年薪是否超過 50K。

微信圖片_20180605171830.jpg

圖 5:收入數(shù)據(jù)集的特征可視化。


實(shí)驗(yàn)結(jié)果見圖 6 和表 1。首先,基于同樣的模型結(jié)構(gòu),多層 GBDT 森林(mGBDT)與使用反向傳播或目標(biāo)傳播(target-prop)的 DNN 方法相比取得了最高的準(zhǔn)確率。它的準(zhǔn)確率還比單個(gè) GBDT 或多個(gè) GBDT 的簡單堆疊更高。其次,與期望相反,NN^TargetProp 的收斂效果不如 NN^BackProp(與 [5] 的結(jié)果一致),而使用 GBDT 層的同樣結(jié)構(gòu)可以達(dá)到更低的訓(xùn)練損失,同時(shí)避免過擬合。

微信圖片_20180605171856.jpg


圖 6:收入數(shù)據(jù)集學(xué)習(xí)曲線。

微信圖片_20180605171939.jpg


表 1:分類準(zhǔn)確率對比。對于蛋白質(zhì)數(shù)據(jù)集,使用 10 折交叉驗(yàn)證評估出的準(zhǔn)確率以平均值 ± 標(biāo)準(zhǔn)差的形式表示。


4.3 蛋白質(zhì)定位


蛋白質(zhì)數(shù)據(jù)集 [28] 是一個(gè) 10 類別分類任務(wù),僅包含 1484 個(gè)訓(xùn)練數(shù)據(jù),其中 8 個(gè)輸入屬性中的每一個(gè)都是蛋白質(zhì)序列的一個(gè)測量值,目標(biāo)是用 10 個(gè)可能的選擇預(yù)測蛋白質(zhì)定位位點(diǎn)。

微信圖片_20180605172052.jpg

圖 7:蛋白質(zhì)數(shù)據(jù)集的特征可視化


10 折交叉驗(yàn)證的訓(xùn)練和測試曲線用平均值繪制在圖 8 中。多層 GBDT(mGBDT)方法比神經(jīng)網(wǎng)絡(luò)方法收斂得快得多,如圖 8a 所示。

微信圖片_20180605172122.jpg

圖 8:蛋白質(zhì)數(shù)據(jù)集學(xué)習(xí)曲線。

微信圖片_20180605172148.jpg

表 2:不同模型結(jié)構(gòu)的測試準(zhǔn)確率。使用 10 折交叉驗(yàn)證評估出的準(zhǔn)確率以平均值 ± 標(biāo)準(zhǔn)差的形式表示。N/A 表示并未應(yīng)用。


論文:Multi-Layered Gradient Boosting Decision Trees 


微信圖片_20180605172213.jpg

論文鏈接:https://arxiv.org/pdf/1806.00007.pdf


摘要:多層表征被認(rèn)為是深度神經(jīng)網(wǎng)絡(luò)的關(guān)鍵要素,尤其是在計(jì)算機(jī)視覺等認(rèn)知任務(wù)中。盡管不可微模型如梯度提升決策樹(gradient boosting decision tree,GBDT)是建模離散或表格數(shù)據(jù)的主要方法,但是它們很難整合這種表征學(xué)習(xí)能力。在本文中,我們提出了多層 GBDT 森林(mGBDT),通過堆疊多個(gè)回歸 GBDT 層作為構(gòu)建塊,探索學(xué)習(xí)層級表征的能力。該模型可以使用層間目標(biāo)傳播的變體進(jìn)行聯(lián)合訓(xùn)練,無需推導(dǎo)反向傳播和可微性。實(shí)驗(yàn)和可視化均證明該模型在性能和表征學(xué)習(xí)能力方面的有效性。


本站內(nèi)容除特別聲明的原創(chuàng)文章之外,轉(zhuǎn)載內(nèi)容只為傳遞更多信息,并不代表本網(wǎng)站贊同其觀點(diǎn)。轉(zhuǎn)載的所有的文章、圖片、音/視頻文件等資料的版權(quán)歸版權(quán)所有權(quán)人所有。本站采用的非本站原創(chuàng)文章及圖片等內(nèi)容無法一一聯(lián)系確認(rèn)版權(quán)者。如涉及作品內(nèi)容、版權(quán)和其它問題,請及時(shí)通過電子郵件或電話通知我們,以便迅速采取適當(dāng)措施,避免給雙方造成不必要的經(jīng)濟(jì)損失。聯(lián)系電話:010-82306118;郵箱:aet@chinaaet.com。
亚洲一区二区欧美_亚洲丝袜一区_99re亚洲国产精品_日韩亚洲一区二区
亚洲欧美综合另类中字| 欧美在线观看视频| 亚洲欧美日本国产专区一区| 亚洲国产一区二区三区a毛片| 国产亚洲一区在线播放| 国产精品夜色7777狼人| 国产精品红桃| 国产精品久久久一区二区| 欧美午夜精品伦理| 欧美视频在线免费看| 欧美日韩情趣电影| 欧美视频不卡中文| 国产精品进线69影院| 国产精品福利网| 国产精品黄色在线观看| 国产精品日本一区二区| 国产欧美精品一区二区色综合 | 国产视频在线观看一区二区三区| 国产精品高清免费在线观看| 欧美亚洲第一页| 国产精品国内视频| 国产欧美精品在线播放| 国产一区二区三区奇米久涩| 黄色一区二区三区四区| 1024日韩| 日韩午夜剧场| 中文一区在线| 亚洲欧美三级在线| 久久国产婷婷国产香蕉| 亚洲激情午夜| 一本一本a久久| 亚洲香蕉在线观看| 欧美在线播放一区| 久久在线播放| 欧美乱在线观看| 国产精品一级久久久| 狠狠综合久久av一区二区老牛| 在线精品国精品国产尤物884a| 亚洲黄网站在线观看| 夜色激情一区二区| 午夜电影亚洲| 亚洲黄色成人久久久| 日韩视频在线观看国产| 亚洲免费视频在线观看| 久久久水蜜桃av免费网站| 欧美国产一区二区| 国产精品国产三级国产aⅴ无密码| 国产网站欧美日韩免费精品在线观看| 一区精品久久| 一二三四社区欧美黄| 性感少妇一区| 亚洲精品久久久久久下一站 | 黄色精品网站| 亚洲毛片一区二区| 亚洲尤物影院| 91久久精品美女| 亚洲女优在线| 蜜臀va亚洲va欧美va天堂| 国产精品国产三级国产aⅴ9色| 国外精品视频| 一区二区免费看| 久久精品水蜜桃av综合天堂| 一区二区三区视频在线| 久久精品亚洲一区| 欧美日韩精品二区| 韩国三级电影久久久久久| 亚洲美女网站| 亚洲第一精品夜夜躁人人爽| 中日韩午夜理伦电影免费| 久久福利视频导航| 欧美日韩精品欧美日韩精品一| 国产日韩在线一区二区三区| 亚洲理伦电影| 亚洲第一区在线观看| 午夜欧美精品久久久久久久| 免费亚洲一区| 国产一区二区黄色| 亚洲深夜激情| 亚洲精品日韩在线| 久久精品亚洲热| 国产精品乱码人人做人人爱| 亚洲国产99精品国自产| 午夜视频精品| 亚洲午夜精品国产| 欧美成人精品激情在线观看 | 99精品视频免费观看| 亚洲国产精品成人综合| 性欧美精品高清| 欧美日韩综合网| 亚洲韩国精品一区| 久久精品亚洲精品| 久久国产精品高清| 国产精品福利在线| 亚洲免费福利视频| 亚洲人成网站在线播| 久久人人爽爽爽人久久久| 国产精品色网| 99国产精品久久久久久久| 日韩视频免费观看| 浪潮色综合久久天堂| 国产午夜精品一区二区三区视频| 99re在线精品| 亚洲最新在线| 欧美激情一区二区三区不卡| 激情综合久久| 欧美在线综合视频| 欧美专区在线播放| 国产精品天天看| 亚洲午夜一区二区| 亚洲网站在线观看| 欧美日韩黄色一区二区| 亚洲精品免费一二三区| 亚洲人体一区| 欧美大片免费观看| 在线观看一区欧美| 亚洲欧洲另类国产综合| 老鸭窝亚洲一区二区三区| 国产一区视频网站| 久久不见久久见免费视频1| 欧美一区二区| 国产美女诱惑一区二区| 亚洲女ⅴideoshd黑人| 香蕉av777xxx色综合一区| 国产精品xxxav免费视频| 中国成人黄色视屏| 亚洲欧洲av一区二区三区久久| 国产精品久久久久久亚洲调教| 一区二区三区欧美激情| 亚洲一区视频在线观看视频| 国产精品成人一区二区| 亚洲午夜精品久久久久久app| 亚洲欧美日韩在线一区| 国产精品私房写真福利视频| 欧美亚洲免费在线| 久久免费少妇高潮久久精品99| 国内精品伊人久久久久av影院| 亚洲大胆在线| 欧美精品v国产精品v日韩精品| 亚洲卡通欧美制服中文| 亚洲一区二区免费在线| 国产精品美女久久福利网站| 亚洲欧美日韩高清| 久久免费一区| 亚洲精品久久久久久久久久久| 亚洲小说欧美另类婷婷| 国产精品视频一区二区高潮| 欧美一区成人| 男女精品网站| 日韩视频免费看| 香蕉久久夜色| 精品91在线| 99xxxx成人网| 国产精品色婷婷久久58| 亚洲大胆在线| 欧美日韩调教| 午夜国产不卡在线观看视频| 老司机午夜精品视频| 亚洲精品久久久久中文字幕欢迎你 | 亚洲国产精品综合| 欧美精品久久久久久久| 亚洲校园激情| 久久婷婷丁香| 亚洲乱码国产乱码精品精| 午夜精品www| 尤物精品国产第一福利三区| 在线亚洲自拍| 国产在线国偷精品产拍免费yy| 亚洲三级电影全部在线观看高清| 欧美视频福利| 亚洲电影下载| 国产精品分类| 亚洲国产日韩欧美| 国产精品成人观看视频免费| 久久高清国产| 欧美日韩一区二区三区高清| 欧美一级久久久| 欧美另类久久久品| 欧美在线免费播放| 欧美日本久久| 久久精品国产77777蜜臀 | 国产精品夜夜夜| 日韩一级大片在线| 国产日韩欧美三级| 一本高清dvd不卡在线观看| 国产一区二区成人久久免费影院| 夜夜精品视频一区二区| 国精产品99永久一区一区| 中文欧美字幕免费| 精品电影在线观看| 午夜精品区一区二区三| 亚洲人成啪啪网站| 久久偷看各类wc女厕嘘嘘偷窃| 中文av一区二区| 欧美大色视频| 欧美专区第一页| 国产精品爱啪在线线免费观看| 亚洲精品日本| 极品尤物av久久免费看| 新狼窝色av性久久久久久| 亚洲精品视频中文字幕|