china0114.com-日韩欧美中文免费,免费视频一区,免费视频一区,国产精品色网

公眾號
關(guān)注微信公眾號
移動端
創(chuàng)頭條企服版APP

BERT, RoBERTa, DistilBERT, XLNet的用法對比

5491
最近,又提出了幾種方法改進(jìn)BERT的預(yù)測指標(biāo)或計(jì)算速度,但是始終達(dá)不到兩者兼顧。XLNet和RoBERTa改善了性能,而DistilBERT提高了推理速度。

BERT, RoBERTa, DistilBERT, XLNet到底哪家強(qiáng)?在不同的研究領(lǐng)域和應(yīng)用場景如何選擇成了大難題。凡事莫慌,這篇文章幫你理清思路。

BERT 以及后續(xù)模型

谷歌基于transformer的BERT系列一經(jīng)問世就在NLP領(lǐng)域掀起了一場風(fēng)暴,在幾項(xiàng)任務(wù)中的表現(xiàn)可謂勢頭強(qiáng)勁,已經(jīng)超越了先前沿用的最先進(jìn)的技術(shù)。最近,谷歌對BERT進(jìn)行了改版,我將對比改版前后主要的相似點(diǎn)和不同點(diǎn),以便你可以選擇在研究或應(yīng)用中使用哪一種。

BERT是一個雙向transformer,用于對大量未標(biāo)記的文本數(shù)據(jù)進(jìn)行預(yù)訓(xùn)練,以學(xué)習(xí)一種語言表示形式,這種語言表示形式可用于對特定機(jī)器學(xué)習(xí)任務(wù)進(jìn)行微調(diào)。雖然BERT在幾項(xiàng)任務(wù)中的表現(xiàn)都優(yōu)于NLP領(lǐng)域沿用過的最先進(jìn)的技術(shù),但其性能的提高主要還是歸功于雙向transformer、掩蔽語言模型對任務(wù)的訓(xùn)練以及結(jié)構(gòu)預(yù)測功能,還包括大量的數(shù)據(jù)和谷歌的計(jì)算能力。

最近,又提出了幾種方法改進(jìn)BERT的預(yù)測指標(biāo)或計(jì)算速度,但是始終達(dá)不到兩者兼顧。XLNet和RoBERTa改善了性能,而DistilBERT提高了推理速度。下表對它們進(jìn)行了比較:

?

?

圖1:比較BERT和最近的一些改進(jìn)情況

GPU計(jì)算時間是估算的(使用4個TPU Pod進(jìn)行為時4天的原始訓(xùn)練)

使用大量的小批次數(shù)據(jù),根據(jù)掩蔽程序的差異進(jìn)行學(xué)習(xí)速度和延長時間的訓(xùn)練

數(shù)據(jù)來源是原始論文

XLNet是一種大型雙向transformer,它使用的是改進(jìn)過的訓(xùn)練方法,這種訓(xùn)練方法擁有更大的數(shù)據(jù)集和更強(qiáng)的計(jì)算能力,在20個語言任務(wù)中XLNet比BERT的預(yù)測指標(biāo)要更好。

為了改進(jìn)訓(xùn)練方法,XLNet引入了置換語言建模,其中所有標(biāo)記都是按隨機(jī)順序預(yù)測的。 這與BERT的掩蔽語言模型形成對比,后者只預(yù)測了掩蔽(15%)標(biāo)記。 這也顛覆了傳統(tǒng)的語言模型,在傳統(tǒng)語言模型中,所有的標(biāo)記都是按順序而不是按隨機(jī)順序預(yù)測的。 這有助于模型學(xué)習(xí)雙向關(guān)系,從而更好地處理單詞之間的關(guān)系和銜接。此外使用Transformer XL做基礎(chǔ)架構(gòu),即使在不統(tǒng)一排序訓(xùn)練的情況下也能表現(xiàn)出良好的性能。

XLNet使用了超過130 GB的文本數(shù)據(jù)和512 TPU芯片進(jìn)行訓(xùn)練,運(yùn)行時間為2.5天,XLNet用于訓(xùn)練的資料庫要比BERT大得多。

RoBERTa,在Facebook上推出的Robustly是BERT的優(yōu)化方案,RoBERTa在BERT的基礎(chǔ)上進(jìn)行再訓(xùn)練,改進(jìn)了訓(xùn)練方法,還增加了1000%的數(shù)據(jù),強(qiáng)化了計(jì)算能力。

為了優(yōu)化訓(xùn)練程序,RoBERTa從BERT的預(yù)訓(xùn)練程序中刪除了結(jié)構(gòu)預(yù)測(NSP)任務(wù),引入了動態(tài)掩蔽,以便在訓(xùn)練期間使掩蔽的標(biāo)記發(fā)生變化。在這過程中也證實(shí)了大批次的訓(xùn)練規(guī)模在訓(xùn)練過程中的確更有用。

重要的是,RoBERTa使用160 GB的文本進(jìn)行預(yù)訓(xùn)練,其中包含了16GB的文本語料庫和BERT使用的英文Wikipedia。其他數(shù)據(jù)包括CommonCrawl News數(shù)據(jù)集(6300萬篇文章,76 GB),Web文本語料庫(38GB)和普通爬蟲的故事(31 GB)。 再加上1024個 V100的Tesla GPU每天都在運(yùn)行,這使得RoBERTa具備了進(jìn)行預(yù)訓(xùn)練的基礎(chǔ)。

因此,RoBERTa在GLUE基準(zhǔn)測試結(jié)果上優(yōu)于BERT和XLNet。

另一方面,為了減少BERT或相關(guān)模型的計(jì)算(訓(xùn)練,預(yù)測)時間,理應(yīng)選擇使用較小的網(wǎng)絡(luò)以達(dá)到相似的性能。其實(shí)有許多方法可以做到這一點(diǎn),包括剪枝,蒸餾和量化,然而,所有這些都會導(dǎo)致預(yù)測指標(biāo)更低。

DistilBERT學(xué)習(xí)了BERT的蒸餾(近似)版本,保留了95%的性能,但只使用了一半的參數(shù)。 具體來說,它沒有標(biāo)記類型和池化層的嵌入,只保留了谷歌BERT中一半的層。 DistilBERT使用了一種叫做蒸餾的技術(shù),它與谷歌的BERT(也就是由較小的神經(jīng)網(wǎng)絡(luò)構(gòu)成大型神經(jīng)網(wǎng)絡(luò))相似。 這個原理是,一旦要訓(xùn)練一個大型神經(jīng)網(wǎng)絡(luò),就可以使用較小的網(wǎng)絡(luò)來預(yù)估其完整的輸出分布。這在某種意義上類似于后驗(yàn)近似。 在貝葉斯統(tǒng)計(jì)中用于后驗(yàn)近似的關(guān)鍵優(yōu)化函數(shù)之一是Kulback Leiber散度,自然在這里也被用到了。

提示:在貝葉斯統(tǒng)計(jì)中,我們接近真實(shí)的后驗(yàn)值(來自數(shù)據(jù)),而對于蒸餾,我們只能做到接近在較大網(wǎng)絡(luò)中學(xué)習(xí)到的后驗(yàn)值。

如何使用

如果你真的需要推理速度快一點(diǎn),可以接受代價是預(yù)測精度稍微下降那么一些的話,那么DistilBERT會是一個合適的選擇,但是,如果你還在尋找最佳的預(yù)測性能,你最好使用Facebook的RoBERTa。

從理論上講,基于XLNet置換的訓(xùn)練應(yīng)該能處理好依賴關(guān)系,并且可能在長期運(yùn)行中能表現(xiàn)出更好的性能。

但是,Google的BERT確實(shí)提供了良好的基線,如果你沒有上述任何關(guān)鍵需求,就可以使用BERT維持系統(tǒng)的正常運(yùn)行。

總結(jié)

大多數(shù)性能的改善(包括BERT本身)都是由于增加了數(shù)據(jù)量,計(jì)算能力或訓(xùn)練過程。 雖然它們確實(shí)具有自己的價值,但它們往往傾向于在計(jì)算和預(yù)測指標(biāo)之間進(jìn)行權(quán)衡。當(dāng)前真正需要的是在使用更少的數(shù)據(jù)和計(jì)算資源的同時還可以使性能得到基本的改進(jìn)。

原文作者:SuleimanKhan

原文鏈接:https://towardsdatascience.com/bert-roberta-distilbert-xlnet-which-one-to-use-3d5ab82ba5f8

分享到:0收藏

上一篇:民生銀行數(shù)據(jù)中臺體系的構(gòu)建與實(shí)踐 在數(shù)據(jù)科學(xué)領(lǐng)域,Rust 會是 Python 的最佳替代方案嗎?下一篇:

聲明:該文章版權(quán)歸原作者所有,轉(zhuǎn)載目的在于傳遞更多信息,并不代表本網(wǎng)贊同其觀點(diǎn)和對其真實(shí)性負(fù)責(zé)。如涉及作品內(nèi)容、版權(quán)和其它問題,請?jiān)?0日內(nèi)與本網(wǎng)聯(lián)系。
您閱讀這篇文章花了0
轉(zhuǎn)發(fā)這篇文章只需要1秒鐘
喜歡這篇 0
評論一下 0
凱派爾知識產(chǎn)權(quán)全新業(yè)務(wù)全面上線
相關(guān)文章
評論
登錄后發(fā)表評論
凱派爾知識產(chǎn)權(quán)全新業(yè)務(wù)全面上線
寧波城市站
金華城市站
×
#熱門搜索#
精選雙創(chuàng)服務(wù)
歷史搜索 清空

Tel:18514777506

關(guān)注微信公眾號

創(chuàng)頭條企服版APP

china0114.com-日韩欧美中文免费,免费视频一区,免费视频一区,国产精品色网
国产成人在线视频网址| 麻豆精品在线看| 婷婷丁香久久五月婷婷| 久久99精品久久久久久国产越南| 国产精品一二三在| 91久久精品网| 久久久久久久综合日本| 亚洲午夜成aⅴ人片| 大尺度一区二区| 91精品国产综合久久久久久| 精品欧美久久久| 亚洲色图欧美激情| 韩国三级中文字幕hd久久精品| 成人激情综合网站| 国产精品99精品久久免费| 成人免费视频app| 欧美一区二区播放| 亚洲天堂久久久久久久| 五月天视频一区| 国产麻豆成人精品| 91麻豆精品国产91久久久资源速度| 欧美一级专区免费大片| 欧美高清性hdvideosex| 欧美国产1区2区| 美女国产一区二区| 欧美午夜精品理论片a级按摩| 国产欧美精品一区二区色综合 | 欧美高清www午色夜在线视频| 欧美变态口味重另类| 国产精品素人视频| 精一区二区三区| 欧美日韩午夜精品| 亚洲素人一区二区| 国产99久久久精品| 精品日产卡一卡二卡麻豆| 亚洲国产wwwccc36天堂| 91丨porny丨首页| 国产亚洲成aⅴ人片在线观看| 日本vs亚洲vs韩国一区三区| 成人激情开心网| 久久久美女艺术照精彩视频福利播放 | 欧美精品久久99| 亚洲婷婷国产精品电影人久久| 麻豆91精品91久久久的内涵| www.亚洲色图.com| 国产欧美精品区一区二区三区| 日本午夜精品视频在线观看| 欧美三级中文字幕| 亚洲精品久久久久久国产精华液| 成人黄色777网| 久久精品视频网| 精品亚洲免费视频| 日韩三级视频中文字幕| 日韩福利视频网| 欧美日韩激情一区二区三区| 曰韩精品一区二区| 色哟哟亚洲精品| 亚洲免费av高清| 色综合久久久久综合体| 亚洲人成7777| 国产美女精品在线| 日韩丝袜美女视频| 久久视频一区二区| 精品亚洲成a人| 精品日韩一区二区三区| 精品一区二区三区视频| 欧美sm美女调教| 狠狠色狠狠色合久久伊人| 精品国产凹凸成av人网站| 精品一区二区在线观看| 日韩一区二区三区视频在线| 免费成人av资源网| 欧美成人在线直播| 激情久久久久久久久久久久久久久久| 欧美电视剧免费观看| 极品少妇xxxx偷拍精品少妇| 精品国产一区二区亚洲人成毛片| 精品一区二区久久久| 欧美精品一区二区三区久久久| 香蕉久久夜色精品国产使用方法| 欧美吻胸吃奶大尺度电影| 亚洲一区二区三区影院| 欧美日韩在线播放| 男人的j进女人的j一区| 精品卡一卡二卡三卡四在线| 国产精品一区二区久久不卡| 中文字幕欧美激情一区| 99国产精品99久久久久久| 一区二区在线电影| 欧美精品亚洲二区| 激情综合网激情| 国产精品亲子伦对白| 国产一区二区在线观看免费| 中日韩av电影| 欧美在线观看视频一区二区三区| 亚洲成a人片综合在线| 日韩精品最新网址| 成人午夜电影网站| 亚洲午夜羞羞片| 日韩午夜av电影| 成人性视频免费网站| 亚洲一区二区三区精品在线| 日韩一级片在线播放| 久久国产精品无码网站| 日本一区免费视频| zzijzzij亚洲日本少妇熟睡| 亚洲一区二区在线观看视频| 欧美一区二区日韩| 国产福利一区在线观看| 一区二区三区波多野结衣在线观看 | 中文在线免费一区三区高中清不卡| 久久99国产精品久久99果冻传媒| 国产欧美日韩麻豆91| 欧美影视一区在线| 精品一区二区免费在线观看| **性色生活片久久毛片| 8x8x8国产精品| 成人精品鲁一区一区二区| 亚洲午夜一区二区| 欧美乱妇23p| 六月婷婷色综合| **欧美大码日韩| 日韩一区二区免费视频| 成人av在线资源| 热久久久久久久| 国产精品不卡一区二区三区| 欧美高清视频一二三区| 国产成人免费视频网站 | 欧美剧在线免费观看网站 | 成人激情视频网站| 亚洲成人免费av| 精品久久久网站| 亚洲第一久久影院| 久久日韩粉嫩一区二区三区| 在线精品亚洲一区二区不卡| 黄网站免费久久| 亚洲一区二区三区四区五区中文| 久久久一区二区三区| 欧美熟乱第一页| 国产一区二区三区国产| 亚洲大片在线观看| 国产亚洲成年网址在线观看| 91亚洲国产成人精品一区二三| 久久精品国产精品亚洲精品| 一级精品视频在线观看宜春院| 国产亚洲制服色| 91精品国产麻豆国产自产在线| 97久久人人超碰| 国产成人综合在线观看| 国产一区二区三区免费在线观看| 日本视频中文字幕一区二区三区| 亚洲国产aⅴ天堂久久| 亚洲一区影音先锋| 亚洲综合小说图片| 亚洲综合一区在线| 亚洲一二三四久久| 夜夜嗨av一区二区三区网页| 亚洲激情av在线| 亚洲私人影院在线观看| 亚洲欧洲精品一区二区三区| 国产精品久线在线观看| 国产精品久久久久9999吃药| 国产精品热久久久久夜色精品三区 | 精品免费国产二区三区 | 香蕉av福利精品导航| 亚洲国产精品一区二区久久| 亚洲电影你懂得| 丝袜亚洲精品中文字幕一区| 午夜精品一区二区三区免费视频| 亚洲大片精品永久免费| 日韩主播视频在线| 男女性色大片免费观看一区二区 | 制服丝袜成人动漫| 69av一区二区三区| 日韩一级大片在线观看| 精品剧情在线观看| 国产亚洲成aⅴ人片在线观看| 国产精品女主播av| 亚洲欧美日韩在线| 亚洲国产视频在线| 日韩av一区二区在线影视| 久久精品999| 国产精品996| 99久久99久久久精品齐齐| 91高清视频在线| 欧美福利视频导航| 欧美变态凌虐bdsm| 中文字幕欧美激情| 亚洲精品视频自拍| 日韩中文字幕亚洲一区二区va在线| 日本不卡一区二区三区高清视频| 久草在线在线精品观看| 国产成人精品免费网站| 91蝌蚪国产九色| 欧美久久久一区| www国产亚洲精品久久麻豆| 日本一区二区三区久久久久久久久不 | 最新热久久免费视频| 亚洲国产cao| 久久国产精品免费|