《電子技術應用》
您所在的位置:首頁 > 其他 > 設計應用 > 基于梯度優化的大語言模型后門識別探究
基于梯度優化的大語言模型后門識別探究
網絡安全與數據治理
陳佳華1,陳宇2,曹婍3
1 電子科技大學信息與軟件工程學院,四川成都610066;2 北京郵電大學計算機學院,北京100876; 3 中國科學院計算技術研究所智能算法安全重點實驗室,北京100190
摘要: 隨著大語言模型的流行并且應用在越來越多的領域,大語言模型的安全問題也隨之而來。 通常訓練大語言模型對數據集以及計算資源有著極為苛刻的要求,所以有使用需求的用戶大部分都直接利用網絡上開源的數據集以及模型,這給后門攻擊提供了絕佳的溫室。后門攻擊是指用戶在模型中輸入正常數據時模型表現像沒有注入后門時一樣正常,但當輸入帶有后門觸發器的數據時模型輸出異常。防止后門攻擊的有效方法就是進行后門識別。目前基于梯度的優化方法是比較常用的,但使用這些方法時內部影響因子的設定對識別效果具有一定影響。文章就詞令牌數量、最鄰近數量、噪聲大小進行了實驗測量和作用機制的分析,以便為后續使用這些方法的研究者提供參考。
中圖分類號:TP309文獻標識碼:ADOI:10.19358/j.issn.2097-1788.2023.12.003
引用格式:陳佳華,陳宇,曹婍.基于梯度優化的大語言模型后門識別探究[J].網絡安全與數據治理,2023,42(12):14-19.
Research on gradient optimization based backdoor identification of large language model
Chen Jiahua1,Chen Yu 2,Cao Qi3
1 School of Information and Software Engineering,University of Electronic Science and Technology of China,Chengdu 610066, China; 2 School of Computer Science,Beijing University of Posts and Telecommunications, Beijing 100876, China; 3 CAS Key Laboratory of AI Security, Institute of Computing Technology, Chinese Academy of Sciences, Beijing 100190, China
Abstract: With the popularity of large language models (LLM) and their application in more fields, the security concerns of large language models also arise. In general, training LLM has extremely demanding requirements for datasets and computing resources, so most users who need to use them directly use opensource datasets and models on the Internet, which provides an excellent greenhouse for backdoor attacks. A backdoor attack is when a user enters normal data into the model as if it were not injected with a backdoor, but the model output is abnormal when data with a backdoor trigger is input. An effective way to prevent backdoor attacks is to perform backdoor identification. At present, gradientbased optimization methods are commonly used, but the setting of internal impact factors has a great impact on the recognition effect when using these methods. In this paper, the word token length, the number of nearest neighbors, and the noise scale are measured experimentally and the mechanism of action is analyzed, so as to provide reference for researchers who use these methods in the future.
Key words : large language models; backdoor attack; gradient based backdoor identification; impact factor

引言

近年來,大語言模型越來越多地運用在了人們的日常生活中,也誕生了很多著名的模型比如ChatGPT、GPT4[1]、LLaMA[2]等。這些模型能夠進行廣泛的任務如文本總結、情感分析等,有研究表明大模型具有小模型沒有的能力[3],如推理能力等。大語言模型也成為現在研究的熱點之一。但任何事物都有它的兩面性。大語言模型的訓練需要有足夠且良好的訓練數據集,且由于其龐大的參數量,對計算資源的需求也極高。例如GPT35具有1 750億的參數量,使用數據集達到了45 TB的大小[4]。在大部分情況下,使用者可能會選擇直接使用網絡上開源的大模型來進行下游任務的完成,或者使用領域特定數據集在開源大模型的基礎上進行微調從而定制化領域特定模型。在這種大環境下,開源大模型如果存在安全問題將造成嚴重的危害。


作者信息

陳佳華1,陳宇2,曹婍3

(1 電子科技大學信息與軟件工程學院,四川成都610066;2 北京郵電大學計算機學院,北京100876;

3 中國科學院計算技術研究所智能算法安全重點實驗室,北京100190)


文章下載地址:http://m.jysgc.com/resource/share/2000005871



weidian.jpg

此內容為AET網站原創,未經授權禁止轉載。
亚洲一区二区欧美_亚洲丝袜一区_99re亚洲国产精品_日韩亚洲一区二区
亚洲欧美bt| 制服丝袜亚洲播放| 亚洲国产精品电影在线观看| 欧美国产一区在线| 久久成人一区二区| 99在线精品观看| 亚洲福利视频二区| 亚洲免费影院| 亚洲美女av黄| 亚洲第一二三四五区| 国产精品一区视频网站| 麻豆国产精品777777在线| 欧美一区二区三区久久精品茉莉花 | 亚洲欧美综合v| 9久re热视频在线精品| 久久福利一区| 亚洲欧美日韩精品久久久久| 99热在线精品观看| 亚洲精品国产品国语在线app| 国内精品久久久久久久果冻传媒 | 国产精品影片在线观看| 欧美色图一区二区三区| 欧美高清视频| 免费一级欧美片在线播放| 久久视频这里只有精品| 久久国产欧美精品| 亚洲欧美影音先锋| 亚洲在线网站| 国产精品99久久久久久久久| 日韩视频免费看| 亚洲人成7777| 亚洲国产导航| 久久精品欧美| 久久国产精品久久久| 欧美亚洲综合在线| 欧美一级视频| 亚洲一区二区免费视频| 一本一本久久| 一区二区欧美视频| 一本色道**综合亚洲精品蜜桃冫| 亚洲九九精品| 亚洲乱码国产乱码精品精可以看| 精品成人久久| 激情综合色综合久久| 尤物yw午夜国产精品视频| 伊人男人综合视频网| 亚洲电影免费在线| 亚洲国产精品国自产拍av秋霞| 亚洲第一精品夜夜躁人人躁| 亚洲第一区中文99精品| 在线欧美三区| 亚洲成人资源| 亚洲青涩在线| 99国产精品久久久久久久| 99在线热播精品免费99热| 99精品99久久久久久宅男| 99天天综合性| 亚洲欧美999| 欧美在线观看一区| 亚洲丶国产丶欧美一区二区三区| 亚洲国产精品va在线观看黑人| 亚洲激情成人网| 日韩午夜视频在线观看| 亚洲视频综合在线| 午夜精品亚洲一区二区三区嫩草| 欧美在线欧美在线| 狼狼综合久久久久综合网| 欧美韩日一区二区| 欧美午夜精品理论片a级大开眼界| 国产精品你懂的| 国产一区二区0| 在线观看91精品国产麻豆| 亚洲国产日日夜夜| 一区二区成人精品 | 久久午夜电影网| 欧美激情一区二区| 国产精品毛片va一区二区三区| 欧美午夜一区| 国产一区二区三区最好精华液| 亚洲高清视频一区二区| 一本色道婷婷久久欧美| 欧美一区二区精品久久911| 欧美一区二区私人影院日本| 亚洲二区在线视频| 亚洲视频一区二区免费在线观看| 欧美一区综合| 欧美精品一区二区在线观看| 亚洲另类春色国产| 亚洲精品免费电影| 国产精品久久久久久久久久尿| 国产视频一区二区在线观看| 亚洲国产精品ⅴa在线观看 | 亚洲三级网站| 亚洲男人的天堂在线aⅴ视频| 久久精品首页| 亚洲一区二区三区在线视频| 久久久欧美一区二区| 欧美日韩不卡在线| 国精品一区二区三区| 99精品欧美一区二区三区| 欧美在线首页| 亚洲美女av黄| 久久精品91久久香蕉加勒比| 欧美国产综合视频| 国产在线精品一区二区中文 | 亚洲欧洲一区二区三区在线观看| 亚洲性视频网址| 亚洲欧洲在线免费| 香蕉乱码成人久久天堂爱免费| 老司机精品久久| 久久婷婷蜜乳一本欲蜜臀| 国产精品va在线播放| 亚洲美女视频在线观看| 亚洲精品免费一二三区| 美女福利精品视频| 狠狠色2019综合网| 欧美在线啊v一区| 久久精品一区二区三区四区| 国产日韩欧美成人| 亚洲欧美在线aaa| 欧美一区二区国产| 国产嫩草影院久久久久| 亚洲欧美激情视频| 午夜国产不卡在线观看视频| 国产精品av一区二区| 在线一区欧美| 亚洲欧美日韩国产综合| 国产精品美女www爽爽爽| 亚洲在线视频观看| 欧美在线你懂的| 国产一区二区三区高清在线观看| 小黄鸭精品aⅴ导航网站入口| 欧美在线视频日韩| 国产亚洲精品bt天堂精选| 欧美一区亚洲一区| 久久综合色综合88| 亚洲第一福利社区| 亚洲最新视频在线| 欧美视频一区二| 亚洲欧美日韩国产综合精品二区| 欧美主播一区二区三区| 国产亚洲一区二区三区在线观看| 久久精品一区四区| 欧美激情第五页| 亚洲最黄网站| 欧美一级理论片| 狠狠v欧美v日韩v亚洲ⅴ| 亚洲茄子视频| 欧美日韩午夜在线| 亚洲欧美成人精品| 老色鬼精品视频在线观看播放| 亚洲高清免费视频| 亚洲私人影院| 国产欧美91| 亚洲国产精品日韩| 欧美日韩精品一区二区三区| 亚洲一区欧美激情| 久久中文欧美| 日韩视频免费大全中文字幕| 欧美一区二区福利在线| 在线播放不卡| 国产精品99久久久久久有的能看| 国产欧美精品久久| 亚洲欧洲日本一区二区三区| 欧美日韩日韩| 性8sex亚洲区入口| 欧美国产日韩亚洲一区| 亚洲午夜精品网| 快播亚洲色图| 宅男噜噜噜66一区二区66| 久久狠狠亚洲综合| 亚洲人久久久| 久久精品成人| 亚洲人成啪啪网站| 久久av一区二区三区亚洲| 亚洲欧洲精品一区二区三区| 亚洲综合日韩在线| 在线日韩av永久免费观看| 亚洲淫片在线视频| 精品动漫一区| 亚洲综合三区| 亚洲国产精品一区二区尤物区| 午夜精品久久久久久久白皮肤| 在线观看视频亚洲| 亚洲欧美在线看| 最近中文字幕mv在线一区二区三区四区 | 亚洲美女电影在线| 国产视频在线观看一区二区| 99re亚洲国产精品| 国产亚洲欧美日韩美女| 一本色道久久综合狠狠躁篇怎么玩| 国产亚洲毛片在线| 亚洲午夜国产成人av电影男同| 国产主播一区| 亚洲欧美日本国产有色| 怡红院av一区二区三区| 羞羞漫画18久久大片| 亚洲精品欧美在线| 久久人人看视频| 亚洲一区在线直播|