《電子技術應用》
您所在的位置:首頁 > 其他 > 設計應用 > 基于梯度優化的大語言模型后門識別探究
基于梯度優化的大語言模型后門識別探究
網絡安全與數據治理
陳佳華1,陳宇2,曹婍3
1 電子科技大學信息與軟件工程學院,四川成都610066;2 北京郵電大學計算機學院,北京100876; 3 中國科學院計算技術研究所智能算法安全重點實驗室,北京100190
摘要: 隨著大語言模型的流行并且應用在越來越多的領域,大語言模型的安全問題也隨之而來。 通常訓練大語言模型對數據集以及計算資源有著極為苛刻的要求,所以有使用需求的用戶大部分都直接利用網絡上開源的數據集以及模型,這給后門攻擊提供了絕佳的溫室。后門攻擊是指用戶在模型中輸入正常數據時模型表現像沒有注入后門時一樣正常,但當輸入帶有后門觸發器的數據時模型輸出異常。防止后門攻擊的有效方法就是進行后門識別。目前基于梯度的優化方法是比較常用的,但使用這些方法時內部影響因子的設定對識別效果具有一定影響。文章就詞令牌數量、最鄰近數量、噪聲大小進行了實驗測量和作用機制的分析,以便為后續使用這些方法的研究者提供參考。
中圖分類號:TP309文獻標識碼:ADOI:10.19358/j.issn.2097-1788.2023.12.003
引用格式:陳佳華,陳宇,曹婍.基于梯度優化的大語言模型后門識別探究[J].網絡安全與數據治理,2023,42(12):14-19.
Research on gradient optimization based backdoor identification of large language model
Chen Jiahua1,Chen Yu 2,Cao Qi3
1 School of Information and Software Engineering,University of Electronic Science and Technology of China,Chengdu 610066, China; 2 School of Computer Science,Beijing University of Posts and Telecommunications, Beijing 100876, China; 3 CAS Key Laboratory of AI Security, Institute of Computing Technology, Chinese Academy of Sciences, Beijing 100190, China
Abstract: With the popularity of large language models (LLM) and their application in more fields, the security concerns of large language models also arise. In general, training LLM has extremely demanding requirements for datasets and computing resources, so most users who need to use them directly use opensource datasets and models on the Internet, which provides an excellent greenhouse for backdoor attacks. A backdoor attack is when a user enters normal data into the model as if it were not injected with a backdoor, but the model output is abnormal when data with a backdoor trigger is input. An effective way to prevent backdoor attacks is to perform backdoor identification. At present, gradientbased optimization methods are commonly used, but the setting of internal impact factors has a great impact on the recognition effect when using these methods. In this paper, the word token length, the number of nearest neighbors, and the noise scale are measured experimentally and the mechanism of action is analyzed, so as to provide reference for researchers who use these methods in the future.
Key words : large language models; backdoor attack; gradient based backdoor identification; impact factor

引言

近年來,大語言模型越來越多地運用在了人們的日常生活中,也誕生了很多著名的模型比如ChatGPT、GPT4[1]、LLaMA[2]等。這些模型能夠進行廣泛的任務如文本總結、情感分析等,有研究表明大模型具有小模型沒有的能力[3],如推理能力等。大語言模型也成為現在研究的熱點之一。但任何事物都有它的兩面性。大語言模型的訓練需要有足夠且良好的訓練數據集,且由于其龐大的參數量,對計算資源的需求也極高。例如GPT35具有1 750億的參數量,使用數據集達到了45 TB的大小[4]。在大部分情況下,使用者可能會選擇直接使用網絡上開源的大模型來進行下游任務的完成,或者使用領域特定數據集在開源大模型的基礎上進行微調從而定制化領域特定模型。在這種大環境下,開源大模型如果存在安全問題將造成嚴重的危害。


作者信息

陳佳華1,陳宇2,曹婍3

(1 電子科技大學信息與軟件工程學院,四川成都610066;2 北京郵電大學計算機學院,北京100876;

3 中國科學院計算技術研究所智能算法安全重點實驗室,北京100190)


文章下載地址:http://m.jysgc.com/resource/share/2000005871



weidian.jpg

此內容為AET網站原創,未經授權禁止轉載。
亚洲一区二区欧美_亚洲丝袜一区_99re亚洲国产精品_日韩亚洲一区二区
亚洲精品在线视频观看| 久久国产天堂福利天堂| 亚洲欧美日韩国产中文| 亚洲美女精品成人在线视频| 曰本成人黄色| 今天的高清视频免费播放成人| 国产欧美一区二区三区在线老狼 | 香蕉久久a毛片| 亚洲免费中文字幕| 亚洲影视综合| 亚洲欧美国产精品专区久久| 亚洲综合电影一区二区三区| 亚洲制服少妇| 亚洲欧美综合v| 欧美在线免费视频| 久久九九国产精品怡红院| 久久av一区二区三区| 久久久精品2019中文字幕神马| 久久久久久久尹人综合网亚洲| 久久久久九九视频| 久久影视精品| 欧美激情视频一区二区三区不卡| 欧美精品日日鲁夜夜添| 欧美日韩免费观看一区| 国产精品99免费看| 国产精品试看| 精品不卡在线| 亚洲激情在线视频| 一区二区免费在线播放| 亚洲欧美成人一区二区在线电影 | 欧美精品一区二区精品网| 欧美日韩一区二区免费在线观看| 欧美日韩在线视频一区二区| 国产精品免费在线| 国产在线不卡视频| 在线观看欧美亚洲| 亚洲精品欧洲精品| 亚洲主播在线| 亚洲国产精品va在看黑人| 亚洲精品在线二区| 亚洲性感美女99在线| 欧美一区二区三区四区视频| 久久综合电影一区| 欧美日韩和欧美的一区二区| 国产精品免费一区二区三区在线观看 | 久久精品成人| 99在线热播精品免费| 午夜精品久久久久久久久久久久 | 亚洲国产欧美一区二区三区久久| 一本久久精品一区二区| 性做久久久久久| 日韩视频在线免费观看| 亚洲欧美在线一区二区| 久热这里只精品99re8久| 欧美日韩视频第一区| 国产日本欧美一区二区三区| 亚洲国产欧美在线人成| 亚洲欧美激情四射在线日| 亚洲黑丝在线| 午夜一区二区三区不卡视频| 欧美成人一品| 国产精品综合av一区二区国产馆| 亚洲电影免费观看高清完整版在线观看 | 欧美在线地址| 99热在这里有精品免费| 欧美在线观看日本一区| 欧美精品一卡| 国产一区二区在线观看免费| 日韩视频永久免费观看| 欧美专区第一页| 亚洲一区二区精品在线观看| 久久天堂成人| 国产精品久久久久av| 亚洲国产精品va在线观看黑人| 亚洲影视在线| 一区二区三区日韩欧美精品| 久久免费高清| 国产精品毛片大码女人| 亚洲日本免费电影| 久久国产日韩欧美| 亚洲欧美日韩精品一区二区| 欧美黄色视屏| 激情成人av| 午夜精品福利一区二区三区av | 一区二区三区国产在线| 久久精品一区二区三区不卡| 亚洲欧美综合一区| 欧美日韩国产精品专区| 尤物yw午夜国产精品视频| 亚洲自拍三区| 亚洲一区二区在线看| 欧美电影免费观看| 韩国女主播一区二区三区| 亚洲一级网站| 亚洲午夜免费福利视频| 欧美不卡一卡二卡免费版| 国产美女精品一区二区三区| 亚洲最黄网站| 夜夜精品视频| 欧美高清在线观看| 伊人天天综合| 久久精品99国产精品日本| 久久成人免费视频| 国产欧美三级| 韩国美女久久| 久久不见久久见免费视频1| 亚洲欧美中文日韩v在线观看| 欧美日韩调教| 99re6热在线精品视频播放速度| 亚洲另类黄色| 欧美激情国产日韩精品一区18| 在线观看精品视频| 亚洲国产日韩欧美| 久久亚洲精品视频| 国内精品亚洲| 久久成人精品电影| 久久久久久九九九九| 国产亚洲永久域名| 久久精品av麻豆的观看方式 | 欧美日韩日日夜夜| 亚洲麻豆视频| 亚洲视频免费看| 国产精品黄色| 亚洲免费在线视频| 欧美在线视频观看免费网站| 国产欧美亚洲视频| 久久成人资源| 免费的成人av| 亚洲欧洲一区二区三区在线观看 | 亚洲日本电影在线| 99精品视频免费在线观看| 欧美精品系列| 夜夜嗨av一区二区三区四季av| 一区二区日本视频| 国产精品白丝黑袜喷水久久久| 亚洲视频在线播放| 香蕉亚洲视频| 国产亚洲成av人片在线观看桃| 久久国产精品免费一区| 欧美 日韩 国产在线| 亚洲人成网站777色婷婷| 中文国产一区| 国产老女人精品毛片久久| 久久国产精品久久久久久久久久 | 一区二区三区亚洲| 亚洲精品视频啊美女在线直播| 欧美欧美全黄| 在线午夜精品| 久久激情五月激情| 1769国内精品视频在线播放| 日韩视频永久免费| 国产精品久久国产愉拍 | 精品成人一区二区三区四区| 亚洲免费观看高清完整版在线观看熊 | 欧美视频在线观看一区| 亚洲欧美日韩综合国产aⅴ| 久久综合五月| 亚洲毛片在线| 欧美在线www| 亚洲国产一区视频| 亚洲中无吗在线| 一区视频在线播放| 亚洲私人黄色宅男| 国语自产偷拍精品视频偷| 亚洲欧洲日韩综合二区| 欧美三级在线| 欧美一区二视频| 欧美日韩不卡视频| 先锋资源久久| 欧美激情综合网| 先锋影音国产精品| 欧美美女福利视频| 欧美一区二区啪啪| 欧美精品一区在线播放| 亚洲制服欧美中文字幕中文字幕| 久色婷婷小香蕉久久| 一区二区三区日韩欧美| 久久在线免费观看| 在线亚洲观看| 欧美大片在线观看一区| 午夜精品一区二区三区四区| 欧美片第一页| 久久精品夜色噜噜亚洲a∨| 欧美小视频在线| 亚洲国产精品一区制服丝袜 | 99国内精品久久| 国产婷婷色综合av蜜臀av| 一区二区日韩免费看| 激情欧美一区二区| 午夜精品国产更新| 亚洲精品你懂的| 快she精品国产999| 亚洲欧美国内爽妇网| 欧美人在线视频| 久久精品人人做人人爽电影蜜月| 国产精品v欧美精品∨日韩| 亚洲精品女人| 国产一区观看| 欧美在线精品免播放器视频| 99re在线精品|