《電子技術應用》
您所在的位置:首頁 > 模擬設計 > 設計應用 > ßFA:一種基于向量指令集的高性能數據處理算法
ßFA:一種基于向量指令集的高性能數據處理算法
電子技術應用
楊嘉佳,關健,李正,于增明,姚旺君
中國電子信息產業集團有限公司第六研究所
摘要: 正則表達式匹配技術在數據清洗、解析提取等數據處理任務方面發揮重大作用。然而,由于匹配過程中存在數據強依賴關系和內存訪問不可預測等問題,造成匹配性能較低。針對此問題,提出一種基于向量指令集的高性能正則表達式數據處理算法,稱之為ßFA:通過向量指令一次性從內存讀出若干連續字符,并與最常被訪問狀態對應的非信任字符集進行向量匹配,利用內置函數定位首個非信任字符的位置,獲得可直接跳過的字符數,從而實現匹配性能的加速。實驗結果表明,ßFA算法的吞吐率優于原始DFA算法和αFA算法,是原始DFA算法的4.67~60倍以及ɑFA算法的4.37~7.82倍。
中圖分類號:TP391.1 文獻標志碼:A DOI: 10.16157/j.issn.0258-7998.245114
中文引用格式: 楊嘉佳,關健,李正,等. ?FA:一種基于向量指令集的高性能數據處理算法[J]. 電子技術應用,2024,50(11):85-88.
英文引用格式: Yang Jiajia,Guan Jian,Li Zheng,et al. ?FA: a high-performance data processing algorithm based on vector instruction set[J]. Application of Electronic Technique,2024,50(11):85-88.
ßFA: a high-performance data processing algorithm based on vector instruction set
Yang Jiajia,Guan Jian,Li Zheng,Yu Zengming,Yao Wangjun
The Sixth Research Institute of China Electronics Corporation
Abstract: Regular expression matching technology plays a significant role in data processing tasks such as data cleaning, parsing, and extraction. However, due to issues such as strong data dependency and unpredictable memory access in the matching process, the matching performance is relatively low. In response to this problem, this paper proposes a high-performance regular expression data processing algorithm based on vector instruction set, which is called ßFA. By using vector instructions to read a sequence of consecutive characters at once, and performing vector matching with the non-trusted character set corresponding to the most frequently accessed state, built-in functions can be utilized to find the position of the first non-trusted character, thus obtaining the number of characters that can be skipped directly, thereby accelerating the matching performance. Experimental results show that the throughput of the ßFA algorithm is superior to the original DFA algorithm and the αFA algorithm, being 4.67~60 times faster than the original DFA algorithm and 4.37~7.82 times faster than the αFA algorithm.
Key words : regular expression matching;vector instruction set;high-performance data processing

引言

數據處理能力是大數據時代的核心要素之一,決定了真實數據環境下是否滿足數據線速處理的要求。正則表達式匹配技術可作為數據清洗、提取解析和數據檢測等數據處理任務的有效解決手段之一。例如,基于Linux系統的Awk、Vim、Perl工具以及開源網絡入侵檢測系統Bro IDS[1]等都使用了正則表達式的匹配功能。

正則表達式匹配的有效手段通常分為確定型有限自動機(Deterministic Finite Automata, DFA)和基于非確定型有限自動機(Nondeterministic Finite Automata, NFA)[2]。兩者各有其特點,NFA空間復雜性較低,但因為一次字符輸入可能會引發數目不定的多個狀態轉移,造成匹配時間復雜性較大。相反,原始DFA的時間復雜性低且為O(1),但存在空間開銷大的問題。

在大數據處理背景下,正則表達式的匹配性能是最重要的衡量因素,因此DFA成為解決匹配性能方案的首選。針對DFA空間開銷大的問題,現已存在很多優秀的研究成果[3]。然而,DFA匹配過程中存在數據強依賴關系,造成其不能很好地適用于高性能數據處理環境。

因此,針對DFA匹配性能較低的問題,本文利用Intel的向量指令集對DFA匹配進行加速。通過一次性讀入若干連續字符,然后并行判斷其是否屬于最常被訪問狀態的非信任字符集,獲取無需訪問內存狀態轉移表即可直接跳過的字符數,從而減少匹配時間的消耗以達到性能加速目的。


本文詳細內容請下載:

http://m.jysgc.com/resource/share/2000006215


作者信息:

楊嘉佳,關健,李正,于增明,姚旺君

(中國電子信息產業集團有限公司第六研究所,北京 100083)


Magazine.Subscription.jpg

此內容為AET網站原創,未經授權禁止轉載。
亚洲一区二区欧美_亚洲丝袜一区_99re亚洲国产精品_日韩亚洲一区二区
欧美日韩国产片| 国产精品亚洲综合色区韩国| 9色精品在线| 亚洲电影自拍| 午夜精品亚洲| 亚洲一区在线观看免费观看电影高清| 亚洲国产欧美日韩精品| 国产丝袜一区二区| 国产精品视频一二| 国产精品高清一区二区三区| 欧美色精品在线视频| 欧美精品福利| 欧美—级高清免费播放| 美日韩免费视频| 亚洲欧洲另类国产综合| 一本色道久久综合精品竹菊| 久久精品一区四区| 午夜久久久久| 亚洲欧美国产制服动漫| 一区二区三区欧美亚洲| 日韩性生活视频| 亚洲精品一区二区三区在线观看| 在线日韩av永久免费观看| 黑人极品videos精品欧美裸| 伊人春色精品| 在线精品福利| 亚洲精品1区2区| 亚洲国产高清一区| 亚洲啪啪91| 亚洲精品日本| 9国产精品视频| 中文欧美在线视频| 亚洲一区二区三区在线| 亚洲欧美日韩久久精品| 香蕉成人啪国产精品视频综合网| 亚洲欧美另类综合偷拍| 欧美在线观看视频| 91久久综合亚洲鲁鲁五月天| 亚洲三级国产| 一本久久综合亚洲鲁鲁五月天| 一本色道久久综合亚洲精品婷婷| 9i看片成人免费高清| 亚洲色诱最新| 翔田千里一区二区| 久久琪琪电影院| 欧美激情一区二区在线| 国产精品99一区二区| 国产精品美女主播| 国产一区二区三区自拍| 在线观看视频欧美| 亚洲美女在线视频| 亚洲欧美日韩国产中文| 久久精品国产2020观看福利| 亚洲国产欧美一区二区三区久久 | 一区在线免费| 亚洲高清视频中文字幕| 99热在这里有精品免费| 亚洲欧美日韩精品一区二区| 亚洲国产婷婷| 亚洲午夜精品久久久久久app| 欧美在线电影| 欧美va天堂在线| 欧美视频精品一区| 国模精品一区二区三区色天香| 亚洲国产精品悠悠久久琪琪| 亚洲一区在线观看免费观看电影高清| 亚洲电影中文字幕| 亚洲欧美电影院| 另类专区欧美制服同性| 欧美视频一区二区| 黄色精品一区二区| 一本久久知道综合久久| 亚洲二区免费| 亚洲女性喷水在线观看一区| 另类av一区二区| 国产精品久久久久久模特| 国产综合自拍| 一本色道久久99精品综合| 亚洲成人在线视频播放 | 欧美中文字幕| 欧美高清不卡在线| 国产欧美在线| 99re6热在线精品视频播放速度| 欧美在线啊v| 亚洲在线观看视频| 久久久亚洲成人| 国产精品成人免费视频| 亚洲黄色成人| 欧美中文在线字幕| 在线亚洲精品| 免费视频一区二区三区在线观看| 国产精品一区二区在线| 日韩一级在线| 亚洲人在线视频| 久久久精品免费视频| 国产精品久久久久9999高清| 亚洲精品久久久久久下一站 | 亚洲精品免费一二三区| 欧美一区观看| 欧美三级在线播放| 18成人免费观看视频| 欧美在线短视频| 欧美一级久久久| 欧美三级午夜理伦三级中文幕| 亚洲二区视频| 久久国产精品久久久| 久久成人精品电影| 国产精品国产三级欧美二区| 亚洲精品中文字幕女同| 亚洲国产天堂久久综合网| 久久精品国亚洲| 国产精品视屏| 亚洲视频在线观看| 国产精品99久久久久久有的能看| 欧美精品日韩一区| 亚洲福利视频在线| 亚洲电影成人| 老巨人导航500精品| 激情欧美一区| 久久www成人_看片免费不卡| 久久成人这里只有精品| 国产日韩一区欧美| 亚洲欧美在线免费| 欧美一区二区在线免费播放| 国产女精品视频网站免费 | 久久久国产精品一区二区中文| 国产欧美日韩在线| 亚洲欧美日韩国产成人| 欧美在线日韩在线| 国产视频一区二区在线观看 | 国产精品一区二区久激情瑜伽| 在线亚洲精品福利网址导航| 在线亚洲欧美| 欧美天天视频| 亚洲伊人一本大道中文字幕| 午夜亚洲影视| 国产精品亚发布| 亚洲欧美视频在线观看视频| 欧美专区日韩专区| 国产亚洲在线| 亚洲国内精品| 欧美精品导航| 中文精品视频| 欧美自拍偷拍午夜视频| 国产一区二区在线免费观看| 欧美在线高清视频| 欧美成人精品h版在线观看| 亚洲激情视频网| 一区二区三区四区五区视频| 国产精品美女一区二区在线观看 | 久久精品国产77777蜜臀| 一区免费观看视频| 日韩视频免费观看高清完整版| 欧美日本亚洲韩国国产| 亚洲一区三区电影在线观看| 久久精品国产清高在天天线| 亚洲大胆人体视频| 中文国产成人精品| 国产欧美高清| 亚洲国产婷婷香蕉久久久久久| 欧美日韩国产首页在线观看| 亚洲一二三区视频在线观看| 久久精品最新地址| 亚洲国产精品热久久| 亚洲视频一区在线观看| 国产婷婷色一区二区三区在线| 亚洲国产三级网| 国产精品国码视频| 久久精品一级爱片| 欧美日韩国产免费| 性欧美办公室18xxxxhd| 欧美大片在线观看| 正在播放亚洲一区| 久久免费高清视频| 日韩视频在线你懂得| 久久成人精品无人区| 在线观看亚洲精品视频| 亚洲免费在线视频一区 二区| 国内一区二区在线视频观看| 日韩午夜免费| 国产欧美在线| 99视频一区二区三区| 国产日韩综合| 99在线精品视频在线观看| 国产伦精品一区二区三区视频孕妇 | 激情久久久久久久| 亚洲午夜久久久久久尤物 | 夜夜嗨av一区二区三区免费区| 久久成人综合网| 亚洲免费观看高清完整版在线观看熊 | 欧美在线日韩精品| 国产精品免费观看视频| 久久超碰97人人做人人爱| 欧美日韩美女在线| 亚洲成色精品| 国产精品www色诱视频| 亚洲欧洲一区二区在线播放| 国产精品永久免费视频| 99ri日韩精品视频| 精品福利免费观看|