ßFA:一種基于向量指令集的高性能數據處理算法
所屬分類:技術論文
上傳者:wwei
文檔大?。?span>3357 K
標簽: 正則表達式匹配 向量指令集 高性能數據處理
所需積分:0分積分不夠怎么辦?
文檔介紹:正則表達式匹配技術在數據清洗、解析提取等數據處理任務方面發(fā)揮重大作用。然而,由于匹配過程中存在數據強依賴關系和內存訪問不可預測等問題,造成匹配性能較低。針對此問題,提出一種基于向量指令集的高性能正則表達式數據處理算法,稱之為ßFA:通過向量指令一次性從內存讀出若干連續(xù)字符,并與最常被訪問狀態(tài)對應的非信任字符集進行向量匹配,利用內置函數定位首個非信任字符的位置,獲得可直接跳過的字符數,從而實現匹配性能的加速。實驗結果表明,ßFA算法的吞吐率優(yōu)于原始DFA算法和αFA算法,是原始DFA算法的4.67~60倍以及ɑFA算法的4.37~7.82倍。
現在下載
VIP會員,AET專家下載不扣分;重復下載不扣分,本人上傳資源不扣分。