一種基于Simhash算法的重復(fù)域名數(shù)據(jù)去重方法
所屬分類:技術(shù)論文
上傳者:zhoubin333
文檔大小:559 K
標(biāo)簽: 數(shù)據(jù)去重 域名 Simhash
所需積分:0分積分不夠怎么辦?
文檔介紹:隨著數(shù)字科學(xué)技術(shù)的發(fā)展,各領(lǐng)域需要傳輸和存儲的數(shù)據(jù)量急劇上升。然而傳輸和存儲的數(shù)據(jù)中重復(fù)數(shù)量占據(jù)了很大的比例,這不僅會增加使用數(shù)據(jù)的成本,也會影響處理數(shù)據(jù)的效率。域名是一種存儲量大而且對處理速率有極高要求的數(shù)據(jù),為了節(jié)約域名解析系統(tǒng)的存儲成本,提高傳輸效率,本文在原有數(shù)據(jù)去重技術(shù)的基礎(chǔ)上,引入了Simhash算法,結(jié)合域名數(shù)據(jù)的結(jié)構(gòu)特征,改進(jìn)數(shù)據(jù)分詞和指紋值計(jì)算方式,提出了一種基于Simhash算法的重復(fù)域名數(shù)據(jù)去重方法。實(shí)驗(yàn)結(jié)果表明,相比于傳統(tǒng)的數(shù)據(jù)去重技術(shù),該方法對刪除重復(fù)域名數(shù)據(jù)效率更高,具有較好的實(shí)際應(yīng)用價值。
現(xiàn)在下載
VIP會員,AET專家下載不扣分;重復(fù)下載不扣分,本人上傳資源不扣分。
主站蜘蛛池模板: 欧欧美18videosex性哦欧美美| 再深点灬舒服了灬太大| 亚洲日本在线观看网址| aaa毛片视频免费观看| 最近中文字幕高清字幕8| 全黄裸片一29分钟免费真人版| 2022福利视频| 小蝌蚪app在线观看| 五月天国产成人AV免费观看| 男女边摸边揉边做视频| 国产对白受不了了| 久久丝袜精品综合网站| 欧美日韩国产亚洲一区二区三区| 啊灬啊灬啊灬快灬别进去| 67194久久| 国产高清美女一级毛片图片| 中文字幕伊人久久网| 欧美一级高清片免费一级| 免费黄色小视频网站| 老司机67194精品线观看| 国产精品99久久免费| chinese乱子伦xxxx国语对白| 欧美福利一区二区三区| 台湾swag视频在线观看| 久久久久久不卡| 在线观看免费午夜大片| 中文字幕免费视频精品一| 欧洲97色综合成人网| 亚洲国产aⅴ成人精品无吗| 男人的天堂视频网站清风阁| 国产三级三级三级三级| jizzjizz丝袜老师| 天天做天天躁天天躁| 久久久久久久久久免免费精品| 欧美在线看片a免费观看| 免费一级肉体全黄毛片| 花蝴蝶直播苹果版| 国产欧美日韩综合精品一区二区 | 49pao强力在线高清基地| 尤物视频在线看| 久久人人爽人人爽人人av东京热|