《電子技術(shù)應(yīng)用》
您所在的位置:首頁 > 其他 > 設(shè)計應(yīng)用 > 面向卷級存儲系統(tǒng)即時恢復(fù)的高效索引方法
面向卷級存儲系統(tǒng)即時恢復(fù)的高效索引方法
2014年電子技術(shù)應(yīng)用第7期
張 良, 曹社香
黃河科技學(xué)院 信息工程學(xué)院,河南 鄭州450063
摘要: 提出了分段分時和支持增量式查找的層次式時空索引(HSTIM)算法,將歷史時間分片,建立磁盤邏輯地址的分段索引,通過并行查找提高檢索速度;在時間片間插入索引快照,支持歷史數(shù)據(jù)的“拉桿式”快速查詢和恢復(fù),有效解決了傳統(tǒng)索引查詢時間的RPO指標(biāo)瓶頸。綜合比較了HSTIM、OVBT和B+索引方法的性能,結(jié)果表明HSTIM能較好地滿足卷級存儲歷史任意點(diǎn)即時恢復(fù)的索引需要,在增量恢復(fù)上有較好的性能。
關(guān)鍵詞: 存儲 恢復(fù) 增量 索引
中圖分類號: TP391
文獻(xiàn)標(biāo)識碼:A
文章編號: 0258-7998(2014)07-0116-03
An effective index method providing timely recovery for block-level storage system
Zhang Liang, Cao Shexiang
Information Engineering College, Huanghe Science and Technology College, Zhengzhou 450063, China
Abstract: The paper presents a hierarchical spatial-temporal index and incremental query method named HSTIM. By partitioning the entire time domain into slices, LBAs are divided into segments with each index file. Retrieval speed can be greatly improved by querying them in parallel. A new variation of overlapping snapshot is presented, which provides efficient incremental query and supports “sliding-bar” recovery, resoving the RPO performance bottleneck in traditional index query. Comparing HSTIM with non-improved OVBT and traditional B+-tree index in many aspects, experiments show that HSTIM can well satisty the index needs of instantly restoring the block-level storage arbitrary history point and has good performance on incremental recovery.
Key words : storage; recovery; incremental; index

       對業(yè)務(wù)系統(tǒng)連續(xù)性要求較高的企業(yè)或機(jī)構(gòu),其數(shù)據(jù)安全極為重要[1]。傳統(tǒng)的RAID、遠(yuǎn)程鏡像、周期性備份和快照等技術(shù)都會引起數(shù)據(jù)丟失的問題[2-4]。因此對數(shù)據(jù)可靠性和安全級別要求較高的業(yè)務(wù)部門急需存儲系統(tǒng)能提供連續(xù)數(shù)據(jù)保護(hù)(CDP)功能[5]

        國內(nèi)外在CDP系統(tǒng)研究方面已經(jīng)開展了大量研究[6]。但這些工作主要集中在存儲架構(gòu)設(shè)計、存儲空間優(yōu)化和一致點(diǎn)恢復(fù)等方面,對快速恢復(fù)研究不多。針對海量的塊級變化數(shù)據(jù),設(shè)計高效快速的索引方法是個研究難點(diǎn)。本文主要針對卷級系統(tǒng)歷史數(shù)據(jù)索引和查詢的優(yōu)化,提出一種面向連續(xù)數(shù)據(jù)的分時分段的層次式快速索引方法HSTIM(Hierarchical Spatial-Temporal Indexing Method)。 

1 HSTIM設(shè)計 

        在磁盤邏輯卷層次,數(shù)據(jù)由連續(xù)的數(shù)據(jù)塊組成。每個數(shù)據(jù)塊有固定的大小,并通過邏輯塊地址LBA來標(biāo)識。連續(xù)數(shù)據(jù)保護(hù)實(shí)現(xiàn)的關(guān)鍵技術(shù)是對數(shù)據(jù)變化的記錄和保存,以便實(shí)現(xiàn)任意時間點(diǎn)的快速恢復(fù)。CDP一般有3種實(shí)現(xiàn)方式:基準(zhǔn)參考數(shù)據(jù)模式、復(fù)制參考數(shù)據(jù)模式和合成參考數(shù)據(jù)模式[7-8]。其中,合成參考數(shù)據(jù)模式是前兩種模式性能的折衷,較好地實(shí)現(xiàn)了前兩種模式的妥協(xié),因此可以得到較好的資源占用和恢復(fù)時間效果,但需要復(fù)雜的軟件管理和數(shù)據(jù)處理功能,實(shí)現(xiàn)比較復(fù)雜。

1.1 分時分段索引數(shù)據(jù)組織 

        HSTIM中索引數(shù)據(jù)按分時和分段策略組織,數(shù)據(jù)組織如圖1所示。圖1例中在t3~t4時間段內(nèi)共產(chǎn)生N+1個索引文件(元數(shù)據(jù)單獨(dú)索引)。段區(qū)間的長度采用不等成劃分方法,長度按磁盤寫IO密度來確定。索引文件記錄了Rt(a) ,即t時刻邏輯地址為a的增量數(shù)據(jù)在增量存儲空間的位置。為加速索引的讀取速度,可采用多個物理硬盤存放索引文件。

1.2 索引快照 

        索引快照提取了一個時間段的索引階段結(jié)果。在圖2的例子中,t1和t2兩個時刻插入了索引快照。所有索引快照結(jié)果存放至一個獨(dú)立的索引文件,如圖2的右側(cè)的索引快照獨(dú)立索引文件。快照獨(dú)立索引文件采用OVBT索引方式。如果用戶需要查詢圖1中t時刻的索引結(jié)果,則可通過先查詢索引快照獲得t1和t2時刻的索引,然后查詢t2~t時刻的索引,最后將索引結(jié)果進(jìn)行合并即可。HSTIM通過索引快照避免了索引數(shù)據(jù)的全查詢,加快了特定時刻索引的快速查詢,尤其適用于歷史數(shù)據(jù)保護(hù)時間窗口較長的應(yīng)用場景。由于索引快照文件較小,在實(shí)現(xiàn)上沒有采用分段策略,即將LBA地址從0~MAX索引快照存放至一個索引文件中。

1.3 增量式快速查找 

        HSTIM通過改進(jìn)OVBT索引節(jié)點(diǎn)結(jié)構(gòu)實(shí)現(xiàn)了增量查找支持。原先的OVBT內(nèi)部節(jié)點(diǎn)包括了引用數(shù)目和分裂值列表。HSTIM中的內(nèi)部節(jié)點(diǎn)通過新增時間戳列表實(shí)現(xiàn)了增量查找。HSTIM和OVBT的內(nèi)部結(jié)構(gòu)比較如圖3所示。

        卷級CDP一次IO更新產(chǎn)生一條索引記錄項(xiàng),索引記錄項(xiàng)可用{LBA,timestamp,R}表示,其中LBA表示IO的LBA地址,timestamp表示時間戳,R代表數(shù)據(jù)在存儲池中的位置。OVBT索引需要對每一個索引項(xiàng)進(jìn)行記錄,針對每一個IO的時間戳生成一個獨(dú)立的B+樹索引。OVBT有兩種類型的節(jié)點(diǎn):葉子節(jié)點(diǎn)和非葉子節(jié)點(diǎn)。兩種節(jié)點(diǎn)由通用的索引項(xiàng){ref, entries}組成,其中ref表示節(jié)點(diǎn)被引用的次數(shù),entries 由{entry, entry,…, entry}列表組成。每個entry由{key, timestamp, info}3個元素構(gòu)成。對葉子節(jié)點(diǎn),key表示IO的LBA地址,timestamp表示時間戳,info表示數(shù)據(jù)在存儲池中的位置,即索引記錄項(xiàng)中的R。對非葉子節(jié)點(diǎn),key代表B+的分裂鍵值,timestamp代表所指向下一層節(jié)點(diǎn)的插入時間,info是指向下一層節(jié)點(diǎn)的指針。 

        為記錄每一更新IO產(chǎn)生的B+樹的根節(jié)點(diǎn),OVBT維護(hù)一張根節(jié)點(diǎn)記錄表(root table)。根節(jié)點(diǎn)記錄表由{root, root,…, root}列表組成,每個root項(xiàng)由{timestamp, ptr}組成,其中timestamp代表獨(dú)立B+樹的產(chǎn)生時間,ptr指向B+樹的根節(jié)點(diǎn)。 

2 性能評測

2.1 測試方法和實(shí)驗(yàn)平臺 

        通過對實(shí)際應(yīng)用中的IO trace文件進(jìn)行回放的方式對HSTIM性能進(jìn)行了評測。測試選擇的IO trace是Msr-cambridge Trace。該Trace文件采集了企業(yè)數(shù)據(jù)中心13臺服務(wù)器上共36個磁盤卷連續(xù)14天的塊級數(shù)據(jù)。實(shí)驗(yàn)選取文件集合中數(shù)據(jù)量最大的文件CAMRESISAA02_ lvm1.csv(以下簡稱AA02_Trace)作為樣本。所有的IO請求塊都按最小磁盤扇區(qū)大小(512 B)進(jìn)行了等長切割和對齊存儲。實(shí)驗(yàn)平臺主要硬件包括Pentium(R) Dual-core E5200 2.50 GHz處理器、4 GB DDR2內(nèi)存和500 GB Seagate ST3500620A硬盤, 操作系統(tǒng)是Windows 7。 

2.2 HSTIM與B+-tree和OVBT性能綜合比較 

        實(shí)驗(yàn)對AA02_Trace文件進(jìn)行了24 h的數(shù)據(jù)回放,經(jīng)統(tǒng)計在24 h內(nèi),系統(tǒng)共產(chǎn)生8 660 679個IOR (寫IO請求)。如果對每個IOR按512 B等長切割,則共產(chǎn)生224 356 508個對齊的塊級IO(Aligned Block IO,以下簡稱ABI),表1給出了AA02_Trace文件24 h內(nèi)的寫IO統(tǒng)計結(jié)果。為描述方便,本實(shí)驗(yàn)中對HSTIM采用了等長分時,時長分別為0.5 h和2 h,分別稱HSTIM-0.5和HSTIM-2。實(shí)驗(yàn)從索引文件大小、插入性能和查詢性能三方面對HSTIM、B+-tree和OVBT進(jìn)行了綜合比較,給出了周期為2 h的性能統(tǒng)計結(jié)果。

        (1)查詢性能比較 

        表2給出了OVBT與B+-tree的查詢性能比較。實(shí)驗(yàn)表明,B+-tree的查詢速度在RPO小于5 h可以接受,基本在1 min內(nèi)得出查詢結(jié)果。但在RPO大于5 h的情況下,查詢性能急劇下降,在RPO=6 h查詢時間為838 s,RPO=12 h查詢時間長達(dá)2.27 h。對OVBT而言,由于每一個時間點(diǎn)索引數(shù)據(jù)由一顆獨(dú)立B+樹組成,查詢時間相對穩(wěn)定。RPO小于12 h內(nèi)任意點(diǎn)查詢時間小于44 s。本實(shí)驗(yàn)同時說明,傳統(tǒng)的分別對LBA和Timestamp建立B+-tree的索引方式不適合大數(shù)量的任意點(diǎn)恢復(fù)索引的需要。

        HSTIM由于采用分時策略并將分時索引快照獨(dú)立組織,因此查詢時間包括索引快照查詢時間和時間段內(nèi)索引查詢時間。圖4給出了HSTIM-2、HSTIM-0.5和OVBT的查詢性能比較。實(shí)驗(yàn)結(jié)果表明,HSTIM在查詢性能上較OVBT有較大提高。在RPO=24 h,HSTIM-0.5的查詢時間僅為OVBT的11.6%。HSTIM-0.5與HSTIM-2相比,由于分時頻率高,因此查詢索引快照時間略長于HSTIM-2,但時段內(nèi)的索引查詢速度明顯少于HSTIM-2。但從整體上看,HSTIM-0.5和HSTIM-2的查詢速度并無大的差別。

        (2)索引空間消耗比較 

        圖5給出了OVBT與B+-tree索引空間比較結(jié)果。測試表明,OVBT索引存儲空間平均是B+-tree的5.2~5.5倍。由于OVBT內(nèi)部有大量重復(fù)數(shù)據(jù),采用壓縮工具對索引文件進(jìn)行壓縮,壓縮后的OVBT索引文件大小平均僅為原索引文件的3%。但壓縮帶來的問題是,恢復(fù)時需要引入額外的解壓縮時間開銷。為減少存儲空間,在實(shí)際應(yīng)用中可以將離當(dāng)前時間點(diǎn)較遠(yuǎn)的索引文件壓縮存儲。

        本文針對卷級CDP任意點(diǎn)恢復(fù)提供了一種快速的索引方法-HSTIM,并對該方法的性能進(jìn)行了評估。實(shí)驗(yàn)結(jié)果表明,在一定的備份窗口內(nèi),HSTIM能為卷級CDP任意點(diǎn)的恢復(fù)提供快速索引支持。高效的索引可快速定位到變化數(shù)據(jù)在增量空間中的存放位置,解決恢復(fù)中數(shù)據(jù)“在哪里”的問題。

參考文獻(xiàn)

[1] 梁知音,段鐳,韋韜,等. 云存儲安全技術(shù)綜述[J].電子技術(shù)應(yīng)用, 2013,39(4):130-132.

[2] SMITH D M. The cost of lost data[J]. Journal of Contemporary Business Practice, 2003,6(3):113-119.

[3] PATTERSON D, BROWN A, BROADWELL P, et al. Recovery oriented computing(ROC): motivation, definition, techniques, and case studies[R]. Computer Science Technical Report UCB/CSD-0201175, San Francisco: U.C. Berkeley, 2002:997-1013.

[4] SANKARAN A, GUINN K, NGUYEN D.  Volume shadow copy service[J]. Power, 2004,14(2):2272-2284.

[5] SNIA. Continuous data protection-solving the problem of Recovery[EB/OL].(2008-08-08)[2014-02-22].http://www.snia.org/forums/dmf/knowledge/white_papers_and_reports/CDP_Solving_recovery_20080808.pdf.

[6] SNIA.DMF-Getting_started_with_ILM-20050415[EB/OL].(2005-04-15)[2014-02-22].http://www.snia.org/forums/dmf/programs/ilmi/DMF-Getting_started_with_ILM-20050415.pdf. 

[7] PIERNAS J, CORTES T,CARC′IA J, DualFS: a new journaling file system without meta-data duplication[C]. In Proceedings of the 16th International Conference on Supercomputing. New York: ACM press, 2002:146-159. 

[8] KAVALANEKAR S, WORTHINGTON B, ZHANG Q, et al.Characterization of storage workload traces from production Windows servers[C]. In IEEE International Symposium on Workload Characterization, IEEE press, 2008:671-686. 

此內(nèi)容為AET網(wǎng)站原創(chuàng),未經(jīng)授權(quán)禁止轉(zhuǎn)載。
亚洲一区二区欧美_亚洲丝袜一区_99re亚洲国产精品_日韩亚洲一区二区
欧美中文字幕第一页| 99国产精品国产精品毛片| 亚洲激情国产精品| 精品成人a区在线观看| 国产一区在线视频| 国产伦精品一区二区三区照片91| 欧美调教vk| 欧美日韩日本国产亚洲在线| 欧美电影免费观看| 欧美成人性网| 欧美激情欧美激情在线五月| 免费在线观看成人av| 卡通动漫国产精品| 麻豆精品91| 另类国产ts人妖高潮视频| 久久一区中文字幕| 蜜桃av一区二区| 欧美aa国产视频| 欧美福利电影在线观看| 欧美二区在线播放| 欧美另类99xxxxx| 欧美理论大片| 欧美网站在线| 国产精品欧美日韩一区| 国产乱码精品一区二区三| 国产九九视频一区二区三区| 国产精品一区二区久久久久| 国产精品免费一区豆花| 国产欧美一区二区精品性色| 国产欧美精品一区二区色综合| 国产色产综合色产在线视频| 国内精品久久久| 亚洲国产99精品国自产| 亚洲人在线视频| 一本综合久久| 亚洲欧美日韩综合一区| 久久高清国产| 亚洲精品免费看| 亚洲视频在线观看三级| 欧美亚洲一级片| 久久人人看视频| 欧美国产日本高清在线| 欧美日韩国产色视频| 国产精品入口尤物| 狠狠色狠色综合曰曰| 亚洲国产专区校园欧美| 日韩亚洲视频在线| 亚洲欧美日韩在线高清直播| 亚洲国产精品v| 亚洲视频图片小说| 久久精品视频在线| 欧美国产免费| 国产精品免费一区二区三区观看| 国内成人精品视频| 亚洲精品你懂的| 亚洲免费在线视频一区 二区| 欧美在线观看一二区| 99精品国产高清一区二区| 欧美亚洲一区在线| 欧美成人免费观看| 国产精品美女久久久久av超清| 国产一区日韩二区欧美三区| 最新亚洲激情| 亚洲欧美影音先锋| 亚洲美女精品久久| 欧美一级视频| 欧美破处大片在线视频| 国产丝袜一区二区| 日韩一区二区精品在线观看| 欧美中文字幕| 亚洲一卡久久| 美女黄毛**国产精品啪啪| 国产精品草莓在线免费观看| 激情文学一区| 亚洲午夜三级在线| 亚洲精品1234| 久久精品二区亚洲w码| 欧美日韩精品免费观看视频| 国外成人在线视频| 一区二区高清在线| 亚洲国产精品www| 欧美亚洲视频在线看网址| 欧美精品日韩三级| 狠狠色丁香婷婷综合久久片| 99日韩精品| 亚洲精品视频在线播放| 久久精品一二三| 国产精品久久久久91| 亚洲高清av在线| 欧美一区网站| 午夜亚洲一区| 欧美日韩你懂的| 亚洲国产高清高潮精品美女| 欧美夜福利tv在线| 亚洲永久视频| 欧美噜噜久久久xxx| 伊人久久婷婷| 午夜在线电影亚洲一区| 亚洲午夜电影网| 欧美精品久久一区二区| 在线免费精品视频| 欧美一区二区在线播放| 午夜精品视频一区| 欧美午夜电影在线| 亚洲精品激情| 亚洲老板91色精品久久| 免费看的黄色欧美网站| 国产亚洲欧美aaaa| 午夜精品福利在线| 亚洲欧美日韩天堂| 国产精品99一区二区| 亚洲久久视频| 99国产精品视频免费观看一公开| 免费成人黄色av| 韩国av一区二区| 欧美专区在线观看| 欧美影院成年免费版| 国产精品视频久久| 亚洲深夜福利网站| 亚洲一区二区在线免费观看| 欧美日韩精品高清| 99国产精品久久久久久久成人热| 亚洲美女黄色| 欧美人成在线| 亚洲九九爱视频| 国产精品99久久不卡二区| 欧美日韩午夜| 中文久久精品| 亚洲欧美三级伦理| 国产精品久久77777| 亚洲一区二区综合| 性刺激综合网| 国产嫩草一区二区三区在线观看| 亚洲制服少妇| 久久九九99视频| 影音先锋中文字幕一区二区| 最新成人av网站| 欧美精品一区二区三区在线播放 | 欧美一区二区三区另类| 久久激五月天综合精品| 国产一区二区日韩精品欧美精品 | 亚洲国产日韩欧美在线图片| 欧美r片在线| 亚洲精品之草原avav久久| 亚洲永久视频| 国产午夜久久久久| 亚洲国产精品视频一区| 欧美精品1区2区| 在线视频亚洲| 久久精品国产一区二区三区免费看| 国内精品久久久久久久影视麻豆| 亚洲国产日韩一区| 欧美久久久久免费| 亚洲欧美电影在线观看| 久久久久久日产精品| 亚洲国产高清一区| 亚洲一区二区三区影院| 国产三级欧美三级| 亚洲三级毛片| 国产精品高清网站| 久久国产精彩视频| 欧美经典一区二区三区| 亚洲一二三区精品| 久久午夜视频| 一本色道精品久久一区二区三区 | 亚洲娇小video精品| 欧美日韩亚洲一区二区| 午夜欧美视频| 欧美精品国产一区| 亚洲在线视频免费观看| 女人香蕉久久**毛片精品| 在线视频一区观看| 玖玖玖国产精品| 宅男66日本亚洲欧美视频| 久久久777| 日韩一级精品| 久久午夜视频| 亚洲天堂久久| 免费在线成人av| 亚洲一级在线| 欧美国产在线观看| 午夜一区在线| 欧美日韩免费观看一区二区三区| 性久久久久久| 欧美精品一级| 久久er99精品| 欧美三级小说| 亚洲黄色免费| 国产日韩av一区二区| 日韩一级视频免费观看在线| 国产私拍一区| 亚洲一区二区三区国产| 亚洲高清一区二| 欧美在线亚洲| 一区二区欧美在线| 欧美mv日韩mv国产网站| 欧美一二三区精品| 国产精品国产三级国产普通话蜜臀| 亚洲人成精品久久久久| 国产精品自在欧美一区|