《電子技術應用》
您所在的位置:首頁 > 測試測量 > 設計應用 > 基于DAG的Hive數據溯源方法
基于DAG的Hive數據溯源方法
2020年信息技術與網絡安全第11期
杜 娟1,蘇秋月2
1.61646部隊,北京100192;2.四川大學,四川 成都610065
摘要: 數據溯源能夠快速定位數據的來源及其產生過程,對審計、數據生命周期管理都有很大幫助,是數據安全防護中的重要一環。針對傳統數據溯源機制難以應用于Hive數據倉庫中大規模、復雜的數據處理的問題,提出了一種基于DAG的數據溯源方法,實現了對Hive中數據的溯源。最后通過實驗對該方法的有效性以及性能進行了測試與驗證。
中圖分類號: TP311.13
文獻標識碼: A
DOI: 10.19358/j.issn.2096-5133.2020.11.005
引用格式: 杜娟,蘇秋月. 基于DAG的Hive數據溯源方法[J].信息技術與網絡安全,2020,39(11):31-37.
Hive data provenance method based on DAG
Du Juan1,Su Qiuyue2
1.Unit 61646 of PLA,Beijing 100192,China;2.Sichuan University,Chengdu 610065,China
Abstract: Data provenance can quickly locate the source of data and its production process, which is of great help to audit and data life cycle management. It is an important part of data security protection. Aiming at the problem that traditional data provenance mechanisms are difficult to apply to large-scale and complex data processing in Hive data warehouses, this paper proposes a data traceability method based on Directed Acyclic Graph(DAG). It can implement the traceability of Hive data. Finally, the effectiveness and performance of this method are tested and verified by experiments.
Key words : data provenance;big data;directed acyclic graph

0 引言

    Hive是基于Hadoop的開源數據倉庫工具,它提供了豐富的SQL查詢方式來分析存儲在Hadoop分布式文件系統中的數據:可以將結構化的數據文件映射為一張數據庫表,并提供完整的SQL查詢功能;可以將SQL語句轉換為MapReduce任務運行,通過自己的SQL查詢分析需要的內容。這套SQL簡稱Hive SQL,使不熟悉MapReduce的用戶可以很方便地利用SQL語言查詢、匯總和分析數據[1]。由于Hive在數據存儲和分析上的靈活性,眾多企業用它存儲重要數據。這些敏感的商業數據被大量企業內部人員訪問和操作,一旦發生人為誤操作或違規操作,很容易導致數據的泄露。現有大數據平臺上的數據安全防護方案缺乏對敏感數據靈活的訪問控制,難以對數據的生命周期及用戶操作行為進行精確的追蹤溯源,無法提供對大數據合規審計管理的支撐。因此,如何提供有效的安全防護機制來保障Hive中數據的安全,是目前研究的重點。

    數據溯源也稱為數據血緣、數據譜系等,數據溯源技術根據追蹤路徑重現數據的歷史、狀態和演變過程,實現數據歷史檔案的追溯[2]。通過數據溯源能追蹤到異常發生的原因,還能幫助人們確定數據倉庫中各項數據的來源。國內外學者在數據溯源技術上進行了深入研究。在數據溯源模型方面,汪洪昕[3]提出了數據染色體溯源模型,更加完善地揭示數據傳播過程中的變化及數據的關系,并在Hadoop平臺中得以實現。郝鵬飛[4]通過對大數據模型分析平臺工作流特征分析,討論了基于Oozie模型工作流的數據溯源問題。

    目前針對數據庫的數據溯源追蹤主要有兩種方法:(1)基于標注的方法[5],此類方法雖然實施起來比較簡單,但需要額外的存儲空間且隨著處理的數據量增加其執行效率會降低,難以直接應用于維護著海量數據的Hive數據倉庫;(2)基于逆置函數的方法[6],此類方法需要的存儲空間較小,但不是所有的數據處理都可以逆置,且其溯源追蹤的性能完全取決于逆置機制。對于Hive數據倉庫中復雜的數據處理,要構造一個良好的逆置機制難度較大。Hive數據的溯源重點在于數據沿襲問題,而給定數據的數據沿襲問題可以概括為建立數據的血緣關系,得到其產生過程以及源數據。

    對于數據倉庫中數據溯源問題,柯潔[7]等人基于W3C的PROV模型對ETL過程的數據溯源進行了深入分析,并提出了相應的數據溯源算法。文獻[8-9]討論了數據倉庫中的數據譜系跟蹤問題,提供了譜系跟蹤算法以及溯源過程中屬性映射和轉換起源集的求解方法。但這些研究均針對傳統數據倉庫中的數據溯源,難以應用于大數據環境下Hive的數據溯源。針對大數據環境,文獻[10]提出了一種基于層的數據溯源架構,其中包括大數據來源的捕獲及可視化,并且在溯源數據中引入了一種訪問控制機制。文獻[11-13]總結了數據庫中的數據溯源技術,分析了在Hadoop環境下數據溯源面臨的研究挑戰,并從數據溯源模型、溯源數據存儲、溯源查詢語言等方面梳理了現有解決方案。Apache Atlas是Hadoop社區為解決Hadoop生態系統的元數據治理問題而產生的開源項目,它為Hadoop集群提供了包括數據分類、集中策略引擎、數據溯源、安全和生命周期管理在內的元數據治理核心能力[14],因此可以將Apache Atlas引入到Hive數據溯源中。

    針對傳統數據溯源機制難以滿足Hive中大規模、復雜的數據處理問題,本文提出了基于有向無環圖(Directed Acyclic Graph,DAG)的數據溯源方法。通過對Apache Atlas進行擴展,在Hive中實現了該數據溯源方法,并通過實驗證明該方法可為Hive提供準確、高效的數據溯源機制,也為數據安全審計提供了有力支撐。




本文詳細內容請下載:http://m.jysgc.com/resource/share/2000003062




作者信息:

杜  娟1,蘇秋月2

(1.61646部隊,北京100192;2.四川大學,四川 成都610065)

此內容為AET網站原創,未經授權禁止轉載。
亚洲一区二区欧美_亚洲丝袜一区_99re亚洲国产精品_日韩亚洲一区二区
欧美一区二区三区免费观看视频| 亚洲大片在线| 亚洲欧美视频| 国产美女高潮久久白浆| 欧美一区二区三区免费观看视频| 欧美一区二区播放| 尤物99国产成人精品视频| 欧美激情国产精品| 亚洲一区视频在线| 欧美亚洲一区| 亚洲伊人一本大道中文字幕| 极品av少妇一区二区| 欧美精品一区视频| 亚洲国产成人av好男人在线观看| 亚洲国语精品自产拍在线观看| 欧美日韩卡一卡二| 久久精品国产久精国产爱| 亚洲国产另类精品专区 | 国产精品久久毛片a| 欧美怡红院视频| 欧美在线视频在线播放完整版免费观看 | 国产精品国产自产拍高清av| 欧美一级日韩一级| 亚洲欧美另类综合偷拍| 久久精品人人| 一区二区三区国产在线| 国产一区二区中文字幕免费看| 欧美二区在线观看| 欧美一区二区三区播放老司机 | 欧美国产日本高清在线| 欧美精品电影在线| 国产精品福利久久久| 国产美女一区| 精品成人久久| 亚洲精品视频在线观看网站| 国产日韩欧美视频在线| 欧美日韩激情小视频| 欧美四级在线| 欧美电影免费| 欧美日韩亚洲一区二区三区在线 | 一区二区三区高清在线观看| 亚洲欧美日韩在线播放| 亚洲欧美一区二区精品久久久| 欧美亚洲综合网| 亚洲经典一区| 欧美一级电影久久| 亚洲韩国精品一区| 一区二区三区回区在观看免费视频| 亚洲图片欧洲图片av| 亚洲黄色尤物视频| 一卡二卡3卡四卡高清精品视频| 亚洲欧美999| 久久亚洲综合色| 西瓜成人精品人成网站| 中文国产成人精品久久一| 亚洲欧洲偷拍精品| 亚洲视频 欧洲视频| 欧美在线电影| 欧美国产精品久久| 国产精品一区二区三区四区五区| 伊人久久久大香线蕉综合直播| 日韩午夜av在线| 亚洲日本成人| 亚洲风情亚aⅴ在线发布| 99在线观看免费视频精品观看| 亚洲国产欧美一区| 亚洲香蕉视频| 亚洲一区在线视频| 亚洲激情网站免费观看| 亚洲一区在线播放| 美女精品视频一区| 看欧美日韩国产| 久久精视频免费在线久久完整在线看| 亚洲一区二区在| 久久夜色精品亚洲噜噜国产mv| 欧美日本国产| 好吊色欧美一区二区三区四区| 国产一本一道久久香蕉| 亚洲精品偷拍| 亚洲国产欧美另类丝袜| 午夜精品久久久久影视| 亚洲欧美在线一区| 欧美91大片| 欧美韩日亚洲| 国产欧美一区视频| 国产一区二区三区成人欧美日韩在线观看 | 午夜精彩国产免费不卡不顿大片| 免费亚洲婷婷| 国产伪娘ts一区| 亚洲一区激情| 99精品视频免费| 亚洲少妇自拍| 免费毛片一区二区三区久久久| 国产乱码精品一区二区三区不卡 | 亚洲激情在线视频| 欧美在线免费观看| 国产精品av免费在线观看| 国产精品第一区| 亚洲国产一区二区三区青草影视 | 亚洲图片欧美一区| 亚洲欧美日韩精品综合在线观看 | 亚洲午夜精品在线| 欧美国产精品中文字幕| 怡红院精品视频| 欧美一区二区三区另类| 欧美一区二区三区在线免费观看 | 国产午夜精品一区二区三区欧美| 亚洲一区二区三区乱码aⅴ蜜桃女| 一区二区三区四区蜜桃| 欧美精品午夜| 亚洲国产影院| 亚洲毛片在线| 亚洲免费在线精品一区| 欧美日本不卡| 亚洲精品偷拍| 国产精品99久久久久久白浆小说 | 久久精品一区二区三区四区| 久久激情视频| 国产一区二区成人久久免费影院| 亚洲男女自偷自拍| 欧美一区二区精品| 国产欧美精品久久| 亚洲欧美日韩中文在线制服| 午夜一级在线看亚洲| 国产精品日韩欧美综合| 国产农村妇女精品一二区| 亚洲一二区在线| 亚洲一区二区视频在线| 国产精品久久久久99| 亚洲一二三区视频在线观看| 亚洲欧美日韩国产另类专区| 国产精品免费aⅴ片在线观看| 亚洲一区在线播放| 久久精品国产一区二区电影| 国产日韩欧美综合精品| 性欧美暴力猛交另类hd| 久久精品主播| 亚洲国产女人aaa毛片在线| 亚洲乱码视频| 欧美视频在线免费看| 亚洲一区二区四区| 久久视频一区| 亚洲观看高清完整版在线观看| 亚洲午夜日本在线观看| 午夜一区在线| 国模吧视频一区| 一区二区三区高清| 午夜一区二区三视频在线观看| 国产日韩欧美a| 亚洲国产精品成人精品| 欧美美女日韩| 亚洲一区国产一区| 久久亚洲精品中文字幕冲田杏梨| 最近中文字幕日韩精品| 亚洲一区二区影院| 国产一区二区观看| 日韩午夜高潮| 美女视频黄a大片欧美| 亚洲国产婷婷香蕉久久久久久99| 在线亚洲国产精品网站| 国产精品一区一区| 91久久精品国产| 欧美性开放视频| 久久精品免费电影| 欧美日韩伦理在线| 欧美中文字幕第一页| 香蕉视频成人在线观看| 国产一区视频观看| 日韩午夜电影av| 国产精品夜夜夜一区二区三区尤| 亚洲国产成人在线播放| 国产精品国产三级国产普通话99| 久久大逼视频| 欧美日韩中文字幕在线| 欧美在线视频播放| 欧美日韩欧美一区二区| 欧美一区二区三区视频在线| 欧美精品福利视频| 性色av香蕉一区二区| 欧美区一区二区三区| 性欧美办公室18xxxxhd| 欧美日韩国产欧美日美国产精品| 性欧美xxxx视频在线观看| 欧美日韩国内自拍| 亚洲高清在线| 国产精品一区二区视频| 亚洲国产欧美久久| 国产乱码精品| 亚洲视频导航| 亚洲黄色一区| 久久久久久久激情视频| 国语自产精品视频在线看一大j8| 一本色道久久综合狠狠躁的推荐| 国产日韩视频| 亚洲一区二区三区高清 | 久久国产手机看片| 日韩亚洲欧美在线观看| 久久综合给合| 欧美一级二级三级蜜桃| 国产精品第一区|