原標題:深入淺出元數據及元數據管理
大數據時代下,數據已被公認為一項重要的資產。而元數據管理作為數據管理框架中一項重要的管理職能,也越來越多的出現在大家的視野中。但是對于元數據的概念以及元數據有什么用,非業內人士可能理解的不夠清晰。本文將從元數據的概念、元數據管理的作用以及如何做元數據管理這三個方面來介紹一下元數據的基礎知識。
元數據的定義是“關于數據的數據”,但剛接觸這個定義,還是不好理解元數據和數據的關系。這里給大家分享一句《DAMA數據管理知識體系指南》中的解釋,元數據與數據的關系就像數據與自然界的關系,數據反映了真實世界的交易、事件、對象和關系,而元數據則反映了數據的交易、事件、對象和關系等。簡單來說,只要能夠用來描述某個數據的,都可以認為是元數據。
舉兩個例子:
如果將圖書館里面的某一本書當作數據,那么所有用來形容這本書的數據比如書名、書的作者、書的所屬類別等都是這本書的元數據。
如果將一部電影看作數據,那么你在該電影海報上看到的所有信息,如電影名、導演、演員、制片人、電影類型等,都可以認為是這部電影的元數據。
對于企業而言,元數據是跟企業所使用的物理數據、業務流程、數據結構等有關的信息,描述了數據(如數據庫、數據模型)、概念(如業務流程、應用系統、技術架構)以及它們之間的關系。
理解了元數據的概念后,我們發現元數據有很多、很雜亂,也不知道怎么用,此時我們需要做元數據的管理。元數據管理是指通過計劃、實施和控制活動,以實現輕松訪問高質量的整合的元數據。
元數據管理到底有什么用?我們還是以前面講到的圖書館的例子來講,對圖書的元數據管理,其實跟圖書館的目錄卡片類似,通過目錄卡片可以清楚的查詢到圖書館中保存了哪些書、在圖書館的什么位置,目錄卡片上面的信息就是圖書的元數據,假如沒有目錄卡片,我們在圖書館里查找書籍將像大海撈針一樣困難。
圖書館的目錄卡片只是一個很簡單的元數據管理,在企業中,元數據管理會更為全面,難度更高,同時也將帶來更多的收益:
要實現企業元數據管理有兩大基本步驟,一是創建和維護元數據,搞清楚要管理哪些元數據以及這些元數據在什么地方,以何種形態存儲,他們之間又有著怎樣的聯系。二是建立元數據的模型(元模型),要抽象出企業的元模型,建立個元模型之間的邏輯關系。
下面以億信元數據管理平臺為例,講講如何實現這兩大基本步驟:
創建和維護元數據
億信元數據管理平臺內置豐富的采集適配器,通過自動化的采集方式,幫助企業完成數據信息、服務信息與業務信息的采集,自動調取企業內部的元數據。同時,該平臺通過多種分析方式幫助企業分析數據流向,具體到字段級的數據解析,如血緣分析、影響分析、關聯度分析等,幫助企業獲取數據上下游、對象關聯對象等等關系,快速定位問題字段,幫助企業降低數據問題的定位難度。
建立元模型
元數據建模是對企業要管理的元數據進行結構化、模型化。元模型的構建要一般要參考公共倉庫元模型CWM,但也不能照搬CWM,否則構建的元模型太過臃腫,不夠靈活。億信元數據管理平臺中的元模型支持CWM規范的同時,提供了一套便捷的自定義管理接口功能,可完全自定義擴展,能夠滿足元數據管理快速實施的需要,可適應用戶在不同時期的不同管理需要。
小結:元數據管理是企業數據治理的基礎。通過元數據管理,可以形成系統化數據資產的準確視圖,從而精確把握數據獲取數據,把數據轉為有價資產。返回搜狐,查看更多
責任編輯: