前言
5G 可以實現萬物互聯,于是互聯網大量的數據將來自“物”而不是“人”,而萬物互聯不是簡單地實現了大量數據的自動采集,而是大量的“物” 甚至是“人”的行為不再是傳統意義上等候具體某個人的發號司令和安排,而是真正被數據所驅動, 萬物互聯和數據驅動可以看成“5G+”時代的一體兩面,沒有數據驅動也就沒有真正意義上的萬物互聯 ,然而,數據驅動并不是5G才有的,只是今天更加全面和深入而已 。
一 數據驅動與5G發展
“數據驅動”這個概念最早應該是出現在上世紀九十年代,當時誕生的商業智能的概念是通過數據分析和價值發現改善客戶、產品、基礎設施、盈利方式等業務核心環節的活動安排,從而提升效率和效益,創造價值,而 在“數據驅動”這個概念提出前的信息技術是“功能驅動”和“流程驅動” 的,早期的計算機程序受限于硬件性能和存儲空間,不太可能處理大規模的數據,存儲數據的成本也很高,所以數據依附在算法的結構里面,和公園門票一樣,用過就丟棄了,當然也發揮不了今天的價值。
?
?
圖1 數據地位直接決定了企業信息化生產力水平
即使時間倒退到30多年前,隨著關系型數據庫(RMDB)技術被越來越廣泛使用,各種信息系統沉淀下來可以被重復利用的數據資源也越來越多,可以用數據來做的文章也越來越大,數據的重要性和價值日益凸顯,1996年的時候《Being Digital(數字化生存)》的作者Negroponte(尼葛洛龐帝)就提出數字化生活的概念,而20多年以后的今天,我們已經進入了數字化的生活,移動互聯網、物聯網、手機、各種社交媒體、電子支付等各種數字化技術把我們的生活完全連接到了云端,連接到了網絡。每一個消費者通過手機和設備,成為了一個巨大的數字化網絡的一個節點,每時每刻,我們從云端獲取各種信息,各種狀態,瀏覽各種商品,從而實時的決定我們的決策和行動,“數據驅動”成為日常生活。
過去,很多行業知識、數據、信息、方法等都是封閉的,而 數字化時代首先的表現是信息透明,信息透明給這個社會帶來的改變是巨大的 ,它從根本上打破了傳統的物理世界的各種信息壁壘,極大的沖擊了傳統行業和社會形態。在互聯網上每一個人可以搜索到各種各樣他需要的數據,并從中獲得他需要的各種各樣的信息。
今天,越來越多的企業已經把業務搬到網上了,這些業務活動都需要數據才能驅動和運作, 數據質量不僅僅關乎企業組織和機構內的業務效率和效益,更關乎到客戶和合作伙伴的滿意度和配合度 ,而事實上,由于大量關于人財物等核心資源的數據質量不高,很多企業開展網上業務背后也還是靠人力服務(People Service)來驅動的,這樣 積累下來的數據如何和企業內部信息系統的數據有效共享和融合又成為新的難題 。
隨著5G的到來,隨著數據傳輸速度的加快和終端設備的增多,直接產生數據量的增長,海量的聯網終端意味著海量的數據。5G只是底層通訊技術,但當傳播能力改變后,一切都會隨萬物互聯而改變,在更多的聯接而產生數據爆炸的時代,處理大數據成為各類型政企事業單位組織必不可少的能力,當數據在組織生活中要發揮的作用越來越大,由于要快速處理的各種海量數據的增加,復雜度隨之增加,管理和控制的難度越來越大,如果不加以有效治理,組織將面對越來越錯綜復雜和事關重大的數據問題。
?
?
圖2數字經濟正洗刷企業小數據環境
數字經濟中數據被認為是推動企業增長和商業創新引擎的燃料,數據無疑被組織認定且擁有的資產之一,但是由于其海量數據的增加,復雜度隨之增加,管理和控制的難度越來越大,數據治理已提升為企業戰略優先事項。
二 國內外典型數據管理框架體系
近些年來,隨著大數據在各個行業領域應用的不斷深入,數據作為基礎性戰略資源的地位日益凸顯,數據標準化、數據確權、數據質量、數據安全、隱私保護、數據流通管控、數據共享開放這些問題越來越受到國家、行業、企業各個層面的高度關注,這樣一來,數據治理的概念就越來越多受到了關注,成為目前大數據產業生態系統中的新熱點。 在2019年4月召開的全國大數據標準化工作會議暨全國信標委大數據標準工作組第六次全會上,中科院院士梅宏呼吁,大數據治理問題必須提上日程。
2.1、國際DAMA數據管理知識框架體系
在上世紀80年代,隨著數據隨機存儲和數據庫技術應用,產業界首次提出了數據管理的概念,這就是數據治理最早的起源。2009年,國際數據管理協會(DAMA)發布了數據管理知識體系DMBOK1.0,提出DAMA數據管理理論框架模型,成為了目前行業最權威的數據管理理論模型,DAMA數據管理模型包括9個職能,分別是數據架構管理、數據開發、數據操作管理、數據安全管理、參考數據和主數據管理、數據倉庫和商務智能管理、文檔和內容管理、元數據管理和數據質量管理。2017年,DAMA新發布的DBMOK2.0知識領域中又將該模型擴展為10個活動職能。
2.2、DGI數據管控框架模型
在2012年,另一個行業組織數據管控協會(DGI,The Data Governance Institute)提出了DGI數據管控框架模型。2014年,軟件工程研究所(SEI)基于軟件能力成熟度集成模型(CMMI),提出數據能力成熟度模型(DMM)。2015年,一個主要面向金融保險行業數據管理的公益性組織企業數據管理協會(EDM Council),提出數據管理能力評價模型(DCAM),另外還有像Gartner提出的企業信息能力成熟度模型(the EIM Maturity Model)、IBM企業數據管理能力成熟度模型以及一些咨詢公司如畢馬威、普華永道等發布的細分行業數據管理體系架構等。
2.3、《數據管理能力成熟度評估模型》
在我國,近年來,國內各行業大型企業也紛紛發起企業內部數據治理項目,制定數據治理規范,成立專業的數據管理實體團隊來開展企業數據治理工作。特別是在2018年4月,國家大數據標準化工作組正式發布了國家標準《數據管理能力成熟度評估模型GB/T 36073-2018》(簡稱《DCMM模型》),并將在2018年10月1日起正式實施。DCMM定義了數據能力成熟度評價的八大能力域:數據戰略、數據治理、數據架構、數據標準、數據質量、數據安全、數據應用、數據生命周期管理,這8個能力域又包括28個能力項。
?
?
圖3 數據管理能力成熟度評估模型-能力域與能力項
三 數據治理相關認識誤區及5G環境其內涵變化
通常 數據治理被認為是獲得高質量數據的核心控制規程,用于管理、使用、改進和保護企業數據加工過程中數據質量 。許多企業通過學習、培訓和借鑒經驗,開展自身的數據管理實踐,通過尋找行業基準和通用框架建立實施方法論。按傳統理解,數據治理工作的推進者通常為企業的信息管理者和信息技術工作者,他們關注需要跨職能、跨流程、跨功能邊界的標準化,考慮信息生命周期中數據質量、數據安全的需求,這仿佛只是技術層面的工作。
但筆者實踐中發現, 如果我們僅僅把數據治理工作看成技術層面的工作,在實際工作中就會發現很多數據治理的要求難以貫徹執行 。以銀行為例,大量的數據質量問題的源頭是技術解決不了的,比如曾幾何時,很多銀行的柜員都習慣為了節約時間,潦草地錄入客戶的身份和聯系信息,這些情況不但我等銀行信息科技部門的人無能為力,行管理層對網點三令五申也收效甚微,筆者在過往培訓工作中和某國有大銀行的學員溝通曾親耳聲聞,該行為了解決數億戶儲蓄賬戶中身份證號字段的歷史存量數據質量問題,后期不得不耗費數十億的業務動員和獎勵費來逐戶修正,可見其影響面早已經超越了技術層面。
特別是在一些我國還普遍存在信息化程度偏低的單位中,有一個更為嚴重的認識誤區,這些單位中的人可能認為,我們單位自己并沒有運行什么信息系統呢,也沒有管理什么數據資源,就沒有必要做這么復雜的數據管理能力成熟度評價工作了, 這個認識誤區恰恰折射出還有相當數量的人對于組織的數字化轉型并無緊迫感, 還不明白數字化生存對于組織的重要性。
當5G徹底實現了萬物互聯以后,物理世界的一切都會被數字化,數字化技術把一切都連接起來,原來傳統世界的地理位置,時間跨度,商業模式,職業,崗位,技能,一切的被連接成一張立體的網,都可以通過一個點尋找到另外一個點,原來的行業邊界,組織邊界,職位邊界,角色邊界,都被數字化所鏈接,所打破。所以,數字化轉型是區別于傳統的組織形式、溝通形式、技術手段所產生的變化本身,數字化將組織的所有一切活動和資源都必然轉化成數據,組織建立從數據出發的管理體系, 用數據驅動業務的運營、戰略的制定和創新的產生,是任何一個組織在未來數字化生存(Being Digital)最核心的工作 。
今天我們講數字化轉型也好,講數據驅動也罷,其實更加強調任何一個組織的運營模式在5G時代都將發生根本性的變化,所有的變化都離不開“數據基因”,否則就會因水土不服而無法生存。 從這個層面來看到“數據體檢”,不能再理解為是僅僅從數據技術的層面,對組織“擁有”的數據資源做檢查和評價 ,而是衡量組織在日益高度數字化的世界里面體質還“健康”嗎?
四 5G 時代對組織數字化轉型的要求
自然生命的身體擁有強大的自我調節能力和適應力,組織生命明顯沒有這種自我適應力,所以如果組織希望能在數字化的世界里生存下去, 不斷地通過“數據體檢”來培養“數據基因”是必需的 。組織為什么要做數據體檢呢?結合5G時代對組織數字化轉型的要求,這里筆者將從這幾個方面給出具體的解釋:
1)首先還是組織運營管理的思維問題.
據筆者所知,任何一位學習MBA的同學,《組織行為學》都是第一門基礎課,對于任何一個組織,必然是以組織成員共同努力完成一些組織任務而成的,所謂的管理,我認為本質上就是組織各項要素(人財物等等)形成一致行動,實現一定組織目標的過程,在這個過程中,最關鍵的就是決策了。管理大師赫伯特·西蒙(Herbert A.Simon)就明確指出過:“管理就是決策”,而決策就要知己知彼了,決策所依賴的信息環境對于決策的正確與否和質量高下有非常大的干系, 現代的組織內部關系非常復雜,靠人與人之間口耳相傳,信息傳遞和傳播不完整不對稱則是常態了 ,這種情況下,管理者對于組織的情況要及時了解全面掌握是非常困難的,所以覺得依據個人經驗和意志就成為很多管理者的思維習慣了。曾經就非常形象地描繪過這樣的三拍干部,做決定拍腦袋,對上級拍胸脯,搞不掂拍屁股,可以說,這種任性決策的試錯后果就讓組織來埋單了。可以說,經過第三次工業革命以來的四十多年時間,沒有數據支撐的組織決策是不合時宜的已經是全球共識,讓數據說話,說起來簡單,但到了很多組織當權人手上,要不折不扣地執行就很難了, 歸根到底還是思想認識的問題。
2)其次是當前組織關系重構的問題
2016 年7月27日,中共中央辦公廳、國務院辦公廳印發《國家信息化發展戰略綱要》明確指出,當前人類社會“正在經歷信息革命”,“沒有信息化就沒有現代化”,要“以信息化驅動現代化”。 而當前以互聯網為代表的信息革命,改變了人們思考社會的知識范疇、治理社會的行為方式和模式、塑造著人類社會生活新的空間和秩序。“數字化”在當下已不再僅僅是一個概念,而是現實世界的真實存在,數字化、網絡化動搖了以固定空間、相對集權為基礎的國家或組織的根基 ,進而越來越成為人們社會生活的一種常態,以至于人、人性本身以及人與人之間的社會關系都在經歷數字化洗禮、網絡化重塑、分權化再造,乃至連帶我們的政府形態和社會治理模式也將步入新的歷史階段。筆者之前已經多次論證,今天的大數據資源,不僅僅是生產力要素,還是新生產關系的溫床和載體,大數據已經事實上取代人成為生產力中最革命、最活躍的因素,從全社會角度,是大數據革命,在組織角度,就是數字化轉型,數字化轉型對組織來說是脫胎換骨,那自然要更換組織基因,所有組織數字化轉型的出發點,都離不開“數據基因”的形成和依此對組織的徹底改造,基因是遺傳信息,作為遺傳信息,基因必須是全息的,可以指導所有的組織結構和組織行為,這是今天做組織數據管理工作的本質。
3)最后很自然就涉及到了數據治理
就是如何解決今天組織所面對的林林總總數據問題,這些數據問題已經越來越成為組織生存和發展的絆腳石了,不把這些數據問題解決掉,組織在新時代的數字化轉型就無法功成,可這些問題的病根恰恰是出現在組織缺乏“數據基因”造成的, 本質上是組織沒有“數據基因”已經適應不了“5G+”時代新環境的生存需要了 。現在很多組織也或主動或被動地、八仙過海各顯神通地做了不少信息化工作,滿足了一些急迫的數據應用需求,可是那種頭疼醫頭腳痛醫腳的數據管理方式,已經不能治組織的“基因病”了,先全面檢查和把脈一下組織數據基因的問題,才能有效地避免組織數字化轉型的迷茫和風險。
所以,從這三方面分析我們可以看到, 數據體檢對于當下所有的組織都是必需的 ,這個和對人的健康體檢有類似的地方,組織在“5G+”時代的數字化生存當然需要有健康的數據體格,評價一下現在組織的數據體格夠不夠健康,當然要全面檢查一下,而不太一樣的地方是,人體基因是穩定的,健康也有明確的參考標準,而組織的數據基因還要不斷補充,數據體檢更多是識別組織的數據管理工作的薄弱環節,明確組織數據管理工作的提升和發展方向,給數據治理工作提供基礎和輸入。
五 5G 時代數據治理工作不能僅停留在技術層面
從這個層面,我們可以比較直觀地理解數據體檢和數據治理的關系,數據體檢是客觀理解和評價組織數據體格現狀,在這個基礎上明確健身方向,而數據治理就是具體的健身行動了。很多人說,我去健身也不見得非要去醫院做全面體檢啊,這個剛才已經談到了,人體的基因對于人的生命來說是穩定的,只要不違反生理常識的健康鍛煉也不需要像治病一樣的醫療檢測服務,而組織現在所處的數據環境是非常VUCA(易變、不確定、復雜、模糊)的,數據治理要解決的問題很復雜,對組織數據體格的治療和調理, 要治心(文化與基因)、治腦(決策與管控)、治手(管理與控制)、治腳(實施與執行)多管齊下 ,這是非常復雜的系統性工程,是需要持續用力久久為功的,任何大而化之、急功近利都無法真正解決結構性的組織數據問題。而數據體檢工作就不僅僅是評價現狀這么簡單,還要 以評促學、以評促用、以評促通、以評促創 ,歸根到底還是為了 推動組織的數字化轉型發揮“數據基因”作用 ,這樣才能為后續的全面數據治理工作奠定好組織基礎。
當然, 僅僅做數據管理成熟度評價也并不能真正地解決組織各種數據問題 , 關鍵還是要組織轉化成一系列行之有效的行動 ,今天如果我們僅僅還是停留在技術的層面來理解數據治理工作毫無疑問是片面和錯誤的,在“5G+”時代,數據的采集、加工和應用隨時隨地無所不在,我們每個人都是數據的生產者和消費者,數據包含了一切的事實,數據也包含著一切的本質, 數據治理本質上就是如何讓人的思想、決策與行為所形成的數據更加符合客觀實際的要求 ,這毫無疑問不是一個僅僅停留在技術層面能解決的問題。
更進一步,“5G+”時代是一個讓人工智能變成自來水供應的時代, 大數據是人工智能技術研發、訓練的關鍵,是人工智能長期發展的重要保障 。只有當人工智能系統能夠獲取更為準確、及時、一致的高質量數據,才能提供更有效、有用、精準性高的智能化服務。數據治理是人工智能的基礎,“5G+”時代數據治理的主要目的之一很可能是為人工智能提供高質量的大數據“燃料”,而人工智能本身就是燃燒大數據而煉金的一種商業模式,如果說人工智能是機智過人的技術活,那么數據治理更強調的是人類社會中每個組織和個人都要修煉內功,才能確保我們給人工智能所灌輸的是能造福人類社會的正確信念。
結束語
從更深層的考慮, 治理數據是組織數字化轉型必修的手段,而數據資源的良好治理,歸根到底還是依靠組織各方面數字化能力的成長,這樣才能從根本上得到滿足組織發展需要的高質量數據資源 ,所以,數據治理工作的目的不應該是數據,治理數據是不夠的,不斷修煉和提升我們組織自己的數據能力才是根本目的
治理數據是“假的”,修煉我們自己的能力才是真的,借“假”修真方得始終。( 鳴謝:在編寫過程,感謝蔡春久先生給予良好的建議 )
作者:張靖笙








