數(shù)據(jù)治理(DG)是管理企業(yè)系統(tǒng)中數(shù)據(jù)的可用性、可用性、完整性和安全性的過程,它基于內(nèi)部數(shù)據(jù)標(biāo)準(zhǔn)和也控制數(shù)據(jù)使用的策略。有效的數(shù)據(jù)治理可確保數(shù)據(jù)一致且值得信賴,并且不會被濫用。隨著組織面臨新的數(shù)據(jù)隱私法規(guī)并越來越依賴數(shù)據(jù)分析來幫助優(yōu)化運營和推動業(yè)務(wù)決策,它變得越來越重要。
一個設(shè)計良好的數(shù)據(jù)治理計劃通常包括一個治理團隊、一個充當(dāng)管理機構(gòu)的指導(dǎo)委員會和一組數(shù)據(jù)管理員。他們共同制定數(shù)據(jù)管理標(biāo)準(zhǔn)和政策,以及主要由數(shù)據(jù)管理員執(zhí)行的實施和執(zhí)行程序。理想情況下,除了 IT 和數(shù)據(jù)管理團隊之外,來自組織業(yè)務(wù)運營的高管和其他代表也會參與。
獨立顧問 Nicola Askham 在 2022 年 1 月的一篇博文中寫道,雖然數(shù)據(jù)治理是整體數(shù)據(jù)管理戰(zhàn)略的核心組成部分,但組織需要關(guān)注治理計劃的預(yù)期商業(yè)利益才能取得成功。紐約梅隆銀行首席數(shù)據(jù)官埃里克·赫施霍恩 (Eric Hirschhorn) 在 2022 年企業(yè)數(shù)據(jù)世界數(shù)字會議期間的一次會議上提出了同樣的觀點。“結(jié)果不能只是良好的治理,”他說。“結(jié)果必須是經(jīng)營更好的企業(yè)。”
這份全面的數(shù)據(jù)治理指南進(jìn)一步解釋了它是什么、它是如何工作的、它提供的商業(yè)利益、最佳實踐和治理數(shù)據(jù)的挑戰(zhàn)。您還將找到可以幫助治理流程的數(shù)據(jù)治理軟件和相關(guān)技術(shù)的概述。在整個指南中,超鏈接指向相關(guān)文章,這些文章更深入地涵蓋了正在討論的主題。
為什么數(shù)據(jù)治理很重要?
如果沒有有效的數(shù)據(jù)治理,組織中不同系統(tǒng)中的數(shù)據(jù)不一致可能無法得到解決。例如,客戶名稱在銷售、物流和客戶服務(wù)系統(tǒng)中可能會有所不同。這可能會使數(shù)據(jù)集成工作復(fù)雜化,并產(chǎn)生影響商業(yè)智能 (BI)、企業(yè)報告和分析應(yīng)用程序準(zhǔn)確性的數(shù)據(jù)完整性問題。此外,可能無法識別和修復(fù)數(shù)據(jù)錯誤,進(jìn)一步影響 BI 和分析的準(zhǔn)確性。
這些是制定數(shù)據(jù)治理計劃的一些主要原因。糟糕的數(shù)據(jù)治理也會阻礙監(jiān)管合規(guī)計劃。這可能會給需要遵守越來越多的數(shù)據(jù)隱私和保護(hù)法律的公司帶來問題,例如歐盟的 GDPR 和加州消費者隱私法案 (CCPA)。企業(yè)數(shù)據(jù)治理計劃通常包括開發(fā)適用于所有業(yè)務(wù)系統(tǒng)的通用數(shù)據(jù)定義和標(biāo)準(zhǔn)數(shù)據(jù)格式,從而提高業(yè)務(wù)和合規(guī)性用途的數(shù)據(jù)一致性。
數(shù)據(jù)治理目標(biāo)和收益
數(shù)據(jù)治理的一個關(guān)鍵目標(biāo)是打破組織中的數(shù)據(jù)孤島。當(dāng)各個業(yè)務(wù)部門在沒有集中協(xié)調(diào)或企業(yè)數(shù)據(jù)架構(gòu)的情況下部署單獨的事務(wù)處理系統(tǒng)時,通常會形成這種孤島。數(shù)據(jù)治理旨在通過協(xié)作過程協(xié)調(diào)這些系統(tǒng)中的數(shù)據(jù),各業(yè)務(wù)部門的利益相關(guān)者參與其中。
另一個數(shù)據(jù)治理目標(biāo)是確保數(shù)據(jù)得到正確使用,既可以避免將數(shù)據(jù)錯誤引入系統(tǒng),也可以阻止對客戶個人數(shù)據(jù)和其他敏感信息的潛在濫用。這可以通過制定統(tǒng)一的數(shù)據(jù)使用政策以及監(jiān)控使用情況和持續(xù)執(zhí)行政策的程序來實現(xiàn)。此外,數(shù)據(jù)治理有助于在數(shù)據(jù)收集實踐和隱私要求之間取得平衡。
除了更準(zhǔn)確的分析和更強的合規(guī)性之外,數(shù)據(jù)治理提供的好處還包括提高數(shù)據(jù)質(zhì)量;降低數(shù)據(jù)管理成本;并增加了數(shù)據(jù)科學(xué)家、其他分析師和業(yè)務(wù)用戶對所需數(shù)據(jù)的訪問權(quán)限。最終,數(shù)據(jù)治理可以通過為高管提供更好的信息來幫助改進(jìn)業(yè)務(wù)決策。理想情況下,這將帶來競爭優(yōu)勢并增加收入和利潤。
誰負(fù)責(zé)數(shù)據(jù)治理?
在大多數(shù)組織中,不同的人參與數(shù)據(jù)治理過程。這包括業(yè)務(wù)主管、數(shù)據(jù)管理專業(yè)人員和 IT 人員,以及熟悉組織系統(tǒng)中相關(guān)數(shù)據(jù)域的最終用戶。這些是主要參與者及其主要治理職責(zé)。
首席數(shù)據(jù)官。首席數(shù)據(jù)官 (CDO)(如果有的話)通常是負(fù)責(zé)監(jiān)督數(shù)據(jù)治理計劃并對其成敗負(fù)有高層責(zé)任的高級管理人員。CDO 的職責(zé)包括確保項目獲得批準(zhǔn)、資金和人員配備;在設(shè)立過程中發(fā)揮主導(dǎo)作用;監(jiān)控其進(jìn)展;并在內(nèi)部充當(dāng)它的倡導(dǎo)者。如果組織沒有 CDO,則通常由另一位最高層主管擔(dān)任執(zhí)行發(fā)起人并處理相同的職能。
數(shù)據(jù)治理經(jīng)理和團隊。在某些情況下,CDO 或相當(dāng)?shù)膱?zhí)行官——例如企業(yè)數(shù)據(jù)管理主管——也可能是實際數(shù)據(jù)治理項目經(jīng)理。在其他情況下,組織會任命一名數(shù)據(jù)治理經(jīng)理或負(fù)責(zé)人專門負(fù)責(zé)運行該程序。無論哪種方式,項目經(jīng)理通常都會領(lǐng)導(dǎo)一個全職處理項目的數(shù)據(jù)治理團隊。有時更正式地稱為數(shù)據(jù)治理辦公室,它協(xié)調(diào)流程、領(lǐng)導(dǎo)會議和培訓(xùn)課程、跟蹤指標(biāo)、管理內(nèi)部通信并執(zhí)行其他管理任務(wù)。
數(shù)據(jù)治理委員會。不過,治理團隊通常不制定政策或標(biāo)準(zhǔn)決策。這是主要由業(yè)務(wù)主管和其他數(shù)據(jù)所有者組成的數(shù)據(jù)治理委員會或委員會的責(zé)任。該委員會批準(zhǔn)基本數(shù)據(jù)治理政策和相關(guān)的政策和規(guī)則,如數(shù)據(jù)訪問和使用,以及實施它們的程序。它還解決了爭議,例如不同業(yè)務(wù)部門之間在數(shù)據(jù)定義和格式方面的分歧。
數(shù)據(jù)管理員。數(shù)據(jù)管理員的職責(zé)包括監(jiān)督數(shù)據(jù)集以使其保持有序。他們還負(fù)責(zé)確保數(shù)據(jù)治理委員會批準(zhǔn)的政策和規(guī)則得到實施,并確保最終用戶遵守這些政策和規(guī)則。具有特定數(shù)據(jù)資產(chǎn)和領(lǐng)域知識的工作人員通常被任命來處理數(shù)據(jù)管理角色。這在一些公司是全職工作,在另一些公司是兼職。還可以混合使用 IT 和業(yè)務(wù)數(shù)據(jù)管理員。
這顯示了數(shù)據(jù)治理過程中的主要參與者以及他們扮演的角色。數(shù)據(jù)架構(gòu)師、數(shù)據(jù)建模師和數(shù)據(jù)質(zhì)量分析師和工程師通常也是治理流程的一部分。此外,業(yè)務(wù)用戶和分析團隊必須接受數(shù)據(jù)治理政策和數(shù)據(jù)標(biāo)準(zhǔn)方面的培訓(xùn),這樣他們才能避免以錯誤或不當(dāng)?shù)姆绞绞褂脭?shù)據(jù)。您可以在技術(shù)作家 George Lawton 撰寫的相關(guān)文章中了解有關(guān)數(shù)據(jù)治理角色和職責(zé)以及如何構(gòu)建治理程序的更多信息。
數(shù)據(jù)治理框架的組件
數(shù)據(jù)治理框架由作為治理計劃的一部分實施的政策、規(guī)則、流程、組織結(jié)構(gòu)和技術(shù)組成。它還詳細(xì)說明了項目的任務(wù)說明、目標(biāo)和成功的衡量方式,以及項目中各種職能的決策責(zé)任和問責(zé)制。一個組織的治理框架應(yīng)該被記錄下來并在內(nèi)部共享,所以每個參與的人都清楚——預(yù)先——這個項目將如何運作。
在技??術(shù)方面,數(shù)據(jù)治理軟件可用于自動化管理治理程序的各個方面。雖然數(shù)據(jù)治理工具不是強制性的框架組件,但它們支持程序和工作流管理、協(xié)作、治理策略的開發(fā)、流程文檔、數(shù)據(jù)目錄的創(chuàng)建和其他功能。它們還可以與數(shù)據(jù)質(zhì)量、元數(shù)據(jù)管理和主數(shù)據(jù)管理 ( MDM ) 工具結(jié)合使用。
數(shù)據(jù)治理實施
數(shù)據(jù)治理應(yīng)該是組織的一項戰(zhàn)略舉措。在一篇關(guān)于創(chuàng)建數(shù)據(jù)治理策略的文章中,咨詢公司 TreeHive Strategy 的負(fù)責(zé)人 Donald Farmer 推薦了一系列要采取的步驟,包括以下待辦事項:
在實施數(shù)據(jù)治理框架之前,F(xiàn)armer 提到的另一個步驟是識別整個企業(yè)中不同數(shù)據(jù)資產(chǎn)的所有者或保管人,并讓他們——或指定的代理人——參與治理計劃。然后,CDO、執(zhí)行發(fā)起人或?qū)iT的數(shù)據(jù)治理經(jīng)理帶頭創(chuàng)建項目結(jié)構(gòu),為數(shù)據(jù)治理團隊配備人員,確定數(shù)據(jù)管理員并正式組建治理委員會。
一旦結(jié)構(gòu)到位,管理數(shù)據(jù)的真正工作就開始了。必須制定數(shù)據(jù)治理政策和數(shù)據(jù)標(biāo)準(zhǔn),以及定義授權(quán)人員如何使用數(shù)據(jù)的規(guī)則。此外,還需要一套控制和審計程序來確保持續(xù)遵守內(nèi)部政策和外部法規(guī),并保證數(shù)據(jù)在應(yīng)用程序中以一致的方式使用。治理團隊還應(yīng)記錄數(shù)據(jù)的來源、存儲位置以及如何保護(hù)數(shù)據(jù)免受濫用和安全攻擊。
數(shù)據(jù)治理計劃通常還包括以下要素:
管理數(shù)據(jù)治理計劃的最佳實踐
由于數(shù)據(jù)治理通常會對數(shù)據(jù)的處理和使用方式施加限制,因此在組織中可能會引起爭議。IT 和數(shù)據(jù)管理團隊之間的一個共同擔(dān)憂是,如果他們領(lǐng)導(dǎo)數(shù)據(jù)治理計劃,他們將被業(yè)務(wù)用戶視為“數(shù)據(jù)警察”。為促進(jìn)業(yè)務(wù)支持并避免抵制治理政策,經(jīng)驗豐富的數(shù)據(jù)治理經(jīng)理和行業(yè)顧問建議項目由業(yè)務(wù)驅(qū)動,數(shù)據(jù)所有者參與其中,數(shù)據(jù)治理委員會就標(biāo)準(zhǔn)、政策和規(guī)則做出決策。
數(shù)據(jù)治理的培訓(xùn)和教育是計劃的必要組成部分,特別是讓業(yè)務(wù)用戶和數(shù)據(jù)分析師熟悉數(shù)據(jù)使用規(guī)則、隱私要求以及他們自己幫助保持?jǐn)?shù)據(jù)集一致的責(zé)任。通過報告、電子郵件通訊、研討會和其他外展方法的組合,與企業(yè)高管、業(yè)務(wù)經(jīng)理和最終用戶就數(shù)據(jù)治理計劃的進(jìn)展進(jìn)行持續(xù)溝通也是必須的。
溝通和培訓(xùn)是Farmer 在第二篇文章中概述的一組七個數(shù)據(jù)治理最佳實踐的一部分。其他一些包括盡可能靠近源系統(tǒng)應(yīng)用數(shù)據(jù)安全和隱私規(guī)則,在組織的每個級別制定適當(dāng)?shù)闹卫聿呗圆⒍ㄆ趯彶橹卫聿呗浴?/p>
Gartner 分析師 Saul Judah 推薦了一種自適應(yīng)數(shù)據(jù)治理方法,該方法將不同的治理策略和風(fēng)格應(yīng)用于各個業(yè)務(wù)流程。他還列出了成功管理數(shù)據(jù)和分析應(yīng)用程序的這七個基礎(chǔ):
促進(jìn)數(shù)據(jù)治理流程最佳實踐的專業(yè)協(xié)會包括 DAMA International 和 Data Governance Professionals Organization。Data Governance Institute 是一個由當(dāng)時的顧問 Gwen Thomas 于 2003 年創(chuàng)立的組織,它發(fā)布了一個數(shù)據(jù)治理框架模板和各種關(guān)于治理最佳實踐的指南。一些信息在其網(wǎng)站上公開提供,而其他材料只能由付費會員訪問。其他地方也提供類似的指南——例如,在由 EWSolutions 維護(hù)的 DataManagementU 在線圖書館中。
數(shù)據(jù)治理挑戰(zhàn)
通常,數(shù)據(jù)治理工作的早期步驟可能是最困難的,因為組織的不同部分通常對關(guān)鍵數(shù)據(jù)實體(例如客戶或產(chǎn)品)有不同的看法。這些差異必須作為數(shù)據(jù)治理過程的一部分加以解決——例如,通過就通用數(shù)據(jù)定義和格式達(dá)成一致。這可能是一項充滿爭議且難以處理的工作,這就是為什么數(shù)據(jù)治理委員會需要一個明確的爭議解決程序。組織在數(shù)據(jù)治理方面面臨的其他常見挑戰(zhàn)包括以下內(nèi)容。
展示其商業(yè)價值。如果沒有數(shù)據(jù)治理計劃的預(yù)期業(yè)務(wù)收益的前期文檔,獲得批準(zhǔn)、資助和支持可能會很困難。在她 2022 年 1 月的博客文章中,Askham 表示,企業(yè)高管希望在治理計劃開始時就知道對他們有什么好處。“如果你不能以他們真正感興趣并使他們受益的方式回答這個問題,他們就不會感興趣,”她寫道。
在持續(xù)的基礎(chǔ)上,展示業(yè)務(wù)價值需要開發(fā)可量化的指標(biāo),尤其是在數(shù)據(jù)質(zhì)量改進(jìn)方面。這可能包括每季度解決的數(shù)據(jù)錯誤數(shù)量以及由此產(chǎn)生的收入收益或成本節(jié)約。其他常見的數(shù)據(jù)質(zhì)量指標(biāo)衡量數(shù)據(jù)集的準(zhǔn)確性和錯誤率以及相關(guān)屬性,例如數(shù)據(jù)完整性和一致性。詳細(xì)了解數(shù)據(jù)治理和數(shù)據(jù)質(zhì)量之間的密切聯(lián)系,以及也可用于顯示治理計劃價值的其他類型的指標(biāo)。
支持自助服務(wù)分析。向自助服務(wù) BI 和分析的轉(zhuǎn)變通過將數(shù)據(jù)交到組織中的更多用戶手中而帶來了新的數(shù)據(jù)治理挑戰(zhàn)。治理計劃必須確保自助服務(wù)用戶的數(shù)據(jù)準(zhǔn)確且可訪問,但也要確保這些用戶(業(yè)務(wù)分析師、高管和公民數(shù)據(jù)科學(xué)家等)不會濫用數(shù)據(jù)或與數(shù)據(jù)隱私和安全發(fā)生沖突限制。用于實時分析的流數(shù)據(jù)進(jìn)一步使這些工作復(fù)雜化。
治理大數(shù)據(jù)。大數(shù)據(jù)系統(tǒng)的部署也增加了新的治理需求和挑戰(zhàn)。數(shù)據(jù)治理程序傳統(tǒng)上側(cè)重于存儲在關(guān)系數(shù)據(jù)庫中的結(jié)構(gòu)化數(shù)據(jù),但現(xiàn)在它們必須處理大數(shù)據(jù)環(huán)境通常包含的結(jié)構(gòu)化、非結(jié)構(gòu)化和半結(jié)構(gòu)化數(shù)據(jù)的混合,以及各種數(shù)據(jù)平臺,包括 Hadoop 和 Spark 系統(tǒng), NoSQL 數(shù)據(jù)庫和云對象存儲。此外,大數(shù)據(jù)集通常以原始形式存儲在數(shù)據(jù)湖中,然后根據(jù)需要進(jìn)行過濾以供分析使用,這進(jìn)一步使數(shù)據(jù)治理復(fù)雜化。
關(guān)鍵數(shù)據(jù)治理支柱
數(shù)據(jù)治理計劃由整個數(shù)據(jù)管理流程的其他幾個方面提供支持。最值得注意的是,這些方面包括以下內(nèi)容:
數(shù)據(jù)管理。如前所述,數(shù)據(jù)管理員負(fù)責(zé)組織的一部分?jǐn)?shù)據(jù)。數(shù)據(jù)管理員還有助于實施和執(zhí)行數(shù)據(jù)治理策略。通常,他們是精通數(shù)據(jù)的業(yè)務(wù)用戶,是各自領(lǐng)域的主題專家。數(shù)據(jù)管理員與數(shù)據(jù)質(zhì)量分析師、數(shù)據(jù)庫管理員和其他數(shù)據(jù)管理專業(yè)人員協(xié)作。他們還與業(yè)務(wù)部門合作,以確定數(shù)據(jù)要求和問題。
數(shù)據(jù)質(zhì)量。數(shù)據(jù)質(zhì)量改進(jìn)是數(shù)據(jù)治理活動背后的最大驅(qū)動力之一。跨系統(tǒng)的數(shù)據(jù)準(zhǔn)確性、完整性和一致性是成功治理計劃的重要標(biāo)志。數(shù)據(jù)清理,也稱為數(shù)據(jù)清理,修復(fù)數(shù)據(jù)錯誤和不一致,它還會關(guān)聯(lián)和刪除相同數(shù)據(jù)元素的重復(fù)實例,以協(xié)調(diào)客戶或產(chǎn)品在不同系統(tǒng)中的列出方式。數(shù)據(jù)質(zhì)量工具通過數(shù)據(jù)剖析、解析和匹配功能以及其他功能提供這些功能。從 IT 服務(wù)提供商 RadixBay 的高級戰(zhàn)略家和顧問 Chris Foot 的文章中獲取有關(guān)管理數(shù)據(jù)質(zhì)量改進(jìn)工作的技巧。
主數(shù)據(jù)管理。MDM 是另一個與數(shù)據(jù)治理流程密切相關(guān)的數(shù)據(jù)管理規(guī)程。MDM 計劃建立關(guān)于客戶、產(chǎn)品和其他業(yè)務(wù)實體的主數(shù)據(jù)集,以幫助確保數(shù)據(jù)在整個組織的不同系統(tǒng)中是一致的。因此,MDM 自然地與數(shù)據(jù)治理相吻合。但是,與治理計劃一樣,MDM 工作可能會在組織中引起爭議,因為部門和業(yè)務(wù)單位之間在如何格式化主數(shù)據(jù)方面存在差異。此外,與數(shù)據(jù)治理相比,MDM 的復(fù)雜性限制了它的采用。但兩者的結(jié)合導(dǎo)致了向由數(shù)據(jù)治理目標(biāo)驅(qū)動的較小規(guī)模 MDM 項目的轉(zhuǎn)變。
數(shù)據(jù)治理也與信息治理相關(guān),信息治理更廣泛地關(guān)注信息在組織中的整體使用方式。在高層次上,數(shù)據(jù)治理可以被視為信息治理的一個組成部分,但它們通常被認(rèn)為是具有相似目標(biāo)的獨立學(xué)科。
數(shù)據(jù)治理用例
有效的數(shù)據(jù)治理是管理操作系統(tǒng)中使用的數(shù)據(jù)以及由數(shù)據(jù)倉庫、數(shù)據(jù)集市和數(shù)據(jù)湖提供的 BI 和分析應(yīng)用程序的核心。它也是數(shù)字化轉(zhuǎn)型計劃的一個特別重要的組成部分,它可以幫助其他企業(yè)流程,例如風(fēng)險管理、業(yè)務(wù)流程管理和并購。
隨著數(shù)據(jù)用途的不斷擴大和新技術(shù)的出現(xiàn),數(shù)據(jù)治理可能會得到更廣泛的應(yīng)用。例如,正在努力將數(shù)據(jù)治理流程應(yīng)用于機器學(xué)習(xí)算法和其他人工智能工具。此外,備受矚目的數(shù)據(jù)泄露事件和 GDPR 和 CCPA 等法律使得將隱私保護(hù)納入數(shù)據(jù)治理政策成為治理工作的核心部分。