首頁 > 技術 > 正文

環(huán)球要聞:數據口徑難統(tǒng)一?火山引擎DataLeap上線“數據標準”管理能力

2023-05-29 18:47:58來源:中關村在線  

數據標準是數據治理體系中的核心要素之一。


【資料圖】

一方面,統(tǒng)一的數據標準可以在復雜的業(yè)務場景下,幫助團隊對齊數據口徑,提升數據在分析、診斷等場景的質量與效率;另一方面,數倉團隊與分析師團隊也需要沉淀一套敏捷、可控的數據標準指標管理流程,以便后續(xù)在指標口徑的增加、修改、下線等方向更標準、高效。

但數據標準建設并不是一個簡單的過程。在同一個企業(yè)內部,也存在對標準認知不一致的問題。以銀行業(yè)舉例,對于“客戶”的定義,客戶部認為“辦了銀行的卡的人即為客戶”,而網銀部則認為“銀行網站注冊過、或者通過銀行轉賬的人都屬于客戶”,這即是對同一個概念存在認知偏差。

另外,在實際數據開發(fā)過程中,也存在開發(fā)人員對同一個字段采用不同的命名,或者存在同義不同名的元數據字段,導致溝通成本增加,甚至最終影響數據質量。

近期,火山引擎大數據治理研發(fā)套件DataLeap上線的「數據標準」模塊瞄準這一問題,希望為數據從業(yè)提供一套數據標準的管理能力。

據介紹,該模塊已提供數據標準、標準代碼、命名詞典管理的功能,還支持對各類數據源的庫表進行掃描,并進行智能推薦對標。對于企業(yè)整體的數據標準情況,DataLeap則提供可視化的統(tǒng)計大盤,幫助數據團隊快速了解標準的新建情況和使用情況。

火山引擎DataLeap數據標準產品頁面

用戶僅僅只需要操作3個關鍵步驟,即可完成數據標準統(tǒng)一:

1. 標準建立:通過在標準域管理預先定義好字段類型配置,實現版本資產映射管理,支持批量導入,實現數據標準代碼統(tǒng)一、命名詞典批量導出。

2. 標準管理:   查看版本歷史,幫助用戶訂閱標準并查看變更日志記錄。

3. 標準映射:可將數據標準與多種數據源字段建議映射,可查看數據標準評估結果,或根據映射通過情況糾正。

在使用場景上,用戶基于DataLeap完成統(tǒng)一數據標準建設,消除數據不一致性,推動數倉規(guī)范數據建設,還可以與指標服務打通,對接數據地圖資產,進一步達到數據治理的目的。

除了數據標準管理之外,火山引擎DataLeap還提供數據集成、開發(fā)、運維、治理、資產、安全等能力,幫助用戶提升數據研發(fā)效率、降低管理成本,加速推動企業(yè)的數字化轉型,目前已經應用于泛互聯網、制造、新零售、汽車等領域。(作者:何澤)

標簽:

相關閱讀

精彩推薦

相關詞

推薦閱讀