序言
隨著數據(資訊)成為經營中的第四個重要資源,許多企業紛紛轉向數據驅動經營。然而,真正重視數據建模的重要性的企業卻寥寥無幾。因此,本文將作為「數據建模入門」指南,簡單易懂地介紹數據建模的基本概念及其重要性,並幫助大家進一步了解這個重要的課程。
數據建模是什麼
企業內部分佈著不同的數據,例如人事部門的員工資訊與評價數據,銷售部門的客戶資訊與訂單數據等等。這些數據都是企業的重要資源,猶如未經提煉的石油,若不經加工便產生不了價值。
數據建模即是指在數據吸收與清理之前,首先進行數據的結構化設計,使其成為價值數據。
模型化=視覺化、圖示化
數據建模其實是將數據庫中的數據種類、數量及其關係可視化、圖示化,簡單來說就是「數據的設計圖」。
數據建模的具體操作
數據建模看似難解,其實是把各數據庫中的數據及其相互關係作視覺化、圖示化的操作,即是設計出數據的藍圖幫助數據庫的構築,這就是數據建模的意義所在。
數據建模為何重要
數據建模是進行數據分析前需完成的準備工作,其重要性主要體現於以下五個方面:
提高數據收集、保存及處理效率
數據分散於各部門的情況下,除非已建立如ERP等整合數據庫,否則通常需進行多數據庫的數據收集、保存與處理。數據建模有助於明確數據來源、種類、數量及其相互關係,從而提高這些操作的效率。
提升數據庫開發的準確性與效率
可靠的數據庫開發需確保其準確性與效率,而數據建模則是開發階段不可或缺的準備工作,既有助於確保準確性又能提升效率。
促進開發與運營團隊之間的溝通
數據驅動經營的數據庫需持續改進與運營。數據建模可作為開發與運營間的共識工具,提升彼此溝通效率,靈活轉變數據庫角色與處理流程。
保持組織內系統設計的一致性
數據建模有助於在組織內部保持數據架構與系統設計的一致性,避免系統分裂與業務延誤,確保數據分析的方向正確。
實現可持續的數據庫
可持續的數據庫需確保無論團隊成員如何變動,皆能持續優化數據庫而不降低其信賴性。實現此目標需重新審視數據建模與系統設計。
數據建模的種類
數據建模可分為概念數據模型、邏輯數據模型與物理數據模型三部分。
概念數據模型
概念數據模型是表示數據全貌的模型,資料的整體構架由被稱為“實體”的個別要素組成。
邏輯數據模型
邏輯數據模型進一步細化概念數據模型中的實體,即將實體細分為更小單位的屬性,建立起詳細數據關係模型。
物理數據模型
物理數據模型是指將整理出的實體與屬性納入數據庫設計,具體定義數據在數據庫表格中的管理方式。
數據建模的步驟
數據建模需按照一定步驟進行,以下簡要說明:
步驟一:定義實體及其關係
首先使用ER圖(實體關聯圖)定義實體及其關係,這一步相當於概念數據模型。
步驟二:建立屬性列表
接著作出各實體的屬性列表,需按照「MECE」原則進行,即漏掉所有元素且不重複,以確保數據庫的可靠性與功能性。
步驟三:選擇數據建模方法
數據建模方法主要有三種:關聯數據建模、層次數據建模與圖形數據建模。依據數據建模的目標與業務需求選擇適當的方法。
步驟四:創建物理數據模型
最終步驟是創建物理數據模型,但此步驟不是終了。數據庫需持續改進與運營,基礎設計需定期優化,確保業務目標達成。
最終目標:數據建模的真正意義
數據建模即設計數據庫,數據技術部分由數據科學家或數據庫工程師完成,但業務人員了解基本知識有助於彼此溝通,進而構築更契合業務的數據庫。
從數據建模到業務戰略:統計模型與預測模型的應用
理解數據建模的基本理論和應用之後,可以更深入地探討其在各種業務領域的實踐,如行銷。在行銷中使用的統計模型和預測模型可以幫助預測趨勢和客戶行為,提升行銷效果。