摘要 星形模式是基于關系數(shù)據(jù)庫的數(shù)據(jù)倉庫中的一個著名概念,由于星形連接模式的設計思想能夠滿足人們從不同觀察角度(維)分析數(shù)據(jù)的需求,所以在基于關系數(shù)據(jù)庫的數(shù)據(jù)倉庫的設計中廣泛地使用了星形模式。本文主要介紹《廣東省高速公路一張網(wǎng)資金結算情況分
摘要 星形模式是基于關系數(shù)據(jù)庫的數(shù)據(jù)倉庫中的一個著名概念,由于星形連接模式的設計思想能夠滿足人們從不同觀察角度(維)分析數(shù)據(jù)的需求,所以在基于關系數(shù)據(jù)庫的數(shù)據(jù)倉庫的設計中廣泛地使用了星形模式。本文主要介紹《廣東省高速公路一張網(wǎng)資金結算情況分析系統(tǒng)》中的數(shù)據(jù)倉庫技術。
關鍵詞 數(shù)據(jù)倉庫;星形模式;維度
1 數(shù)據(jù)倉庫的特點
數(shù)據(jù)倉庫技術是用以更好地支持企業(yè)或組織的決策分析處理的,面向主題的,集成的,不可更新的、隨時間不斷變化的數(shù)據(jù)集合。它通過將數(shù)據(jù)按照不同的綜合程度(即粒度)來組織,以滿足不同分析的需要。
本文主要介紹一下《廣東省高速公路一張網(wǎng)資金結算情況分析系統(tǒng)》中如何使用數(shù)據(jù)倉庫技術來實現(xiàn)“異常流水”與其修改量分析與“流水上傳與拆分”分析這兩個主題。
2 星形模式
星形模式是基于關系數(shù)據(jù)庫的數(shù)據(jù)倉庫中的一個著名概念,由于星形連接模式的設計思想能夠滿足人們從不同觀察角度(維)分析數(shù)據(jù)的需求,加上數(shù)據(jù)倉庫通常用來回答綜合性的問題,所以在基于關系數(shù)據(jù)庫的數(shù)據(jù)倉庫的設計中廣泛地使用了星形模式,如電信運營商中普遍進行的話務總體分析。
3 系統(tǒng)中的數(shù)據(jù)倉庫設計
3.1 廣東聯(lián)合電子結算中心操作型環(huán)境 DB2 數(shù)據(jù)庫服務器下的數(shù)據(jù)組織情況
在廣東聯(lián)合電子結算中心, “異常流水”、“流水拆分”、“流水上傳”有關的關系模式
l 粵通卡精確拆分結果明細表
tb_cardaccuratesplitresult (流水號,工班, 出口路段…, 收入路段)
l 現(xiàn)金精確拆分結果明細表
tb_cashaccuratesplitresult (流水號,工班, 出口路段…,收入路段)
l 流水非精確拆分記錄表
tb_inaccuratesplitrecord (流水號,工班, 出口路段…, 收入路段)
l 拆分流水異常記錄表
tb_outlistspliterrorgb(流水號,工班,出口路段, …,錯誤類型代碼)
l 拆分流水異常記錄歷史表
tb_outlistspliterrorgb_his(流水號,工班,出口路段, …,錯誤類型代碼)
l 流水異常記錄表
tb_outlisterrorgb(流水號,工班,出口路段, …,錯誤類型代碼)
l 流水異常記錄歷史表
tb_outlisterrorgb_his(流水號,工班,出口路段, …,錯誤類型代碼)
l 出口流水表
tb_outlistgb (流水號,工班,出口路段, …,上傳時間)
3.2 系統(tǒng)的中數(shù)據(jù)倉庫設計
考慮到篇幅,各步驟經(jīng)過簡化如下:
l 概念模型設計
l 邏輯模型設計
l 數(shù)據(jù)倉庫生成
3.2.1概念模型設計中的界定系統(tǒng)邊界
在廣東電信公話中心,管理者最迫切進行的分析主要有:
l 各高速公路路段公司不同工班的流水上傳、流水拆分。
l 分析各個高速公路路段公司上傳的異常流水(包含異常及拆分異常)、及其修改的情況;
要進行以上的分析,所需數(shù)據(jù)應包括:
l 分析各個高速公路路段公司在一段周期內的流水上傳、拆分、異??偭俊惓P薷那闆r。
l 分析各個高速公路路段公司上傳的異常流水(包含異常及拆分異常)、及上傳的異常的流水(包含異常及拆分異常)流水的修改情況;
l 各個高速公路路段公司及他們的軟件開發(fā)商
l 廣東省高速公路所有的路段信息;
3.2.2 邏輯模型設計
因為細節(jié)級數(shù)據(jù)太大,數(shù)據(jù)倉庫又建立在本人的PC機上 MS SQL SERVER 服務器上,加之迫于分析任務提交時間的壓力,故本數(shù)據(jù)倉庫中不再涉及細節(jié)級數(shù)據(jù)表的設計、數(shù)據(jù)挖掘。
關系模式定義:
ok_xiugai (LISTNO, UPLOADTIME, OUTROADNO, SQUADDATE, ERRCODE, ERRMSG…)
no_xiugai (LISTNO, UPLOADTIME, OUTROADNO, SQUADDATE, ERRCODE, ERRMSG…)
upload_split(路段編碼, 路段名稱, 工班, 上傳流水數(shù)量, 拆分流水數(shù)量…)
kaifa (roadno, kaifa_name)
tb_road(areano,roadno,roadname,…)
3.2.3 數(shù)據(jù)倉庫數(shù)據(jù)生成
數(shù)據(jù)倉庫中數(shù)據(jù)的生成包括操作型環(huán)境數(shù)據(jù)的挖掘和數(shù)據(jù)倉庫中數(shù)據(jù)的生成這兩部分的內容。在這一步里所要做的工作是接口編程,以實現(xiàn)將操作型環(huán)境下的數(shù)據(jù)裝載進入數(shù)據(jù)倉庫環(huán)境。
4 數(shù)據(jù)倉庫的數(shù)據(jù)導出與展現(xiàn)
4.1 萬能數(shù)據(jù)庫查詢分析器
萬能數(shù)據(jù)庫查詢分析器,中文版本《DB 查詢分析器》、英文版本《DBQuery Analyzer》。它具有強大的功能、友好的操作界面、良好的操作性、跨越各種數(shù)據(jù)庫平臺乃至于EXCEL和文本文件。
你可以通過它查詢ODBC數(shù)據(jù)源(包括世面上所有的數(shù)據(jù)庫、TXT/CSV文件、EXCEL文件)的數(shù)據(jù)。你可以同時執(zhí)行多條DML語句乃至存貯過程,結果會以你設定的表格、文本框、文件來返回。從數(shù)據(jù)庫導出千萬條數(shù)據(jù)時,效率與DBMS沒有什么區(qū)別。
《萬能數(shù)據(jù)庫查詢分析器》中文版本《DB 查詢分析器》在中關村在線下載量超過10萬次,位居整個數(shù)據(jù)庫類排行榜中第8位,所以在實際工作中,本人用《DB 查詢分析器》作為客戶端,實現(xiàn)將數(shù)據(jù)倉庫中的數(shù)據(jù)展現(xiàn)與導出。
4.2 本系統(tǒng)中的兩個主題的星形模式4.3 數(shù)據(jù)樣例示意
圖6 數(shù)據(jù)展現(xiàn)1
圖7 數(shù)據(jù)展現(xiàn)2
圖8 點擊“DB 查詢分析器”的工具欄按鈕,即可導出數(shù)據(jù)1
圖9 點擊“DB 查詢分析器”的工具欄按鈕,即可導出數(shù)據(jù)2
5 結束語
筆者在《廣東省高速公路一張網(wǎng)資金結算情況分析系統(tǒng)》的研究與開發(fā)過程中,是數(shù)據(jù)倉庫技術在實際工作中的又一次運用。
參考文獻:
[1] 馬根峰 · 萬能數(shù)據(jù)庫查詢分析器中的事務管理在Oracle中的應用· 上海:微型電腦應用2008.4
[2] 新產品&工具點評 特別推薦:“萬能數(shù)據(jù)庫查詢分析器”發(fā)布 · 程序員,2007.2
[3] 馬根峰 · DB QueryAnalyzer中的事務管理在DB2中的應用· 北京:電腦編程技巧與維護2011.22
[4] 馬根峰 · 《DB 查詢分析器》批量執(zhí)行DML語句并返回更詳細的信息· 北京:電腦編程技巧與維護2011.24
[5] 王珊 · 數(shù)據(jù)倉庫技術與聯(lián)機分析處理 · 北京:科學出版社,1998.6
[6] MichaelCorey(美),MichaelAbbey(美) · SQL SERVER 7 Data Warehousing · 北京:希望電子出版社,2000.1
[7] 袁鵬飛 · SQLServer 7.0數(shù)據(jù)庫系統(tǒng)管理與應用開發(fā) · 北京:人民郵電出版社,1999.5
聲明:本網(wǎng)頁內容旨在傳播知識,若有侵權等問題請及時與本網(wǎng)聯(lián)系,我們將在第一時間刪除處理。TEL:177 7030 7066 E-MAIL:11247931@qq.com