隨著 BI (DW) 在各個(gè)企業(yè)中重要性的不斷提升,各個(gè)數(shù)據(jù)庫(kù)廠家都希望能搭上這輛班車。這不,MySQL 也聯(lián)合 Infobright 一起推出了開源的 數(shù)據(jù)倉(cāng)庫(kù)解決方案,而且是開源的。 其實(shí)現(xiàn)的各種DW該有的功能就不多說(shuō)了,但是 Infobright 有一點(diǎn)非常吸引人的技術(shù)特點(diǎn)不
隨著 BI (DW) 在各個(gè)企業(yè)中重要性的不斷提升,各個(gè)數(shù)據(jù)庫(kù)廠家都希望能搭上這輛班車。這不,MySQL 也聯(lián)合 Infobright 一起推出了開源的 數(shù)據(jù)倉(cāng)庫(kù)解決方案,而且是開源的。
其實(shí)現(xiàn)的各種DW該有的功能就不多說(shuō)了,但是 Infobright 有一點(diǎn)非常吸引人的技術(shù)特點(diǎn)不能不提,那就是以列為導(dǎo)向的架構(gòu)設(shè)計(jì)。
以列為導(dǎo)向的架構(gòu)設(shè)計(jì)是非常適合于DW應(yīng)用場(chǎng)景的,對(duì)于大多數(shù)DW的分析場(chǎng)景中,實(shí)際關(guān)注的數(shù)據(jù)很多時(shí)候都只有那么一列或者少數(shù)幾列的數(shù)據(jù)。所以在以列為導(dǎo)向的設(shè)計(jì)中,大部分的分析查詢都只需要讀取某一個(gè)(或者幾個(gè))表的幾列,而不需要像傳統(tǒng)以行為導(dǎo)向的數(shù)據(jù)庫(kù)(或者存儲(chǔ)引擎)那樣需要掃描整個(gè)表的數(shù)據(jù),這兩者IO量的差距是非常大的。除了以列為導(dǎo)向的架構(gòu)設(shè)計(jì)之外,Infobright 和很多其他的DW解決方案一樣,也會(huì)進(jìn)行數(shù)據(jù)壓縮,而且由于其以列為導(dǎo)向的存儲(chǔ)方式,壓縮比率在很多情況下都會(huì)比以行為導(dǎo)向的存儲(chǔ)方式更高,效果更理想。有人通過(guò)測(cè)試比較,常規(guī)的以行為導(dǎo)向的存儲(chǔ)數(shù)據(jù)壓縮比率較高的時(shí)候也就 3:1 左右,但是 Infobright 的卻很容易就做到 10:1 的壓縮比率。
此外,從MySQL 以及 Infobright 的官方報(bào)道中除了上述技術(shù)特點(diǎn)(或者說(shuō)優(yōu)勢(shì))之外,還有很多其他的被描繪的非常神奇的功能,如被稱為 “知識(shí)網(wǎng)格” (Knowledge Grid) 的自我管理功能,完全不需要索引或者分區(qū),神奇的自我查詢優(yōu)化器等等。
這里是官方給出的一張 Infobright 的架構(gòu)圖:
感興趣的朋友可以通過(guò)自行閱讀其 技術(shù)白皮書 獲取更多的細(xì)節(jié)
原文地址:MySQL 的 DW 解決方案(MySQL + Infobright), 感謝原作者分享。
聲明:本網(wǎng)頁(yè)內(nèi)容旨在傳播知識(shí),若有侵權(quán)等問(wèn)題請(qǐng)及時(shí)與本網(wǎng)聯(lián)系,我們將在第一時(shí)間刪除處理。TEL:177 7030 7066 E-MAIL:11247931@qq.com