最新文章專題視頻專題問答1問答10問答100問答1000問答2000關鍵字專題1關鍵字專題50關鍵字專題500關鍵字專題1500TAG最新視頻文章推薦1 推薦3 推薦5 推薦7 推薦9 推薦11 推薦13 推薦15 推薦17 推薦19 推薦21 推薦23 推薦25 推薦27 推薦29 推薦31 推薦33 推薦35 推薦37視頻文章20視頻文章30視頻文章40視頻文章50視頻文章60 視頻文章70視頻文章80視頻文章90視頻文章100視頻文章120視頻文章140 視頻2關鍵字專題關鍵字專題tag2tag3文章專題文章專題2文章索引1文章索引2文章索引3文章索引4文章索引5123456789101112131415文章專題3
問答文章1 問答文章501 問答文章1001 問答文章1501 問答文章2001 問答文章2501 問答文章3001 問答文章3501 問答文章4001 問答文章4501 問答文章5001 問答文章5501 問答文章6001 問答文章6501 問答文章7001 問答文章7501 問答文章8001 問答文章8501 問答文章9001 問答文章9501
當前位置: 首頁 - 科技 - 知識百科 - 正文

大型數據庫部署

來源:懂視網 責編:小采 時間:2020-11-09 07:29:25
文檔

大型數據庫部署

大型數據庫部署:隨著互聯(lián)網應用的廣泛普及,海量數據的存儲和訪問成為了系統(tǒng)設計的瓶頸問題。對于一個大型的互聯(lián)網應用,每天百萬級甚至上億的PV無疑對數據庫造成了相當高的負載。對于系統(tǒng)的穩(wěn)定性和擴展性造成了極大的問題。 一、負載均衡技術 負載均衡集群是由一組相互獨
推薦度:
導讀大型數據庫部署:隨著互聯(lián)網應用的廣泛普及,海量數據的存儲和訪問成為了系統(tǒng)設計的瓶頸問題。對于一個大型的互聯(lián)網應用,每天百萬級甚至上億的PV無疑對數據庫造成了相當高的負載。對于系統(tǒng)的穩(wěn)定性和擴展性造成了極大的問題。 一、負載均衡技術 負載均衡集群是由一組相互獨

隨著互聯(lián)網應用的廣泛普及,海量數據的存儲和訪問成為了系統(tǒng)設計的瓶頸問題。對于一個大型的互聯(lián)網應用,每天百萬級甚至上億的PV無疑對數據庫造成了相當高的負載。對于系統(tǒng)的穩(wěn)定性和擴展性造成了極大的問題。 一、負載均衡技術 負載均衡集群是由一組相互獨

隨著互聯(lián)網應用的廣泛普及,海量數據的存儲和訪問成為了系統(tǒng)設計的瓶頸問題。對于一個大型的互聯(lián)網應用,每天百萬級甚至上億的PV無疑對數據庫造成了相當高的負載。對于系統(tǒng)的穩(wěn)定性和擴展性造成了極大的問題。

一、負載均衡技術
負載均衡集群是由一組相互獨立的計算機系統(tǒng)構成,通過常規(guī)網絡或專用網絡進行連接,由路由器銜接在一起,各節(jié)點相互協(xié)作、共同負載、均衡壓力,對客戶端來說,整個群集可以視為一臺具有超高性能的獨立服務器。

1、實現(xiàn)原理
實現(xiàn)數據庫的負載均衡技術,首先要有一個可以控制連接數據庫的控制端。在這里,它截斷了數據庫和程序的直接連接,由所有的程序來訪問這個中間層,然后再由中間層來訪問數據庫。這樣,我們就可以具體控制訪問某個數據庫了,然后還可以根據數據庫的當前負載采取有效的均衡策略,來調整每次連接到哪個數據庫。
2、實現(xiàn)多據庫數據同步
對于負載均衡,最重要的就是所有服務器的數據都是實時同步的。這是一個集群所必需的,因為,如果數不據實時、不同步,那么用戶從一臺服務器讀出的數據,就有別于從另一臺服務器讀出的數據,這是不能允許的。所以必須實現(xiàn)數據庫的數據同步。這樣,在查詢的時候就可以有多個資源,實現(xiàn)均衡。比較常用的方法是Moebius for SQL Server集群,Moebius for SQL Server集群采用將核心程序駐留在每個機器的數據庫中的辦法,這個核心程序稱為Moebius for SQL Server 中間件,主要作用是監(jiān)測數據庫內數據的變化并將變化的數據同步到其他數據庫中。數據同步完成后客戶端才會得到響應,同步過程是并發(fā)完成的,所以同步到多個數據庫和同步到一個數據庫的時間基本相等;另外同步的過程是在事務的環(huán)境下完成的,保證了多份數據在任何時刻數據的一致性。正因為Moebius 中間件宿主在數據庫中的創(chuàng)新,讓中間件不但能知道數據的變化,而且知道引起數據變化的SQL語句,根據SQL語句的類型智能的采取不同的數據同步的策略以保證數據同步成本的最小化。

數據條數很少,數據內容也不大,則直接同步數據
數據條數很少,但是里面包含大數據類型,比如文本,二進制數據等,則先對數據進行壓縮然后再同步,從而減少網絡帶寬的占用和傳輸所用的時間。
數據條數很多,此時中間件會拿到造成數據變化的SQL語句, 然后對SQL語句進行解析,分析其執(zhí)行計劃和執(zhí)行成本,并選擇是同步數據還是同步SQL語句到其他的數據庫中。此種情況應用在對表結構進行調整或者批量更改數據的時候非常有用。
3、優(yōu)缺點
(1) 擴展性強:當系統(tǒng)要更高數據庫處理速度時,只要簡單地增加數據庫服務器就 可以得到擴展。
(2) 可維護性:當某節(jié)點發(fā)生故障時,系統(tǒng)會自動檢測故障并轉移故障節(jié)點的應用,保證數據庫的持續(xù)工作。
(3) 安全性:因為數據會同步的多臺服務器上,可以實現(xiàn)數據集的冗余,通過多份數據來保證安全性。另外它成功地將數據庫放到了內網之中,更好地保護了數據庫的安全性。
(4) 易用性:對應用來說完全透明,集群暴露出來的就是一個IP

(1) 不能夠按照Web服務器的處理能力分配負載。
(2) 負載均衡器(控制端)故障,會導致整個數據庫系統(tǒng)癱瘓。

二、數據庫的讀寫分離
1,實現(xiàn)原理:讀寫分離簡單的說是把對數據庫讀和寫的操作分開對應不同的數據庫服務器,這樣能有效地減輕數據庫壓力,也能減輕io壓力。主數據庫提供寫操作,從數據庫提供讀操作,其實在很多系統(tǒng)中,主要是讀的操作。當主數據庫進行寫操作時,數據要同步到從的數據庫,這樣才能有效保證數據庫完整性。

(ebay的讀寫比率是260:1,ebay的讀寫分離)

(微軟數據庫分發(fā))

2,實現(xiàn)方法:在MS Sql server中可以使用發(fā)布定義的方式實現(xiàn)數據庫復制,實現(xiàn)讀寫分離,復制是將一組數據從一個數據源拷貝到多個數據源的技術,是將一份數據發(fā)布到多個存儲站點上的有效方式。使用復制技術,用戶可以將一份數據發(fā)布到多臺服務器上。復制技術可以確保分布在不同地點的數據自動同步更新,從而保證數據的一致性。SQL SERVER復制技術類型有三種,分別是:快照復制、事務復制、合并復制。SQL SERVER 主要采用出版物、訂閱的方式來處理復制。源數據所在的服務器是出版服務器,負責發(fā)表數據。出版服務器把要發(fā)表的數據的所有改變情況的拷貝復制到分發(fā)服務器,分發(fā)服務器包含有一個分發(fā)數據庫,可接收數據的所有改變,并保存這些改變,再把這些改變分發(fā)給訂閱服務器。

3,優(yōu)缺點
(1)數據的實時性差:數據不是實時同步到自讀服務器上的,當數據寫入主服務器后,要在下次同步后才能查詢到。

(2)數據量大時同步效率差:單表數據量過大時插入和更新因索引,磁盤IO等問題,性能會變的很差。

(3)同時連接多個(至少兩個)數據庫:至少要連接到兩個數據數據庫,實際的讀寫操作是在程序代碼中完成的,容易引起混亂

(4)讀具有高性能高可靠性和可伸縮:只讀服務器,因為沒有寫操作,會大大減輕磁盤IO等性能問題,大大提高效率;只讀服務器可以采用負載均衡,主數據庫發(fā)布到多個只讀服務器上實現(xiàn)讀操作的可伸縮性。

三、數據庫/數據表 拆分(分布式)

通過某種特定的條件,將存放在同一個數據庫中的數據分散存放到多個數據庫上,實現(xiàn)分布存儲,通過路由規(guī)則路由訪問特定的數據庫,這樣一來每次訪問面對的就不是單臺服務器了,而是N臺服務器,這樣就可以降低單臺機器的負載壓力。提示:sqlserver 2005版本之后,可以友好的支持“表分區(qū)”。

垂直(縱向)拆分:是指按功能模塊拆分,比如分為訂單庫、商品庫、用戶庫...這種方式多個數據庫之間的表結構不同。

水平(橫向)拆分:將同一個表的數據進行分塊保存到不同的數據庫中,這些數據庫中的表結構完全相同。

(縱向拆分)

(橫向拆分)

1,實現(xiàn)原理:使用垂直拆分,主要要看應用類型是否合適這種拆分方式,如系統(tǒng)可以分為,訂單系統(tǒng),商品管理系統(tǒng),用戶管理系統(tǒng)業(yè)務系統(tǒng)比較明的,垂直拆分能很好的起到分散數據庫壓力的作用。業(yè)務模塊不明晰,耦合(表關聯(lián))度比較高的系統(tǒng)不適合使用這種拆分方式。但是垂直拆分方式并不能徹底解決所有壓力問題,例如 有一個5000w的訂單表,操作起來訂單庫的壓力仍然很大,如我們需要在這個表中增加(insert)一條新的數據,insert完畢后,數據庫會針對這張表重新建立索引,5000w行數據建立索引的系統(tǒng)開銷還是不容忽視的,反過來,假如我們將這個表分成100個table呢,從table_001一直到table_100,5000w行數據平均下來,每個子表里邊就只有50萬行數據,這時候我們向一張只有50w行數據的table中insert數據后建立索引的時間就會呈數量級的下降,極大了提高了DB的運行時效率,提高了DB的并發(fā)量,這種拆分就是橫向拆分

2,實現(xiàn)方法:垂直拆分,拆分方式實現(xiàn)起來比較簡單,根據表名訪問不同的數據庫就可以了。橫向拆分的規(guī)則很多,這里總結前人的幾點,

(1)順序拆分:如可以按訂單的日前按年份才分,2003年的放在db1中,2004年的db2,以此類推。當然也可以按主鍵標準拆分。

優(yōu)點:可部分遷移

缺點:數據分布不均,可能2003年的訂單有100W,2008年的有500W。

(2)hash取模分: 對user_id進行hash(或者如果user_id是數值型的話直接使用user_id的值也可),然后用一個特定的數字,比如應用中需要將一個數據庫切分成4個數據庫的話,我們就用4這個數字對user_id的hash值進行取模運算,也就是user_id%4,這樣的話每次運算就有四種可能:結果為1的時候對應DB1;結果為2的時候對應DB2;結果為3的時候對應DB3;結果為0的時候對應DB4,這樣一來就非常均勻的將數據分配到4個DB中。
優(yōu)點:數據分布均勻
缺點:數據遷移的時候麻煩;不能按照機器性能分攤數據 。
(3)在認證庫中保存數據庫配置
就是建立一個DB,這個DB單獨保存user_id到DB的映射關系,每次訪問數據庫的時候都要先查詢一次這個數據庫,以得到具體的DB信息,然后才能進行我們需要的查詢操作。
優(yōu)點:靈活性強,一對一關系
缺點:每次查詢之前都要多一次查詢,會造成一定的性能損失。

聲明:本網頁內容旨在傳播知識,若有侵權等問題請及時與本網聯(lián)系,我們將在第一時間刪除處理。TEL:177 7030 7066 E-MAIL:11247931@qq.com

文檔

大型數據庫部署

大型數據庫部署:隨著互聯(lián)網應用的廣泛普及,海量數據的存儲和訪問成為了系統(tǒng)設計的瓶頸問題。對于一個大型的互聯(lián)網應用,每天百萬級甚至上億的PV無疑對數據庫造成了相當高的負載。對于系統(tǒng)的穩(wěn)定性和擴展性造成了極大的問題。 一、負載均衡技術 負載均衡集群是由一組相互獨
推薦度:
  • 熱門焦點

最新推薦

猜你喜歡

熱門推薦

專題
Top