在半年前寫的 我亦云云也談云計算(6):云服務、軟件即服務和Web 2.0( http://blog.sina.com.cn/s/blog_535dace30100buif.html )中我敘述了云服務與SaaS, Web2.0的關系。當時筆墨主要花在解釋云與SaaS密切相關方面。對云與Web 2.0也有交集的聲稱只給出了
在半年前寫的 “我亦云云—也談云計算(6):云服務、軟件即服務和Web 2.0”(http://blog.sina.com.cn/s/blog_535dace30100buif.html)中我敘述了云服務與SaaS, Web2.0的關系。當時筆墨主要花在解釋云與SaaS密切相關方面。對云與Web 2.0也“有交集”的聲稱只給出了簡短的用例說明:“無所不在的智能手機作為Web 2.0的一個前端工具可以使許多重大事件實時上傳到云上的社區(qū)網(wǎng)站上在第一時間傳遍全球任何角落”。今天回來再補上一些更有點說服力的論據(jù)吧,主要還是為了說服自己。
要說云服務與Web 2.0有交集,在此文中我想局限在云存儲方面來講。先來看一個IDC幾年前發(fā)表的預測[1]:從2006年到2010年,全球的數(shù)據(jù)量將增長6倍。到2010年時,大約70%的數(shù)據(jù)是由個人(individual, 即單個人體)產生的,而且這些數(shù)據(jù)中至少85%的部分將由各種組織來負責管理,主要是為數(shù)據(jù)在安全、隱私、可靠及法規(guī)遵從這幾個方面進行管理(While nearly 70% of the digital universe will be generated by individuals by 2010, organizations will be responsible for the security, privacy, reliability and compliance of at least 85% of the information)。IDC繼續(xù)強調:無構造的數(shù)據(jù)占有這些數(shù)據(jù)的95%以上(Over 95% of the digital universe is unstructured data)。
從IDC的報告中我們可以解讀出不少內容。首先什么是“無構造的數(shù)據(jù)”?這個問題也可以用什么是“有構造的數(shù)據(jù)”來回答??垂僬埱f不要對我下面土得掉渣的回答太過認真了:“Web 2.0以前的數(shù)據(jù)主要是有構造的數(shù)據(jù)”。比如以前我想發(fā)表點什么東西都必須先經(jīng)過權威專家審查,千辛萬苦的研究成果絕大多數(shù)都是要被槍斃掉的。碰到運氣好時(某個權威專家好心情時)被接受錄用了一篇,則在萬般慶賀之后必須馬上誠惶誠恐將文章索引做成很有構造的數(shù)據(jù)錄入一個數(shù)據(jù)庫,否則錯過了截止日期不能發(fā)表后果自負!在此示例一個學術界很常用的BibTex數(shù)據(jù)庫條目:
@Book {MaoBook2003, Author="Wenbo Mao", Title="Modern Cryptography, Theory and Practice", Publisher="Prentice-Hall", Year="2003"}
我不詳細解釋這個數(shù)據(jù)庫條目的含義,只說一句:它的構造是非常非常要緊的,所有雙引號以外的字符一個都不能錯,否則檢索系統(tǒng)就一定會出錯!又比如銀行數(shù)據(jù)中心里的數(shù)據(jù)也大多是有構造的:您某年月日時分秒在全球哪個ATM機上取出了何幣種多少錢,或許還附帶上一小段您取款時的錄像,這些數(shù)據(jù)都會嚴格按照行業(yè)標準的格式被存入銀行的數(shù)據(jù)庫中。
如今好,每一個Web 2.0的個人參與者都有不止一種產生、發(fā)表、傳播數(shù)據(jù)的方法和工具,根本不必得到什么權威專家批準授權。為避免影響權威專家們的好心情我就不在此一一列出這些產生、發(fā)表、廣為傳播2.0型數(shù)據(jù)的方法和工具了。就這樣說吧:專家們產生1.0型的有構造數(shù)據(jù),而大量我們這些土老帽們產生2.0型的無構造數(shù)據(jù)。當然根據(jù)IDC的研究結果,還得煩請專家們來替土老帽們管理好這些無構造數(shù)據(jù)。
2.0型無構造數(shù)據(jù)相比之1.0型有構造數(shù)據(jù)除了在構造上有差別和在量上前者遠比后者超大之外,還有一個顯著差別:后端數(shù)據(jù)中心在存儲、管理和處理2.0型無構造數(shù)據(jù)時不需要采用十分快速響應的高端硬件設備。原因是這類數(shù)據(jù)的產生和使用是在前端客戶端設備(client devices)上發(fā)生的,其過程離不開若干人體器官的參與,量雖巨大可謂典型的人海技術,響應速度則實在無法恭維。既然在前端有人體使用瓶頸,后端數(shù)據(jù)中心當然就不應采用高端存儲設備如光纖通道網(wǎng)絡存儲器(FC-SAN和FC-NAS之類)來處理2.0型無構造數(shù)據(jù)。(正相反,銀行、證券交易所之類所用的數(shù)據(jù)中心則特別喜歡使用高速FC-SAN和FC-NAS,因為轉帳、支付、實時交易、約期交割等等所產生的數(shù)據(jù)必須實時高速處理才能準確無誤)。
至此晾出本文的中心思想:在云存儲服務與Web 2.0的交集中,IP(Internet Protocol)連接的網(wǎng)絡存儲技術十分適用于支持的后端存儲服務體系架構。這也是為何這幾年IP-SAN(IP Storage Area Network)增長十分火爆。與FC-SAN相比,IP-SAN使用iSCSI接口在TCP/IP上進行數(shù)據(jù)塊傳輸,帶寬雖要低得多,但相配前端人體器官的處理速度綽綽有余,還能滿足云服務的低成本要求。可以說云存儲與Web 2.0相交處的問題解決任務歷史性地落到了IP-SAN的肩膀上。
回到本文的開頭處話題:我在半年前那篇博文中介紹了EMC云存儲技術Atmos。在IaaS那一層的服務Atmos恰是基于IP-SAN技術之上的。
聲明:本網(wǎng)頁內容旨在傳播知識,若有侵權等問題請及時與本網(wǎng)聯(lián)系,我們將在第一時間刪除處理。TEL:177 7030 7066 E-MAIL:11247931@qq.com