當(dāng)你打開該網(wǎng)頁時(shí),相信你的第一反應(yīng)肯定是懷疑的,一個(gè)小小的程序員怎么可能成為數(shù)據(jù)庫專家,但是內(nèi)心也有一點(diǎn)期盼的成分存在,就像買彩票一樣,明知道中500萬的概率幾乎為零,可是還是會(huì)去買。前DataStax工程師,Platfora的聯(lián)合創(chuàng)始人,SriSatish Ambati描
當(dāng)你打開該網(wǎng)頁時(shí),相信你的第一反應(yīng)肯定是懷疑的,一個(gè)小小的程序員怎么可能成為數(shù)據(jù)庫專家,但是內(nèi)心也有一點(diǎn)期盼的成分存在,就像買彩票一樣,明知道中500萬的概率幾乎為零,可是還是會(huì)去買。前DataStax工程師,Platfora的聯(lián)合創(chuàng)始人,SriSatish Ambati描繪了一幅宏偉的藍(lán)圖,讓大數(shù)據(jù)從晦澀難懂的“黑魔法”變成像小孩子的“過家家”游戲那樣簡單,無論成功與否, Ambati勇氣可嘉,態(tài)度值得所有的程序員學(xué)習(xí)。喬布斯不正是把一個(gè)個(gè)不可能變成了現(xiàn)實(shí)嗎?
不過令人遺憾的是,0xdata的數(shù)據(jù)庫產(chǎn)品還在襁褓之中,但是0xdata對(duì)做大規(guī)模先進(jìn)的統(tǒng)計(jì)分析問題的能力有強(qiáng)大的自信:建立在HDFS上的規(guī)?;幚恚褂脧V為人知的R編程語言,把一切都隱藏在一個(gè)簡單的界面之下。
大數(shù)據(jù)的趨勢正在悄然發(fā)生改變,把大數(shù)據(jù)從晦澀難懂的“黑魔法”變成”小兒科“,似乎已經(jīng)不再是一個(gè)難以企及的夢想!0xdata正是推動(dòng)這項(xiàng)技術(shù)發(fā)展的最新公司之一。自啟動(dòng)以來,“hexadata”就凝聚了前DataStax工程師,Platfora的聯(lián)合創(chuàng)始人,SriSatish Ambati的心血結(jié)晶,現(xiàn)在它試圖融入Hadoop、R語言和谷歌的BigQuery,準(zhǔn)備打造“終極版”的統(tǒng)計(jì)分析工具。
Oxdata的旗艦產(chǎn)品,被稱之為“H2O”,不錯(cuò),就是“水”的意思,它的核心是一個(gè)統(tǒng)計(jì)分析引擎,它使用Hadoop的分布式文件系統(tǒng)(HDFS)作為其存儲(chǔ)平臺(tái),但是它們的最終目標(biāo)是像谷歌的BigQuery一樣簡單。H2O的用戶交互是通過一個(gè)簡單的網(wǎng)絡(luò)搜索和標(biāo)準(zhǔn)R統(tǒng)計(jì)分析語法。另外,用戶還可以在Microsoft Excel或RStudio的集成開發(fā)環(huán)境中使用REST API調(diào)用H2O。
Ambati表示,規(guī)?;幕A(chǔ)數(shù)據(jù)和運(yùn)行高級(jí)分析的復(fù)雜性都是需要被隱藏的細(xì)節(jié)。這和Platfora有相同的理論基礎(chǔ),但是該公司的聯(lián)合創(chuàng)始人Ambati和前任DataStax的同事Ben Werther卻與Platfora的做法截然不同。Platfora試圖通過建立基于Hadoop的下一代用戶體驗(yàn)來破壞現(xiàn)有的數(shù)據(jù)倉庫市場,然而0xdata只是試圖改變傳統(tǒng)的統(tǒng)計(jì)軟件的用戶交互方式而已。
數(shù)據(jù)分析產(chǎn)品的負(fù)責(zé)人Ambati很經(jīng)典的一句話:“誰都沒有吹牛的權(quán)利。但是如果不這樣做,未來將寸步難行。”讓人不禁想到這兩天京東與蘇寧的家電大戰(zhàn),只能硬著頭皮前進(jìn),不能后退,因?yàn)楹笸思词菧缤觯?/p>
Oxdata把數(shù)據(jù)處理的速度當(dāng)做一個(gè)重點(diǎn)處理——如何快速處理數(shù)據(jù),如何讓用戶迅速得到響應(yīng)。谷歌搜索讓我們有了可以陸續(xù)追問的思想,Ambati認(rèn)為,數(shù)據(jù)分析也應(yīng)該有同樣的經(jīng)歷。這就是為什么H2O在分析過程中的每一步都提供了近似的結(jié)果,而不是等待整個(gè)工作運(yùn)行以后得出計(jì)算精確的結(jié)果,用戶可以得到一個(gè)總體的解決思路,即使完全超出預(yù)期范圍,無論是清理工作還是重新開始新工作都會(huì)變得更快。
想要在公眾面前得到一個(gè)機(jī)會(huì),實(shí)現(xiàn)H2O“壯志雄心”的諾言,還有很長的一段路要走。但是Ambati表示,雖然產(chǎn)品僅僅是經(jīng)歷了短短4個(gè)月的開發(fā),還沒有一套的完整的算法,但是相信幾個(gè)月以后就能初見分曉。他團(tuán)隊(duì)的八位工程師,已經(jīng)建立了很多很酷的東西,只是現(xiàn)在還需要一個(gè)完善的過程,最終才能把代碼變成實(shí)際的產(chǎn)品。盡管困難是如此之大,他們毅然決定繼續(xù)數(shù)據(jù)的系統(tǒng)化處理,就是從那一刻起,Ambati和他的團(tuán)隊(duì)也發(fā)現(xiàn)了很多的樂趣,“我們與基礎(chǔ)架構(gòu)生死相隨,不離不棄”Ambati調(diào)侃道,“而且我們一大幫人花了很多的時(shí)間來學(xué)習(xí)數(shù)學(xué),日子就像回到計(jì)算機(jī)科學(xué)專業(yè)學(xué)生的那個(gè)時(shí)代”。(編譯/王鵬,審校/包研)
How 0xdata wants to help everyone become data scientists
后記:Oxdata的H2O目前雖然還是“鏡花水月,空中樓閣”,但是Ambati和他的團(tuán)隊(duì)的精神確實(shí)讓人肅然起敬,中國有句老話“有志者,事竟成”,相信只要努力肯定會(huì)有收獲。當(dāng)1985年Microsoft的Windows視窗操作系統(tǒng)發(fā)布,就立即取代了以往的命令、代碼系統(tǒng)(Microsoft Disk Operating Systerm,簡稱MS-DOS),立即成就了Microsoft這個(gè)龐然大物,讓比爾·蓋茨榮登世界首富的寶座,就是因?yàn)閃indows簡單簡潔,操作方便,給用戶帶來了更好的操作體驗(yàn),現(xiàn)在電腦已經(jīng)走進(jìn)千家萬戶,從幾歲的孩子到五六十的老人,都能很快上手進(jìn)行網(wǎng)上沖浪,這不正是Windows的魅力所在嗎?喬布斯的Ipad風(fēng)靡全球也正是因?yàn)檫@些原因,因?yàn)樗?歲的孩子都能很快成為“水果忍者”。Ambati的團(tuán)隊(duì)也做著同樣的事情,他們也想讓“觸不可及”的大數(shù)據(jù)處理變得的簡單如操作Windows一樣,讓每個(gè)人都能迅速成為數(shù)據(jù)庫領(lǐng)域的“專家”,這不正是醞釀著一場新的數(shù)據(jù)革命嗎?我們也期待H2O的發(fā)布,能給大數(shù)據(jù)帶來一場新的變革!
聲明:本網(wǎng)頁內(nèi)容旨在傳播知識(shí),若有侵權(quán)等問題請及時(shí)與本網(wǎng)聯(lián)系,我們將在第一時(shí)間刪除處理。TEL:177 7030 7066 E-MAIL:11247931@qq.com