數(shù)據(jù)庫(kù)市場(chǎng)形成今天的格局已經(jīng)很久了,商業(yè)數(shù)據(jù)庫(kù)為王,這幾乎沒有變過。不過,云來了,以AWS、阿里云為代表的云服務(wù)商攜云原生數(shù)據(jù)庫(kù)發(fā)起了新一輪挑戰(zhàn)。與以往歷次的挑戰(zhàn)不同,這次的競(jìng)賽換了賽道。
3月21日,阿里云對(duì)外發(fā)布了POLARDBv2.0。此前的POLARDB針對(duì)的是MySQL用戶,這一次POLARDB還可以兼容Oracle數(shù)據(jù)庫(kù)。據(jù)悉,這也是首個(gè)兼容Oracle的云原生數(shù)據(jù)庫(kù),可幫助金融、醫(yī)療、制造等大型企業(yè)在數(shù)小時(shí)內(nèi)完成業(yè)務(wù)遷移,10TB數(shù)據(jù)備份只需10分鐘。
因云而生的POLARDB
數(shù)據(jù)庫(kù)誕生于上個(gè)世紀(jì)70年代,經(jīng)過這些年的發(fā)展,無論是技術(shù)還是市場(chǎng)格局都已經(jīng)趨于穩(wěn)定,因此市場(chǎng)很長(zhǎng)時(shí)間以來一直處于波瀾不驚的狀態(tài),不過,云時(shí)代的到來打破了這種平靜,因?yàn)樵谠茣r(shí)代傳統(tǒng)數(shù)據(jù)庫(kù)面臨很多新的挑戰(zhàn),這就給了新生的云原生數(shù)據(jù)庫(kù)以機(jī)會(huì)。
在2019阿里云峰會(huì)·北京站上,阿里云智能總裁張建鋒在演講時(shí)曾提到了云給這個(gè)世界帶來的三個(gè)變化,即IT基礎(chǔ)設(shè)施的云化、核心技術(shù)的互聯(lián)網(wǎng)化、應(yīng)用的數(shù)據(jù)化和智能化。
“基礎(chǔ)設(shè)施的云化需要一套新的系統(tǒng),需要基于互聯(lián)網(wǎng)技術(shù)來進(jìn)行改造。因此,下一代的技術(shù)一定構(gòu)建在互聯(lián)網(wǎng)技術(shù)和云化基礎(chǔ)設(shè)施上的?!睆埥ㄤh表示。
而阿里云的數(shù)據(jù)庫(kù)POLARDB正是適應(yīng)基礎(chǔ)設(shè)施的云化而誕生的,正因?yàn)榇?,POLARDB這類數(shù)據(jù)庫(kù)也被稱為云原生數(shù)據(jù)庫(kù),包括AWS的Aurora也是這一類型的代表。
實(shí)際上,阿里云早期也是傳統(tǒng)數(shù)據(jù)庫(kù)的使用者,正是因?yàn)樵频恼Q生,因?yàn)樽陨順I(yè)務(wù)不斷成長(zhǎng),發(fā)現(xiàn)傳統(tǒng)數(shù)據(jù)庫(kù)越來越難以滿足自身的需求,才有了自研的云原生POLARDB。
“阿里的業(yè)務(wù)很復(fù)雜,數(shù)據(jù)量很大,隨著業(yè)務(wù)的發(fā)展,基于開源數(shù)據(jù)庫(kù)的分布分表中間件的解決方案已經(jīng)不能滿足。這就是POLARDB誕生的直接原因?!卑⒗镌浦悄軘?shù)據(jù)庫(kù)產(chǎn)品線總負(fù)責(zé)人李飛飛說。
享受云等諸多技術(shù)紅利
作為一款誕生于云時(shí)代、一開始就架構(gòu)在云平臺(tái)之上的云原生數(shù)據(jù)庫(kù)天生地具有很多優(yōu)勢(shì)。比如,彈性伸縮能力就是云原生數(shù)據(jù)庫(kù)最重要的特點(diǎn),即當(dāng)用戶業(yè)務(wù)量低的時(shí)候,就少分配資源;當(dāng)業(yè)務(wù)負(fù)載高的時(shí)候,通過只讀節(jié)點(diǎn)等逐漸擴(kuò)展的方式,讓數(shù)據(jù)庫(kù)支持業(yè)務(wù)的增長(zhǎng)。這種彈性伸縮的能力還帶來另一個(gè)好處,就是按需付費(fèi),成本節(jié)約。所以,云原生數(shù)據(jù)庫(kù)往往具有更高的性價(jià)比。
“傳統(tǒng)數(shù)據(jù)庫(kù)的典型架構(gòu)就是單節(jié)點(diǎn)架構(gòu),有存儲(chǔ)引擎、查詢引擎和優(yōu)化器引擎,再上面是SQLParser,這一套架構(gòu)中存儲(chǔ)和計(jì)算是綁定在一起的,而云原生數(shù)據(jù)庫(kù)存儲(chǔ)與計(jì)算是分離的?!崩铒w飛表示。
李飛飛介紹說,POLARDB采用的是分布式共享存儲(chǔ)架構(gòu),計(jì)算與存儲(chǔ)分離。由于計(jì)算與存儲(chǔ)的解耦,存儲(chǔ)就可以通過RDMA高速網(wǎng)絡(luò)做成一個(gè)分布式存儲(chǔ),而看起來仍然像一個(gè)本地盤。正是由于采用了計(jì)算與存儲(chǔ)分離的架構(gòu)設(shè)計(jì)使得POLARDB的最大數(shù)據(jù)容量可以達(dá)到100TB,這是開源數(shù)據(jù)庫(kù)難以企及的,也成為POLARDB很多早期用戶采用它來取代MySQL的一個(gè)主要原因。
除了借助RDMA等網(wǎng)絡(luò)技術(shù)實(shí)現(xiàn)彈性伸縮能力之外,POLARDB還享受了很多現(xiàn)代技術(shù)的紅利。比如,POLARDB采用了英特爾的傲騰——這是一種訪問速度介于內(nèi)存和SSD之間的新型存儲(chǔ)介質(zhì),如果需要擴(kuò)容,可以在5分鐘之內(nèi)完成節(jié)點(diǎn)規(guī)格的升級(jí)和進(jìn)行只讀節(jié)點(diǎn)的擴(kuò)展,極速適配。
實(shí)際上,傲騰的對(duì)數(shù)據(jù)庫(kù)的影響不只是快速,它也在一定程度上改變了數(shù)據(jù)庫(kù)的設(shè)計(jì)邏輯,讓數(shù)據(jù)一旦寫了之后實(shí)時(shí)就可持續(xù)性了,持久化了。
另外,像GPU加速在POLARDB中也有采用。在POLARDB中一些重復(fù)性或相似性比較高的計(jì)算,會(huì)Offload到FPGA來做,通過FPGA的定制化的計(jì)算模塊重復(fù)調(diào)用,來節(jié)省CPU的時(shí)間,從而帶給用戶更好地體驗(yàn)。
不斷升級(jí)的產(chǎn)品
POLARDB也在不斷升級(jí),目前阿里云還在研發(fā)POLARDB的分布式版本,今年會(huì)宣布公測(cè)。該版本的目標(biāo)客戶是業(yè)務(wù)數(shù)據(jù)量超過單機(jī)數(shù)據(jù)庫(kù)的承受能力,業(yè)務(wù)復(fù)雜對(duì)資源彈性要求高,例如要求數(shù)據(jù)不丟失,系統(tǒng)高穩(wěn)定高可用。
據(jù)悉,它能支持更海量的數(shù)據(jù)、更高并發(fā)的處理能力,基于阿里的核心業(yè)務(wù)十余年打磨,圍繞高效低成本存儲(chǔ)引擎X-Engine,提供企業(yè)化高可用的X-Paxos協(xié)議實(shí)現(xiàn)。
李飛飛介紹,POLARDB分布式版本的一大特性就是解決了分庫(kù)分表問題。早期互聯(lián)網(wǎng)公司采用基于中間件技術(shù)的分庫(kù)分表技術(shù)解決資源擴(kuò)展問題,但這會(huì)大大增加系統(tǒng)的復(fù)雜度和對(duì)應(yīng)用的侵入。因?yàn)楹芏鄷r(shí)候這意味著業(yè)務(wù)邏輯的重構(gòu)、軟件的改寫,成本非常高。而POLARDB分布式版本具有類似GoogleSpanner的先進(jìn)架構(gòu),同時(shí)又?jǐn)[脫其昂貴復(fù)雜的原子鐘依賴。
“阿里很多大促活動(dòng),比如‘雙11’,光靠云原生共享存儲(chǔ)是無法完全解決這個(gè)問題。過去兩年,我們一直在研發(fā)自己的分布式存儲(chǔ)技術(shù),它的核心思路就是分布分表,但我們不希望用中間件的解決方案?!崩铒w飛說。
李飛飛解釋說,與基于中間件技術(shù)的分庫(kù)分表不同,阿里云希望做一個(gè)原生的分布式數(shù)據(jù)庫(kù),在內(nèi)核里面做分布分表,以盡可能減少對(duì)業(yè)務(wù)層的沖擊?,F(xiàn)在阿里云要把分布式數(shù)據(jù)庫(kù)的技術(shù)和POLARDB有機(jī)地結(jié)合起來。
“我們的目標(biāo)是打造一個(gè)通用的商業(yè)數(shù)據(jù)庫(kù),要求非常產(chǎn)品化、標(biāo)準(zhǔn)化,能夠支持不同產(chǎn)品。未來POLARDB分布式版本能夠提供一個(gè)基于共享存儲(chǔ)的一寫多讀的云原生數(shù)據(jù)庫(kù),同時(shí)利用分布式架構(gòu)能夠快速靈活拓展。這樣,不管是在公有云上,還是針對(duì)線下的一些企業(yè)級(jí)超大規(guī)模的用戶,我們都能夠用POLARDB去統(tǒng)一滿足用戶需求?!崩铒w飛說。
有挑戰(zhàn)更是機(jī)遇
很顯然,在數(shù)據(jù)庫(kù)市場(chǎng),POLARDB是一個(gè)新來者,甚至與AWS的Aurora相比,POLARDB也要晚幾年。但李飛飛認(rèn)為,作為挑戰(zhàn)阿里云的數(shù)據(jù)庫(kù)具有自己的獨(dú)特優(yōu)勢(shì),而最大的優(yōu)勢(shì)是背后有阿里的業(yè)務(wù)在推動(dòng)。
“任何技術(shù)都是業(yè)務(wù)推動(dòng)來衍生的,只要你有業(yè)務(wù)場(chǎng)景,技術(shù)就一定會(huì)逐步從發(fā)展到領(lǐng)先。比如阿里電商‘雙11’在世界上就絕無僅有,阿里云的數(shù)據(jù)庫(kù)必須經(jīng)受住海量和高并發(fā)的實(shí)戰(zhàn)考驗(yàn)。”李飛飛說。
實(shí)際上,阿里云數(shù)據(jù)庫(kù)技術(shù)也得到國(guó)際咨詢機(jī)構(gòu)的認(rèn)可,在2018Gartner數(shù)據(jù)庫(kù)魔力象限中,阿里云成為國(guó)內(nèi)首個(gè)入選的科技公司。
“這代表了阿里云的數(shù)據(jù)庫(kù)技術(shù)已經(jīng)和頂級(jí)數(shù)據(jù)庫(kù)廠商站在了同一個(gè)舞臺(tái)。中國(guó)數(shù)據(jù)庫(kù)廠商有這個(gè)機(jī)會(huì),非常榮幸。不能只說是阿里的功勞,也是整個(gè)中國(guó)IT產(chǎn)業(yè)、中國(guó)經(jīng)濟(jì)發(fā)展的結(jié)果。如果沒有中國(guó)數(shù)字化經(jīng)濟(jì)的蓬勃發(fā)展,我們是不可能取得這樣的成功?!崩铒w飛說。
李飛飛坦言,作為挑戰(zhàn)者阿里云數(shù)據(jù)庫(kù)要真正與數(shù)據(jù)庫(kù)巨頭競(jìng)爭(zhēng),面臨不小的挑戰(zhàn)。
第一個(gè)是阿里云和傳統(tǒng)數(shù)據(jù)庫(kù)廠商有一個(gè)非常大的不同,就是傳統(tǒng)數(shù)據(jù)庫(kù)廠商可以只研發(fā)數(shù)據(jù)庫(kù)產(chǎn)品,而阿里云數(shù)據(jù)庫(kù)還要支持集團(tuán)的業(yè)務(wù),還要服務(wù)自己云上的客戶以及私有云、混合云的外部客戶。
“我們面臨的是非常復(fù)雜的一個(gè)場(chǎng)景:又要研發(fā),又要運(yùn)維。既要支持集團(tuán)的業(yè)務(wù),又要支持云上的業(yè)務(wù),所以穩(wěn)定性、安全運(yùn)維這絕對(duì)是我們第一生命線。”李飛飛表示。
第二個(gè)挑戰(zhàn)也是李飛飛認(rèn)為最核心的挑戰(zhàn),是混合云部署所帶來的,這里面既有技術(shù)上的挑戰(zhàn)也有業(yè)務(wù)上的挑戰(zhàn)。比如,你怎么保證安全、穩(wěn)定、高效地部署混合云,混合云的數(shù)據(jù)架構(gòu)如何設(shè)計(jì)等等。
第三個(gè)是數(shù)據(jù)的安全隱私保護(hù),這是阿里云數(shù)據(jù)庫(kù)一直不敢放松的。
第四點(diǎn)就是智能化大規(guī)模落地和應(yīng)用。當(dāng)系統(tǒng)越來越復(fù)雜,數(shù)據(jù)量越來越大,運(yùn)維挑戰(zhàn)越來越高的時(shí)候,就必須利用人工智能、機(jī)器學(xué)習(xí)的技術(shù)盡可能地實(shí)現(xiàn)自動(dòng)運(yùn)維,提高運(yùn)維效能。
“這些是挑戰(zhàn)也是機(jī)遇,阿里云的業(yè)務(wù)快速發(fā)展正在不斷驅(qū)動(dòng)我們技術(shù)的發(fā)展,驗(yàn)證和帶領(lǐng)技術(shù)不斷往前走,我們已經(jīng)走在了云原生數(shù)據(jù)庫(kù)領(lǐng)域的前列?!崩铒w飛總結(jié)說。
聲明:本文為轉(zhuǎn)載類文章,如涉及版權(quán)問題,請(qǐng)及時(shí)聯(lián)系我們刪除(QQ: 2737591964),不便之處,敬請(qǐng)諒解!