亞馬遜云科技大中華區產品部總經理 陳曉建
北京2022年7月11日 /美通社/ -- 自人類誕生以來,就從未中止過對數據的記錄與處理能力的探索。譬如古代對文字、書簡、印刷的發明和改進,就可視作是對人類大腦這一單體不可擴展的"原始數據庫"進行可用性和擴展性上的彌補。直至計算機問世,讓人類擁有了現代意義上的"數據庫",并由此催生了SQL結構化查詢語言和關系型數據庫。此后幾十年里,傳統關系型數據庫一直牢牢占據著數據庫產品的主流,直至云原生數據庫的出現。
云原生數據庫近年來的快速崛起,實質上體現的是企業對數據能力需求的迭代。數字化進程的不斷提速,不僅使數據成為企業核心資產和創新的主要驅動力,也讓企業不得不面對數據量指數級暴漲和數據類型及應用場景的多元細分挑戰。企業對數據庫擴展性和可用性的需求正在變成一條愈發陡峭的曲線,并且早已突破了傳統數據庫的天花板。
對于數據驅動型的企業來說,具有強大性能、支持多場景需求且具備成本效益的云數據庫,已成為打破傳統數據庫瓶頸,激活數據潛力,實現敏捷高效創新的必選項。這也是為什么越來越多企業選用云數據庫的原因。
作為云計算領域的引領者,亞馬遜云科技一直致力于探索公有云架構與數據庫演進的結合。我們開創性地提出NoSQL概念,并于2012年推出首個云原生數據庫Amazon DynamoDB -- 這一"云原生數據庫"從概念到落地應用的里程碑,讓我們更加確信"云托管"一定是打破傳統數據庫瓶頸,進一步激活數據生產力的必然歸宿。過去的十幾年中,亞馬遜云科技在云數據庫領域持續創新,不斷豐富云數據庫的類型與功能,滿足企業多樣化的業務需求,讓企業以更優異的性價比,實現更大化的數據價值。
推出NoSQL"開山之作"Amazon DynamoDB,拉開云原生數據庫序幕
亞馬遜云科技開啟數據庫云上之旅的第一步,是在傳統關系型數據庫和SQL語言占據統治地位的時期,就提出了NoSQL概念。這次創新的契機并非"未卜先知",而是源自我們對傳統關系型數據庫局限性的親身感受。
2004年12月的美國零售高峰時段,亞馬遜電商使用的商業關系型數據庫出現了服務高負載導致的嚴重擴展失敗問題,使官網出現幾個小時的服務故障。這促使我們開始思考關系型數據庫的局限性:"為什么要為這些工作負載使用關系型數據庫?統計數據表明,亞馬遜電商業務70%的數據訪問只是簡單的存儲和讀取,本質上它并不需要SQL事務級別的復雜性。"
為了解決關系型數據庫的可伸縮問題,我們開始著手搭建Amazon Dynamo非關系型數據庫原型并撰寫論文,提出NoSQL概念,并在2012年推出了第一個云原生非關系型數據庫Amazon DynamoDB,以前所未有的方式擁抱了云計算的彈性和可擴展性。
事實證明,NoSQL概念和非關系型數據庫的推出,最終成為對數據庫演進趨勢的一次準確預判。在Amazon DynamoDB問世后的十年里,我們對其進行的持續完善不僅涉及底層可用性、持久性、安全性和規模等特性,還包括易用性等 。現在Amazon DynamoDB已服務于全球眾多客戶,也包括亞馬遜自身。在去年亞馬遜長達66小時的Prime會員日大促期間,Amazon DynamoDB以低至個位數毫秒延遲的高性能表現,無感支持峰值達每秒8,920萬個請求,同時確保了系統的高可用性。
打破傳統數據庫局限,云計算賦能數據庫演進
正如云計算提速了企業數字化的進程,其推廣普及也使數據庫的迭代與發展進入一個全新的階段。依托云平臺構建、部署和分發的云數據庫,天然具有云計算本身的高可達性、可用性和可伸縮性,以及可監控性和高安全性等特征。云計算一方面解決了開源數據庫在易用性、可靠性、擴展性、性能等方面的問題,并相比傳統商業數據庫,降低了高昂的成本。通過云上托管的數據庫服務,客戶可以用開源數據庫實現媲美商業數據庫的性能,而成本通常只有商業數據庫的若干分之一。
以Amazon Aurora為例,它是與 MySQL 和 PostgreSQL 兼容的關系數據庫,專為云而打造。Amazon Aurora具有5 倍于標準MySQL以及3倍于標準PostgreSQL的吞吐性能,而使用成本僅相當于傳統商業數據庫的十分之一,還可大幅減輕客戶運維負擔。對于需要最大限度減輕運維工作并增加業務敏捷性的客戶,還可以選擇無服務器數據庫服務,其中Amazon Aurora Serverless可在幾分之一秒內自動擴展到數十萬個事務,可滿足客戶最嚴苛的應用程序,與為峰值負載預置數據庫容量的方式相比,該服務可幫助客戶節省高達90%的成本。
另外,由于大數據、物聯網、機器學習等應用場景的興起,企業通常需要處理各種類型的數據。云計算賦能下的云數據庫則可以解決客戶數據類型和數據應用場景多樣化的需求。目前,亞馬遜云科技提供十多種專門構建的數據庫服務,全面覆蓋各種數據管理場景和需求,包括關系型數據庫Amazon Aurora 及Amazon Relational Database Service(Amazon RDS)、鍵/值數據庫Amazon DynamoDB、文檔數據庫Amazon DocumentDB(兼容 MongoDB)、內存數據庫Amazon ElastiCache 及Amazon MemoryDB for Redis、圖數據庫Amazon Neptune、時間序列數據庫Amazon Timestream、寬列數據庫Amazon Keyspaces和分類賬數據庫Amazon Ledger Database Services (QLDB)。企業在每一個細分應用場景都可以使用最適合的數據庫,充分發揮其性能、功能的優勢。
寫在最后
"數據驅動業務"已成為當下各行各業進行數字化轉型的核心目標之一。企業希望數據能更多地取代經驗和直覺,在決策、管理、運營和創新的全鏈路發揮作用,成為真正的"數據驅動型組織"。作為數據處理中樞的數據庫,其角色也從IT基礎設施上升為企業整體數據戰略的關鍵一環,直接決定了企業能否順利實現期待中的"用數賦智"。
當云已成為企業數字化建設的新常態,云計算與云原生數據庫就如同"一體雙生",讓彼此優勢獲得充分釋放,共同推動"數智"能力完成質變。亞馬遜云科技相信,云原生數據庫是打破固有瓶頸,充分發揮公有云架構優勢,釋放數據創新潛力的必選項,我們也將持續推動云原生數據庫服務的創新,讓企業的云上數智之旅愈發得心應手,更加從容地應對未來的創新挑戰。