首屆雲上廣交會存儲服務架構與實踐

疫情壓力下,廣交會63年來首次整體搬上"雲端",首次整體搬上"雲端"的廣交會運行平穩,服務了217個國家和地區的採購商觀展。作為本屆廣交會的技術服務商,騰訊為廣交會網上舉辦提供整體技術支持、平台研發服務與雲資源支撐。

其中,騰訊雲對象存儲COS,為本屆為期十天的廣交會,提供10*24小時不間斷的、高可靠的雲上存儲服務,服務了近2.6萬家參展企業通過圖文、視頻、3D等形式的海量展品展示,支撐了180萬件商品和數千個直播間同時在線,滿足了以VR呈現產品展廳/企業全景等新型推介形式。

1、 騰訊雲對象存儲COS為首屆雲上廣交會設計的架構

1)COS無目錄層次結構、無數據格式限制、無容量上限

騰訊雲存儲COS,是無目錄層次結構、無數據格式限制、無容量上限的雲上分佈式存儲服務;很好滿足本次廣交會的圖文、視頻、3D、VR等多種形式的海量展品/展廳/企業全景展示。

COS是對象存儲,基於對象Key來訪問對象,對象就是文件,且不限定文件格式,且文件大小基本無限制,所以,COS能很好支持本次廣交會的圖文、視頻、3D、VR等多種形式文件。

COS基於扁平式架構來組織對象,沒有目錄層次結構的束縛,所以,文件數量無上限,輕鬆擴展到10億+文件,且性能基本沒有降低。對於文件存儲是不可想象的,文件存儲基於目錄樹來組織文件,目錄深度(目錄深度,是指目錄樹的包含嵌套子目錄的層次的數據)和廣度(目錄廣度,目錄裏所包含文件或子目錄的數量)都是有限制,而且隨着目錄深度和目錄廣度的攀升,性能將逐步降低,因為,每次IO請求,均要去目錄樹查找到所要訪問的文件,查找所需時間跟目錄深度和目錄廣度呈線性關係,再疊加目錄樹的修改、多節點併發修改,將會更加糟糕。COS扁平式架構,完美解決目錄樹耗時查詢和併發修改等問題,實現容量無上限。

COS容量無上限,解決存儲最普遍的痛點,擴容。正因為擴容的苦楚,每次使用存儲之前,精確做容量規劃,來避免後續擴容煩惱。但像廣交會這樣的活動,提前是很難估計容量需求,特別是第一次線上廣交會,更是沒有歷史數據供參考。COS容量無上限正好解決此痛點。

2)COS多AZ架構

為保障"雲端"廣交會的10*24小時不間斷運行,騰訊雲對象存儲 COS 默認提供99.95%的可用性和99.999999999%(11個9)的數據持久度。

為進一步提升數據可用性和安全度,COS提供多AZ存儲架構;一個可用區AZ(Availability zone) 指的是一個騰訊雲中的數據中心的地理區域,騰訊雲不同可用區之間完全隔離,保證不同可用區間最大程度的穩定性和容錯性。可用區具有冗餘電源、聯網和連接。騰訊雲在一個地域提供多個可用區,可用區之間通過高帶寬、低延遲網絡與完全冗餘的專用城域光纖互連。

COS多AZ高可靠架構,將數據打散到同一個地域的不同可用區,為用户數據提供了數據中心級別的容災能力,將用户數據分散存儲在同城中的不同機房,當某個機房因為自然災害、斷電等極端情況整體故障時,依然提供穩定可靠的存儲服務,將可用性提升到99.995%,數據持久度提升到12個9。

多AZ架構,採用糾刪碼冗餘存儲技術。以3AZ為例,採用9+9糾刪碼冗餘存儲技術,客户原始數據寫入時會被切成9個數據塊,同時生成9個校驗信息塊,打散成3份存儲在不同的可用區機房內,每個機房存儲6個數據塊,各個機房間數據保持一致。當某個機房發生極端情況時,客户可以從其餘的12份數據塊中正常讀取數據,不會出現業務中斷或者數據丟失的情況;滿足客户對數據高可靠、業務高可用的需求。

首屆雲上廣交會存儲服務架構與實踐

多AZ架構,實現了雲上同城雙活、同城多活的服務品質,滿足數據中心級高可用訴求,容忍同城(同地域)任意一個或多個數據中心故障,保持業務高可用,數據不丟失、業務不中斷。整個故障切換過程用户無感知、業務不中斷、數據不丟失。可滿足關鍵業務系統對於RPO=0、RTO=0的極致要求。

在多AZ架構上,提供了高達6萬QPS高性能(高出業界3~6倍),在保障高可靠存儲服務的同時,提供大併發高性能服務能力;很好滿足廣交會這樣大型活動的穩定運行需求。

3)COS跨地域複製

本次"雲端"廣交會,為了進一步保障萬無一失,啓用騰訊雲存儲COS跨地域高可用方案,做為應急預案,一旦某地域不可用,或鏈路不可達,立即切換到另一個地域,業務平滑切換另一個地域的COS,整個切換自動完成,業務無感知,保障業務連續性。地域,是公有云概念,是指物理數據中心的地理區域,騰訊雲不同地域之間完全隔離,保證不同地域間最大程度的穩定性和容錯性。騰訊雲COS已在全球30+地域開服,跨地域高可用,能容忍地震、海嘯、洪水等極端自然災害。

COS跨地域高可用方案架構如下圖所示,本次"雲端"廣交會的圖片/視頻等數據,寫入地域A的主存儲桶A,通過COS跨地域複製功能,基於騰訊雲內網,快速、自動同步給地域B的備存儲桶B;每次同步增量數據,即保障主存儲桶與備存儲桶的數據一致,又節省傳輸帶寬,節省主存儲同步數據的負擔。

首屆雲上廣交會存儲服務架構與實踐

本次"雲端"廣交會的訪客,瀏覽展品圖文視頻展示,通過互聯網HTTPS/HTTP協議讀取COS,默認訪問主地域的主存儲桶。一旦主地域不可訪問,主動訪問備地域的備存儲桶,由於,被存儲桶數據與主存儲桶一樣,所以,能訪問到與主存儲桶一樣的數據。本次"雲端"廣交會啓用騰訊雲COS + CDN 一體化方案,將主地域的主存儲桶設置為CDN的主源站,備地域的備存儲桶設置為CDN的備源站,CDN依次去主源站、備源站拉取數據,若CDN緩存未命中,去主源站A存儲桶讀數據,假設A存儲桶鏈路不通,CDN去備源站B存儲桶讀數據,平滑實現主切備,自動完成主切備的全過程,對用户完全透明。

COS跨地域複製,可在不同存儲區域的存儲桶中自動、異步地複製增量對象。可實現跨地域級別的容災、就近訪問提高可用性。COS 跨地域複製功能豐富,支持雙向複製,以及一對多複製。

首屆雲上廣交會存儲服務架構與實踐

        

客户對文件產生的所有增量操作,包括刪除文件操作(開啓多版本的情況下刪除文件操作實際上是創建一個 0 字節的特殊 delete marker 文件)都會經由源桶通知 costrsf 模塊,任務入 CMQ 隊列成功之後則返回成功,後續由 costrsf 模塊異步的同步文件到目的存儲桶,所有的元信息以及訪問控制信息 ACL 都會原封不動的同步到目的端,目的端文件的版本號會和源文件的版本號也保持一致。源文件會維持一個 x-cos-replication-status 字段來保存跨地域複製任務的狀態,客户可以通過 HEAD Object 接口來查詢文件的複製狀態。

COS多AZ架構和跨地域複製,在本地地域實現多數據中心多活,在其他地域再保存複製數據,已容忍整體地域不可用情況下的數據安全和業務連續性。多AZ架構,保障本地域任意數據中心不可用的業務高可用,數據立即同步,業務及時切換,RPO=0、RTO=0。跨地域複製,保障任意地域不可用的業務連續性,異步複製數據,RPO大於0。相比用户自建兩地三中心,COS實現了多地多中心,COS多AZ架構實現本地域多個數據中心高可用,COS跨地域複製實現跨地域容災,可靠性更高、靈活性更大;並能在一鍵式開通、按需使用、按用量計費,節省用户寶貴時間、砍掉建設費用、節省使用費用、省去維護費用。

4)COS全球加速

本次"雲端"廣交會,服務全球客户,正好是COS全球加速典型場景。

COS全球加速,讓全球用户加速訪問COS,利用全球分佈的雲機房,幫助全球各地用户快速訪問最近的騰訊雲接入層,提升業務訪問成功率和穩定性。使用全球加速功能就近接入之後,客户端到接入層的"加速"實際上是,由穩定快速的內網專線網絡傳輸鏈路,來代替外網不穩定的跨國或跨地域的訪問鏈路。

開啓了全球加速後,用户上傳圖片的請求鏈路則發生了變化,請求將由騰訊雲智能調度,如下圖所示,就近接入到廣州接入層,走騰訊雲內網專線傳輸至北京存儲層落盤。穩定快速的內網專線網絡傳輸鏈路代替了不穩定的跨地域的訪問鏈路,因此請求的可用性和速率都能得到提升。

首屆雲上廣交會存儲服務架構與實踐

四、結語

騰訊雲COS為首屆"雲端"廣交會保駕護航,支撐10*24小時不間斷平穩運行,為雲上會展提供新方案、新範例。

版權聲明:本文源自 網絡, 於,由 楠木軒 整理發佈,共 3409 字。

轉載請註明: 首屆雲上廣交會存儲服務架構與實踐 - 楠木軒