Seagate 台灣區總經理黃又青彙集了2021年資料儲存五大趨勢,並針對這五大趨勢給予企業儲存需求投資的參考。
文/黃又青(Seagate 台灣區總經理)
1.階層式(靜態與動態資料)儲存安全日益重要
超大規模軟體生態系統正持續發展,使較小的原子單位亦可開發與部署各種應用程式,即便沒有聯網基礎設施的業務和地點也同樣適用。越來越多的雲端原生應用程式在PoP(網路連接點)或位於世界各地的主機代管設施運行。這種資產合作模式益發普及的情況下,更須留意在過程中每一環節做好資料保護,而在更為分散部署的模式下,移動中的資料(動態)與被儲存的資料(靜態)是資料保護的兩大關鍵區塊。
給企業經理人的建議:許多產業對資料靜態加密提出益發嚴格的規範,以應對來自外部及內部的資安威脅。或許目前您所屬產業尚未強制要求靜態資料加密,但將來可能會出現此類新規範。因此,Seagate建議企業盡速改用加密硬碟,以確保未來一旦新規定上路後能夠順利接軌。
2.企業更加廣泛採用物件儲存
在有用資料爆炸性增長的同時,物件儲存逐漸成為大容量的標準,與傳統檔案儲存相較有諸多優點,包括規範性元資料、擴充性,且避免階層式資料架構。資料集包含的智慧情資越多,對系統幫助越大;物件儲存恰可提供此等智慧資料。儲存型態包括區塊、檔案和物件。對許多效能敏感之關鍵任務型應用而言,區塊儲存極為重要。檔案儲存主要服務傳統應用程式,多年來提供一套穩健架構。物件儲存則聚焦於新的應用開發與區塊儲存結合,以共生方式提供規模與效能之提升。許多舊有的檔案應用也逐步遷移至物件儲存基礎架構,以發揮物件儲存所創造的規模經濟。
給企業經理人的建議:物件儲存正迅速成為容量儲存的實質標準,透過改善經濟效率和擴充性,快速擴張並取代檔案儲存。此外,現在培訓出來的程式設計師越來越習於以物件儲存介面為基礎來建構工作流程,他們正是您需要的人才。如果您的資料中心還沒加入物件儲存的話,可以考慮現在開始。
3.組合性逐漸廣獲採用
將系統分割成獨立單元,並可與其他獨立單元結合的想法其實存在已久,但是現在的趨勢是更全面採用以開源軟體為基礎的組合性方案。Kubernetes開源系統專為容器化應用程式的自動部署、擴充與管理所設計,正是驅動此一趨勢的核心。開源軟體是應用程式開發的未來希望所繫,乃是因為它能讓更大規模的社群一起合作,解決困擾著許多產業的問題,同時有助於利用開放架構來設計領域特定之解決方案。透過硬體組合來滿足軟體或業務需求可說是非常自然的轉變趨勢。
給企業經理人的建議:如今的資料中心逐漸轉向可組合模式,讓資源的部署與再部署更為簡便,不需要事先組態,或在運算、記憶體與儲存之間設定靜態配置比例。容器和Kubernetes是打造組合性的核心機制,如果資料中心尚未擁抱這類技術的話,應該立即開始採用。
4.大容量儲存部署的分層(將熱資料置於快閃記憶體,其餘則放在磁碟)
NVIDIA的GPU設計將記憶體劃分為不同層次,例如暫存器、共享與全域,每個層次都有不同的特性,例如暫存器的特性為低延遲、記憶體容量小。全域層次則具有高延遲、提供大容量記憶體的特點。NVIDIA提供軟體介面,讓使用者可以充分利用不同層次記憶體,並依據該結構編寫程式最佳化解決方案。同樣地,SSD和HDD也可以從不同層次加以檢視,有鑑於如今具價值的資料數量如此龐大,單靠一套同質性儲存策略,實難發揮最佳效率。
為什麼這一切很重要?全數由高效能儲存裝置組成的儲存系統一般而言成本偏高,且超出企業需求。而全數由大容量裝置組成的儲存系統又可能效能偏低,達不到企業所需。這就是為何出現前述分層趨勢的原因:用最有效率的方式來平衡成本與效能需求。隨著更多技術問世(例如儲存級記憶體),企業最需要的莫過於能從各類資料儲存提取最大價值的架構。
給企業經理人的建議:如果沒有任何預算限制,所有資料中心裡都會是各種昂貴的儲存媒體,例如Intel的3DXPoint。遺憾的是,經濟現實並不允許此一作法,分層分級也因此勢在必行—熱資料留在高成本、高效能媒體,而較少存取的資料則放在經濟實惠的大容量媒體。幸好資料中心軟體越來越擅於分辨熱資料、冷資料,並據以進行遷移。如果企業的資料中心尚未因此採用異質性媒體,很可能造成企業的資料儲存效能低落或是儲存成本過高。
5.形成性AI讓資料更有用
不僅資料的創造呈現爆炸性成長,連有用的資料量也同步增加。即便已歸檔的資料也再次獲得重視,反映人工智慧/機器學習持續進步,讓使用者能夠從已歸檔的資料中挖掘出更豐富的資訊。企業經理人必須做好準備,儲存更巨量的資料來訓練模型,一方面用以挖掘關鍵資訊,另一方面則應用於資料歸檔,因為資料的使用年限可能會逐漸拉長。透過形成性AI,資料可望提供企業更多洞察。Gartner對形成性AI的定義如下:「能夠因應情況而動態變化的人工智慧。」IDC則稱形成性AI為「多種新興AI及相關技術的總稱,能夠因應不同情勢加以動態調整。」形成性AI之所以和前述分層趨勢有關,主要是因其仰賴彈性架構來對各種變化做出智慧反應。您可能在監控某個AI模型時,接收到訊號顯示模型有所偏離,這時您可以利用另一個模型在您的磁碟分層中找尋適當的訓練資料,並自動移至快閃記憶體,加速訓練進程。該快閃記憶體分層很可能本身也是一個物件儲存,因此跟物件儲存趨勢也存在密切關係。這帶來雙重優勢:速度—因為資料已經自動移至您的快速記憶體分層和成本—因為您能夠將資料以易於擷取的形式儲放在平價磁碟,直到需要使用該資料為止。
給企業經理人的建議:近來機器學習上的多項創新,讓AI備受期待的發展潛能如今終於有機會徹底發揮。這些機器學習技術對資料集的需求量與日俱增,以期從中汲取益發精確的洞見。由於難以預測未來機器學習究竟會帶來怎樣的洞察與技術精進,企業從現在起就必須盡所能儲存越多資料,以確保未來分析時能夠運用最優質的訓練資料。