談到所有的存儲(chǔ)功能,除了歸檔數(shù)據(jù)存儲(chǔ)系統(tǒng)?,F(xiàn)在讓我們來(lái)看看供應(yīng)商如何將這些功能作為解決方案展示給IT經(jīng)理,并將之置于數(shù)據(jù)需求之列。
我們上次沒(méi)有講到的系統(tǒng)之間的一個(gè)關(guān)鍵差異是效率。大部分企業(yè)數(shù)據(jù)庫(kù)的數(shù)據(jù)流量在增長(zhǎng),卻缺乏控制,甚至無(wú)法控制,而資金、電量和數(shù)據(jù)中心空間都是有限的資源,因此數(shù)據(jù)庫(kù)對(duì)這些資源的利用率必須提高。
供應(yīng)商采用多種方式來(lái)提高其數(shù)據(jù)歸檔解決方案的效率。數(shù)據(jù)縮減技術(shù)如壓縮、單一實(shí)例存儲(chǔ)(singleinstancestorage)和大部分功能強(qiáng)大的sub-file重復(fù)數(shù)據(jù)刪除技術(shù),這使得供應(yīng)商可將30lbs的數(shù)據(jù)裝入10lb的數(shù)據(jù)歸檔。在不使用Spinning disk時(shí),將其關(guān)閉,無(wú)論供應(yīng)商將其稱(chēng)為MAID(Copan,Nexsan)或是HDS,其可將1TB驅(qū)動(dòng)器的能源消耗從7.5W減少至不到1W.
但即使這些驅(qū)動(dòng)器都停止運(yùn)行,MAID系統(tǒng)仍要消耗大于等于其正常運(yùn)行時(shí)30%的電量,因?yàn)樵诘拓?fù)載時(shí),電力供給效率變低。處理器在處于空轉(zhuǎn)狀態(tài)時(shí)仍有電力消耗,而空轉(zhuǎn)存儲(chǔ)器與一個(gè)采用最新級(jí)別EnergyStar的空轉(zhuǎn)服務(wù)器處理器(消耗電量為55W)相比,也好不到哪去。
數(shù)據(jù)歸檔存儲(chǔ)的最簡(jiǎn)系統(tǒng),我稱(chēng)之為上鎖的NAS(lockedNAS)。供應(yīng)商包括NetApp和Sun公司已經(jīng)擴(kuò)展了其文件系統(tǒng)和NAS操作系統(tǒng)以將保持執(zhí)行力加進(jìn)來(lái)。他們是仿效了NetApp公司對(duì)SnapLock的命名方式,將最新改進(jìn)技術(shù)的日期加到設(shè)備壽命的末尾,打上“只讀”的旗號(hào)。這一系統(tǒng)將在壽命期結(jié)束時(shí)對(duì)只讀部分進(jìn)行重設(shè)。
Locked NAS是一般系統(tǒng),但是缺乏上次我所提到的一些其他功能。
而NetApp文件編檔員核查每個(gè)有眾多雜亂信息的數(shù)據(jù)塊的完整性,這并非在后臺(tái)運(yùn)作,在發(fā)現(xiàn)問(wèn)題時(shí)也無(wú)法從遠(yuǎn)程獲取一份已損壞的本地?cái)?shù)據(jù)塊的完整版本??蓽y(cè)量性和長(zhǎng)期擴(kuò)展是問(wèn)題所在,因?yàn)樵黾域?qū)動(dòng)器以及每5—7年進(jìn)行一次數(shù)據(jù)轉(zhuǎn)移(因?yàn)槟闫髽I(yè)的供應(yīng)商或許將不再支持你的企業(yè)系統(tǒng))并不是解決問(wèn)題的好方法。
基于磁盤(pán)的數(shù)據(jù)存儲(chǔ)歸檔這一市場(chǎng)領(lǐng)域,另一競(jìng)爭(zhēng)者是ContentAddressableStorage,采用每個(gè)存儲(chǔ)目標(biāo)(文件,email信息等)的hash作為存儲(chǔ)目標(biāo)(而非文件位置)的重要標(biāo)識(shí)符——同NAS系統(tǒng)。與通常思維不同,CAS系統(tǒng)不采用完整的文本索引作為其選址方案,而僅選用存儲(chǔ)目標(biāo)的hash.事實(shí)上,大部分CAS系統(tǒng),包括EMC公司的Centera、Nexsan公司的Assurion和Caringo公司的CAStor,都未給其存儲(chǔ)內(nèi)容編制索引。
他們?cè)谄髽I(yè)內(nèi)部實(shí)施了單一實(shí)例存儲(chǔ)(例如相同文件的多次拷貝將導(dǎo)致相同的冗余數(shù)據(jù)),也檢查了filehash,以整合后臺(tái)數(shù)據(jù)。除了大部分文件系統(tǒng)支持的名稱(chēng)、所有者以及時(shí)間戳,大多數(shù)CAS系統(tǒng)也可存儲(chǔ)擴(kuò)展元數(shù)據(jù)。結(jié)果是,大多數(shù)有復(fù)雜的應(yīng)用程序編程接口被用于文件存儲(chǔ)和恢復(fù),這就要求數(shù)據(jù)歸檔軟件供應(yīng)商寫(xiě)入并測(cè)試界面。SNIA有標(biāo)準(zhǔn)的XMLAPI——被稱(chēng)為XAM,將在一年后首先出現(xiàn)在CAS以及其他固定內(nèi)容存儲(chǔ)系統(tǒng)上。
CAS供應(yīng)商很重視擴(kuò)展元數(shù)據(jù)。ILM(當(dāng)前僅僅是個(gè)構(gòu)想,尚未有產(chǎn)品)的數(shù)據(jù)分類(lèi)功能、e-discovery功能,及類(lèi)似功能都需要除名稱(chēng)和日期外的其他數(shù)據(jù),以進(jìn)行決策。我存有疑問(wèn)的是:需要存儲(chǔ)一個(gè)有API的特殊文件系統(tǒng)。數(shù)據(jù)歸檔軟件或者內(nèi)容管理系統(tǒng)僅能夠?qū)⒃獢?shù)據(jù)和所有重要的文本索引完整地放入獨(dú)立于文件系統(tǒng)的數(shù)據(jù)庫(kù)。
一些供應(yīng)商已經(jīng)建造了類(lèi)似NAS的設(shè)備,采用hash確保完整性及識(shí)別數(shù)據(jù)的唯一標(biāo)識(shí),而不將其作為目標(biāo)數(shù)據(jù)的主要地址。類(lèi)似DataDomain公司的設(shè)備和NEC公司的Hydrastor,都被作為備份目標(biāo),但從其特征看,與數(shù)據(jù)歸檔設(shè)備的水平差不多。DataDomain的設(shè)備可進(jìn)行數(shù)據(jù)保存和去除,這與CAS的功能相同。Permabit公司的EnterpriseArchive采用相似的hash來(lái)協(xié)助管理NAS數(shù)據(jù)。
很多此類(lèi)系統(tǒng)采用RAIN(獨(dú)立結(jié)點(diǎn)的冗余陣列)結(jié)構(gòu),這樣一個(gè)有1u到2u服務(wù)器及內(nèi)置存儲(chǔ)器的群組或網(wǎng)格支持和管理分布在陣列中的數(shù)據(jù)。某些系統(tǒng)采用吸收/修復(fù)結(jié)點(diǎn),這些節(jié)點(diǎn)可管理hash數(shù)據(jù),并接收數(shù)據(jù),同時(shí)存儲(chǔ)支持?jǐn)?shù)據(jù)結(jié)點(diǎn)。有些系統(tǒng)同時(shí)具有上述兩方面功能。
如果得以完整實(shí)施,RAIN模式將使100個(gè)結(jié)點(diǎn)獲得可測(cè)量性,新結(jié)點(diǎn)也可獲得可測(cè)量性,處理器的速度更快,磁盤(pán)容量更大,且都將增加一個(gè)陣列,曾經(jīng)放置在舊的慢速結(jié)點(diǎn)或出現(xiàn)問(wèn)題結(jié)點(diǎn)上的數(shù)據(jù)都將被重新安置,接著舊結(jié)點(diǎn)都將被少量點(diǎn)擊或命令取代。然而,大部分RAIN系統(tǒng)有一個(gè)相關(guān)的高速處理器,這會(huì)導(dǎo)致電力消耗的增加,同時(shí)可能會(huì)導(dǎo)致訪(fǎng)問(wèn)次數(shù)極少的大型數(shù)據(jù)歸檔消耗過(guò)多。