10月8日上午消息,據(jù)國外媒體報(bào)道,Twitter改造了其番禺網(wǎng)頁設(shè)計(jì)搜索引擎的后臺(tái),提高了速度并且增加了索引帖子、處理查詢和提供搜索結(jié)果的容量,同時(shí)使Twitter搜索引擎穩(wěn)定和更適合增加的這些新功能。 據(jù)Twitter稱,在用大約6個(gè)月的時(shí)間研制這個(gè)新的后臺(tái)系統(tǒng)之后,Twitter最近幾個(gè)星期把自己的搜索引擎轉(zhuǎn)移到了一個(gè)新的平臺(tái)。 Twitter的搜索引擎在一個(gè)基于Summize的MySQL的系統(tǒng)上運(yùn)行。但是,這個(gè)系統(tǒng)的升級(jí)一直很困難。Summize是Twitter在2008年年中收購的一家公司。 負(fù)責(zé)這個(gè)項(xiàng)目的工程師團(tuán)隊(duì)決定使用不同的技術(shù)徹番禺做網(wǎng)站公司底改造這個(gè)搜索引擎,使用的技術(shù)包括開源軟件和用Java編寫的文本搜索引擎Lucene。 Twitter修改了Lucene的一些技術(shù),包括垃圾回收、查詢終止、郵件列表以及數(shù)據(jù)結(jié)構(gòu)和算法,保留了一個(gè)反向的基于索引的搜索引擎。這個(gè)搜索引擎進(jìn)行了升級(jí)并且擁有更好的性能。 Twitter每秒處理1.2萬個(gè)搜索查詢,每天處理超過10億個(gè)搜索查詢。Twitter網(wǎng)站的微博發(fā)表10秒鐘之后就會(huì)成為搜索索引的一部分。 Twitter官員Michael Busch在博客中稱,我們預(yù)計(jì)番禺網(wǎng)站設(shè)計(jì)我們僅僅使用了大約5%的后臺(tái)可用資源。這就意味著我們有很大的發(fā)展空間。我們新的索引程序比我們目前使用的程序每秒處理微博的速度提高了大約50倍。 雖然Twitter將其微博的索引提供給谷歌和微軟必應(yīng)等外部搜索引擎,但是,Twitter內(nèi)部的搜索引擎是其微博服務(wù)的關(guān)鍵組件。 為了最大限度提高微博庫的價(jià)值,Twitter必須擁有一個(gè)快速、全面和可伸網(wǎng)站建設(shè)縮的搜索引擎。Twitter大規(guī)模升級(jí)其搜索技術(shù)表明該公司已經(jīng)認(rèn)識(shí)到內(nèi)部搜索能力的重要性。(編譯/楊柳風(fēng)) |