北京網(wǎng)站建設(shè)多年網(wǎng)站建設(shè)經(jīng)驗(yàn),依托強(qiáng)大的服務(wù)優(yōu)勢(shì),為您提供專業(yè)的北京網(wǎng)站建設(shè)服務(wù)
作者:鵬飛網(wǎng)絡(luò) 時(shí)間:2009-4-12 分類:北京網(wǎng)站建設(shè)
HillTop算法原理與排名關(guān)系
hilltop算法及其原理,這個(gè)東西比較早了,況且google對(duì)他的使用已經(jīng)有些年頭了,HillTop算法: HillTop同樣是一項(xiàng)搜索引擎結(jié)果排序的,是Google的一個(gè)工程師Bharat在2001年獲得的。Google的排序規(guī)則經(jīng)常在變化,但變化比較大的一次也就是基于HillTop算法進(jìn)行了優(yōu)化。HillTop究竟原理如何,值得Google如此青睞?
Google利用HillTop算法去定義相關(guān)網(wǎng)站:一個(gè)網(wǎng)站與另一個(gè)網(wǎng)站的相關(guān)性,實(shí)際上,HillTop算法在Google也中作為一個(gè)識(shí)別跨站點(diǎn)的鏈接交換干擾(spam)與識(shí)別相似鏈接的技術(shù)。HillTop算法要求:如果有兩個(gè)以上相關(guān)主題的網(wǎng)站鏈接到你的網(wǎng)站,那么你的網(wǎng)站在搜索結(jié)果中出現(xiàn)的機(jī)會(huì)會(huì)更大,如果HillTop算法不查找到最少兩個(gè)相關(guān)性的網(wǎng)站,那么搜索返回的結(jié)果的機(jī)會(huì)絕對(duì)是0。
運(yùn)行Hilltop算法需要大量的計(jì)算機(jī)處理能力,因而我們猜測(cè)Hilltop算法(可能)是每個(gè)月對(duì)收集到的全部高頻率(熱門)查詢?cè)~運(yùn)行一次批處理。由于Google算法將40%重心轉(zhuǎn)移至Hilltop,且Hilltop算法運(yùn)行后的得分會(huì)保持至下一次批處理,因而在此期間搜索結(jié)果很可能不會(huì)有太大變動(dòng)。此外,由于“專家”網(wǎng)頁(yè)的投票方式往往不會(huì)有太大變動(dòng),因而在某段時(shí)期內(nèi)我們可能只會(huì)看到一些“陳舊”的搜索結(jié)果。這一點(diǎn)悖離了搜索引擎的“提供最新、比較好”的查詢結(jié)果的宗旨。除了“權(quán)威網(wǎng)頁(yè)”,用戶同樣希望看到一些新鮮的內(nèi)容,然而對(duì)“新”Google而言,用戶只有寄望于那些查詢頻率不太高,從而未被納入Hilltop系統(tǒng)的查詢?cè)~語(yǔ)上看到“新鮮”的查詢結(jié)果了。
與PageRank結(jié)合HillTop算法確定網(wǎng)頁(yè)與搜索關(guān)鍵詞的匹配程度的基本排序過(guò)程取代了過(guò)分依靠PageRank的值去尋找那些權(quán)威頁(yè)面的方法。這對(duì)于兩個(gè)具有同樣主題而且PR相近的網(wǎng)頁(yè)排序過(guò)程中:HillTop算法就顯得非常的重要了。
之前我對(duì)hilltop的算法并不了解,按我們平時(shí)說(shuō)的通俗講法為糊里糊涂的做來(lái)做去,對(duì)網(wǎng)頁(yè)的相關(guān)性并不是太注意,即使是友情鏈接只是考慮對(duì)方PR,而很少在意對(duì)方是否同自己的頁(yè)面相關(guān)度如何!這次學(xué)習(xí)了!希望大家也多了解一下hilltop!