熱點(diǎn)聚集
今天我們說來說搜索引擎的排序算法的建站方向,下面一起來了解下吧。
搜索引擎在頁面爬行,正文內(nèi)容提取,分詞建立倒排索引以后,將對(duì)檢索關(guān)鍵字進(jìn)行分詞,并提取出詞性為名詞,字符串等比較重要的詞到分詞索引庫取交集,即會(huì)得到一個(gè)包含具備基本相關(guān)度的頁面文件集合,之后將會(huì)進(jìn)入頁面排序部分。
可以說在頁面排序部分,有兩個(gè)部分是特別重要的,一個(gè)是頁面在搜索引擎里面的權(quán)重分?jǐn)?shù),還有一個(gè)是重要詞性的分詞出現(xiàn)在頁面的位置(標(biāo)題,有效正文的最開始區(qū)域等),這兩個(gè)部分的分?jǐn)?shù)基本上決定了大體的排名位置,其中頁面的權(quán)重分?jǐn)?shù)所占的比例會(huì)更多(偏向于認(rèn)為是最大,并且比其他因素都大很多),檢索詞的其他詞性如形容詞,介詞等分詞的完整匹配出現(xiàn)會(huì)獲得一小部分的加分。
而頁面的權(quán)重分?jǐn)?shù)在不同的搜索引擎傾向會(huì)有明顯的不同,總體來說,都和鏈接關(guān)系密切相關(guān),鏈接關(guān)系分為相關(guān)性有效鏈接(導(dǎo)出鏈接的網(wǎng)站內(nèi)容,錨文本,目標(biāo)網(wǎng)站高度相關(guān))和高信任度鏈接(來自大網(wǎng)站,gov,edu等高PR值網(wǎng)站),這兩種鏈接具體可以參考Hilltop算法和Trustrank算法,其中Hilltop算法想法非常有趣,在該算法的一個(gè)專利版本里面提到了對(duì)最初的搜索結(jié)果頁面集合再次進(jìn)行鏈接關(guān)系相關(guān)性計(jì)算,以進(jìn)一步精確在該檢索詞范圍權(quán)重最高的頁面。
頁面權(quán)重分?jǐn)?shù)還會(huì)涉及到域名的建站時(shí)間因素(這里我認(rèn)為不僅僅是因?yàn)殒溄哟嬖诘臅r(shí)間因素),在百度的算法里,主域名的權(quán)重對(duì)子域名和頁面的權(quán)重影響也會(huì)比谷歌大很多。
在這些步驟完成后,會(huì)進(jìn)入最后一個(gè)反作弊模塊,處理掉那些作弊積分超過一定程度的頁面以及在沙盒里的頁面,然后得到最終的排序結(jié)果。
在考慮這個(gè)搜索引擎排序算法的時(shí)候,基本上就可以確定大部分的頁面是沒有機(jī)會(huì)在搜索引擎里面獲得展出的,這是因?yàn)闄?quán)重在搜索引擎的算法里占有高度優(yōu)先級(jí)的原因。
好的,今天就說到這里了,希望對(duì)大家有幫助哦
上一篇:網(wǎng)絡(luò)營(yíng)銷推廣網(wǎng)站做好后轉(zhuǎn)化率低的原因是什么
下一篇:網(wǎng)絡(luò)營(yíng)銷--新手在SEO操作中常見的誤區(qū)
標(biāo)題:網(wǎng)絡(luò)推廣--搜索引擎的排序算法的建站方向? ??
地址:http://www.fefjd.com/a/news/xw/236.html
注明“來源:文芳閣”的所有作品,版權(quán)均屬于文芳閣軟文推廣平臺(tái),未經(jīng)本網(wǎng)授權(quán)不得轉(zhuǎn)載、摘編或利用其它方式使用上述作品,如有對(duì)內(nèi)有異議請(qǐng)及時(shí)聯(lián)系btr2030@163.com,本人將予以刪除。