新聞中心
SEO基礎(chǔ)教程:搜索引擎預(yù)處理規(guī)則
作者 / 無(wú)憂主機(jī) 時(shí)間 2011-11-25 07:26:39
預(yù)處理中必不可少的一個(gè)環(huán)節(jié)是去停止詞,不管是中文還是英文中總是有一些詞在文章中必須出現(xiàn)但是又沒有意義的存在,比如中文文章中經(jīng)常出現(xiàn)的“的”、“地”、“得”這些助詞,又或者一些感嘆詞比如嘿、哈、哇,還有一些副詞和介詞的比如,從而、以、卻。英文文章中經(jīng)常出現(xiàn)的這類詞有 the、a、an、to、of這樣的詞統(tǒng)一被我們稱之為停止詞,搜索引擎在爬行文章的時(shí)候第一步就是去掉這些詞,獲得文章中德精髓。一個(gè)是減少數(shù)據(jù)存儲(chǔ),另外可以讓數(shù)據(jù)更加精準(zhǔn)。處理完了這些進(jìn)行的下一步就是消除噪聲,我們大部分網(wǎng)站中總有那么些無(wú)用的內(nèi)容,比如版權(quán)聲明,導(dǎo)航,廣告之類的內(nèi)容這類對(duì)用戶搜索起來(lái)沒有任何的意義并且只能干擾網(wǎng)站主題內(nèi)容的提取,在經(jīng)歷消除噪聲后剩下的就是頁(yè)面內(nèi)的真正內(nèi)容。 純Linux環(huán)境下高端免備案[香港獨(dú)立IP地址]?php空間,僅僅只需199元一年起。商務(wù)中國(guó)域名核心代理直銷50元注冊(cè)國(guó)際頂級(jí)域名
本文地址:http://www.gle-technology.com/seo/4625.html