對于中文網(wǎng)站來說,在百度獲得好的排名就是SEO工作成功的關(guān)鍵。百度的排序算法異常復(fù)雜,但是依據(jù)公開的文檔,大致可以歸類影響網(wǎng)頁排序的幾個重要因素。
1、頁面相關(guān)性
頁面相關(guān)性即用戶檢索的詞和網(wǎng)頁內(nèi)容的匹配程度,比如用戶搜索“睡眠面膜”,那么排在前面的頁面應(yīng)該都是和睡眠面膜相關(guān)的頁面,即搜索到的結(jié)果應(yīng)該是和關(guān)鍵詞密切相關(guān)的,越相關(guān)的頁面,在排序方面越會獲得更高的加分。如何評價一個頁面是否和搜索詞匯相關(guān),從算法上來說,有幾個重要的指標(biāo)。
·關(guān)鍵詞密度,即當(dāng)前該關(guān)鍵詞在頁面文字分詞結(jié)果中的比例。
·關(guān)鍵詞是否出現(xiàn)在重要的位置,如果關(guān)鍵詞出現(xiàn)在頁面的標(biāo)題、Meta(元素可提供相關(guān)頁面的元信息)、H1~H6等位置,就認(rèn)為越重要,越相關(guān)。
·關(guān)鍵詞是否獲得外部和內(nèi)部的投票,比如站內(nèi)、站外錨文本支持等,獲得的投票越多,就會越相關(guān)。
2、權(quán)威性
主要含義如下。
·權(quán)威性包括網(wǎng)站域名是否為政府專用的gov類,網(wǎng)站的所屬權(quán)是否為權(quán)威的公司或者部門。
·是否普遍受歡迎,包括網(wǎng)站的點擊率,即用戶在所有搜索結(jié)果里面點擊打開這個頁面的比例;用戶在網(wǎng)頁的訪問特性,比如網(wǎng)頁訪問時間、跳出時間等。正常來說,搜索引擎很難獲取到網(wǎng)站的用戶行為數(shù)據(jù),但是,目前大部分的網(wǎng)站依賴搜索引擎的網(wǎng)站統(tǒng)計來做流量統(tǒng)計和用戶行為分析,因此,搜索引擎以這些數(shù)據(jù)作為參考就很容易了。比如很多網(wǎng)站站長選擇使用百度統(tǒng)計進(jìn)行網(wǎng)站統(tǒng)計和分析,那么,百度通過借鑒百度統(tǒng)計的用戶行為數(shù)據(jù)進(jìn)行排序也不是一件很困難的事情了。
3、時效性
網(wǎng)頁內(nèi)容如果與信息相關(guān),那么內(nèi)容的時效性也是一個排序的依據(jù),因為從用戶角度來說,也是希望看到最新鮮的內(nèi)容。但是時效性和檢索詞的關(guān)系很大,不能全部套用。信息相關(guān)的網(wǎng)頁一般包括如下。
·新聞網(wǎng)站,各種門戶網(wǎng)站的新聞網(wǎng)頁,比如新浪新聞、搜狐新聞、網(wǎng)頁新聞等。
·即時信息互動網(wǎng)站,比如微博類網(wǎng)站。在搜索引擎顯示微博結(jié)果的時候,總是優(yōu)先展現(xiàn)最新的信息,甚至直接按照時間進(jìn)行倒排序。
4、準(zhǔn)確性
頁面內(nèi)容是否能夠滿足用戶檢索的需求,甚至滿足用戶的延伸需求等。滿足用戶的檢索需求即用戶打開搜索結(jié)果頁,里面的內(nèi)容正是用戶需要的。而延伸用戶的檢索需求,比如用戶搜索“SPF15防曬指數(shù)”,搜索結(jié)果頁打開一看,是一個關(guān)于SPF15防曬指數(shù)的介紹頁面,那么頁面就具有相關(guān)性。如果該頁面還有一些很實用的內(nèi)容,比如SPF15和SPF30的效果相差有多大,SPF的指數(shù)是如何定義的,對于用戶了解SPF來說,就非常有幫助,這類內(nèi)容就屬于滿足用戶的延伸需求的內(nèi)容。
搜索引擎在對搜索結(jié)果進(jìn)行排序的時候,會考慮以上重要的方面,但是整體來看,相關(guān)性是第一位的。因此,在對網(wǎng)站進(jìn)行SEO優(yōu)化時,一定不能脫離相關(guān)性這個基礎(chǔ)。在實際網(wǎng)站運營中,很多門戶網(wǎng)站會采用投機取巧的方法,利用熱詞來形成很多文章。比如家居類的網(wǎng)站,每天的新聞中會使用熱詞做標(biāo)題,甚至以一些熱點事件作為標(biāo)題,但是文章的主題內(nèi)容和熱詞沒有任何關(guān)系。從短期來看,因為門戶的權(quán)重比較大,這些文章的標(biāo)題會吸引來大量關(guān)注熱詞或熱點事件的訪客,但是因為主題內(nèi)容不相關(guān),用戶過來后會立刻離開,對用戶和搜索引擎來說都是一種欺騙,這種行為注定不能持久,最終導(dǎo)致整個新聞或者信息頻道,甚至是整個網(wǎng)站徹底被搜索引擎屏蔽。作為SEO人員,必須要意識到這種做法的風(fēng)險性極高,避免自己做此類事情,也需要嚴(yán)格監(jiān)督編輯人員不能做此類事情。
隨著搜索算法的優(yōu)化和互聯(lián)網(wǎng)內(nèi)容的豐富,以及網(wǎng)民的需求提升,為了能更加符合用戶的搜索期望,搜索引擎目前逐漸把地域、業(yè)務(wù)領(lǐng)域、時效性等因素作為排名的參考依據(jù),而不僅是參考網(wǎng)頁的信息。
另外,地域因素在排序中逐漸加大了比例,即在對關(guān)鍵詞排名的時候,會參考用戶所在地的IP歸屬,盡量返回和用戶目標(biāo)一致的網(wǎng)頁。比如一個用戶在北京搜索“旅游”一詞,會把“北京”這個地域當(dāng)作參考因素,和關(guān)鍵詞“旅游”放在一起作為參考,對網(wǎng)頁進(jìn)行過濾,因此,北京相關(guān)的旅游網(wǎng)頁會獲得更好的排名;如果在上海搜索“旅游”這個詞匯,在返回的結(jié)果中,很多是上海相關(guān)的旅游網(wǎng)頁,就不必奇怪了。
搜索引擎會通過機器學(xué)習(xí)等方法,對和地域有緊密聯(lián)系的領(lǐng)域的詞匯做專門管理,這類詞匯如旅游、天氣、交通、酒店、機票等。用戶在搜索這些領(lǐng)域的詞匯時,搜索引擎會把用戶IP所在地域和關(guān)鍵詞組合進(jìn)行查詢,返回更符合用戶期望的信息。當(dāng)然這里“地域”這個信息在組合條件中所在的權(quán)重,每個搜索引擎是不一樣的,這也是不可公開的。在移動端搜索中,地理位置的信息可以通過Meta進(jìn)行配置,通過定義省份、城市、經(jīng)緯度的方式進(jìn)行精準(zhǔn)定位。
時效性因素即用戶查詢某些領(lǐng)域的詞匯時,返回最接近的網(wǎng)頁數(shù)據(jù)。比如查詢“奧斯卡”這個詞匯,搜索引擎偏好顯示最近的奧斯卡信息的網(wǎng)頁。查詢“奧運會”等信息,情況也是如此。
在判斷時效性方面,可以基于不同的計算方法。比如通過獲悉網(wǎng)頁上的時間信息,或者通過分析前后頁面的時間信息,來估算對應(yīng)頁面的時間信息。
個性化因素即用戶查詢詞匯的時候,搜索引擎會依據(jù)用戶的搜索習(xí)慣、喜好等,自動返回一些和客戶喜好、習(xí)慣更相關(guān)的詞匯。搜索引擎之所以能做到這一點,是因為每個客戶在瀏覽網(wǎng)頁的時候,會從客戶端請求服務(wù)器,服務(wù)器會記錄用戶狀態(tài),并返回瀏覽器一小段文本信息,該小段文本信息就是Cookie(儲存在用戶本地終端上的數(shù)據(jù))信息。主流的瀏覽器比如IE和Firefox等都支持Cookie的機制,即用戶訪問哪些網(wǎng)站和網(wǎng)頁信息,實際在本地都做了記錄。搜索引擎在進(jìn)行結(jié)果推薦的時候,會調(diào)用Cookie的數(shù)據(jù)進(jìn)行參考,判斷用戶的偏好,在此基礎(chǔ)上,返回和用戶偏好最相關(guān)的搜索結(jié)果,從而展現(xiàn)給客戶的是更多個性化的內(nèi)容。舉個例子,某個SEO人員特別關(guān)注自己網(wǎng)站的某個關(guān)鍵詞排名,可能在谷歌里天天搜索同一個關(guān)鍵詞,然后點擊自己的網(wǎng)站??赡苡幸惶?,當(dāng)他再搜索這個關(guān)鍵詞的時候,搜索引擎自動把他的網(wǎng)頁放到了第一位。但是,另外一個SEO人員在同一個地區(qū),搜索同一個關(guān)鍵詞,上述網(wǎng)頁的排名沒有顯示在前10位中,這就是Cookie記錄的偏好結(jié)果的影響。目前,個性化因素已經(jīng)在搜索引|擎和眾多商業(yè)領(lǐng)域中使用,都是在努力滿足用戶的偏好需求。
其外,小說、游戲、影視、品牌等領(lǐng)域的搜索引擎都開始逐步設(shè)立偏好標(biāo)準(zhǔn)。比如搜索一本小說,會盡量返回小說網(wǎng)站的頁面,而搜索一部電視劇,會盡量返回視頻網(wǎng)站的頁面,這樣做的好處是能縮短大部分用戶的查詢距離,使用戶盡快點擊搜索結(jié)果頁,提升用戶體驗。
從SEO人員的角度來說,可以深入研究這些變化帶來的影響,利用這些偏好來做更多的SEO工作。