百度搜索引擎在衡量網(wǎng)頁質量時,會從以下三個維度綜合考慮給出一個質量打分。下面會一一介紹這些影響網(wǎng)頁質量判斷的維度特征:
? 內容質量
? 瀏覽體驗
? 可訪問性
一個訪問流暢,內容質量高且瀏覽體驗好的網(wǎng)頁具有較高的質量;反之,任何一個維度出現(xiàn)問題,都會影響網(wǎng)頁的整體質量。下面我們具體介紹下這三個維度。
網(wǎng)頁主體內容是網(wǎng)頁的價值所在,是滿足用戶需求的前提基礎。百度搜索引擎評價網(wǎng)頁內容質量主要看其主體內容的好壞,以及主體內容是否可以讓用戶滿意。 不同類型網(wǎng)頁的主體內容不同,百度搜索引擎判斷不同網(wǎng)頁的內容價值時,需要關注的點也有區(qū)別,如:
? 首頁:導航鏈接和推薦內容是否清晰、有效。
? 文章頁:能否提供清晰完整的內容,圖文并茂更佳。
? 商品頁:是否提供了完整真實的商品信息和有效的購買入口。
? 問答頁:是否提供了有參考價值的答案。
? 下載頁:是否提供下載入口,是否有權限限制,資源是否有效。
? 文檔頁:是否可供用戶閱讀,是否有權限限制。
? 搜索結果頁:搜索出來的結果是否與標題相關。
百度搜索引擎考量網(wǎng)頁內容質量的維度非常多,最為重要的是:成本;內容完整;信息真實有效以及安全。下面我們通過舉例來感受一下百度搜索引擎是如何對網(wǎng)頁的內容質量進行分類的,請站長對比自己站點的頁面,站在搜索引擎和用戶的角度為自己打分:
1、內容質量好:
百度搜索引擎認為內容質量好的網(wǎng)頁,花費了較多時間和精力編輯,傾注了編者的經(jīng)驗和專業(yè)知識;內容清晰、完整且豐富;資源有效且優(yōu)質;信息真實有效;安全無毒;不含任何作弊行為和意圖,對用戶有較強的正收益。對這部分網(wǎng)頁,百度搜索引擎會提高其展現(xiàn)在用戶面前的機率。例如:
? 專業(yè)醫(yī)療機構發(fā)布的內容豐富的醫(yī)療專題頁面;
? 資深工程師發(fā)布的完整解決某個技術問題的專業(yè)文章;
? 專業(yè)視頻網(wǎng)站上,播放清晰流暢的正版電影或影視全集頁面;
? 知名B2C網(wǎng)站上,一個完整有效的商品購買頁;
? 權威新聞站原創(chuàng)或經(jīng)過編輯整理的熱點新聞報道;
? 經(jīng)過網(wǎng)友認真編輯,內容豐富的詞條;
? 問答網(wǎng)站內,回答的內容可以完美解決提問者的問題。
實例參考:
示例 | 內容質量 | 說明 |
好 | 專業(yè)醫(yī)療網(wǎng)站發(fā)布的豐富醫(yī)療專題頁面 | |
好 | 資深工程師發(fā)布的完整解決某個技術問題的專業(yè)文章 | |
好 | 專業(yè)視頻網(wǎng)站上,播放清晰流暢的正版影視全集頁面 | |
好 | 京東的一個完整有效的商品購買頁 | |
好 | 權威新聞站原創(chuàng)的熱點新聞的報道 | |
好 | 經(jīng)過網(wǎng)友認真編輯,內容豐富的百科詞條 | |
好 | 百度知道上,完美解決用戶問題的問答頁 |
2、內容質量中:
內容質量中等的網(wǎng)頁往往能滿足用戶需求,但未花費較多時間和精力進行制作編輯,不能體現(xiàn)出編者的經(jīng)驗和專業(yè)知識;內容完整但并不豐富;資源有效但質量欠佳;信息雖真實有效但屬采集得來;安全無毒;不含作弊行為和意圖。在互聯(lián)網(wǎng)中,中等質量網(wǎng)頁其實是一個比較大的數(shù)量集合,種類面貌也繁雜多樣,百度搜索引擎在評價這類網(wǎng)頁時往往還要考慮其它非常多因素。在這里,我們僅部分舉例來讓各位感受一下:
? 論壇類網(wǎng)站里一個普通的帖子;
? 一個普通的問答網(wǎng)頁;
? 沒有進行任何編輯,直接轉載其它網(wǎng)站的新聞;
? 無版權信息的普通電影播放頁
? 采集知名小說網(wǎng)站的盜版小說頁。
實例參考:
示例 | 內容質量 | 說明 |
中 | 網(wǎng)易直接轉載了中國新聞網(wǎng)的一篇新聞。 | |
中 | 文庫上網(wǎng)友上傳的“國慶放假安排”新聞 | |
中 | 采集起點小說網(wǎng)的盜版小說站 | |
中 | 百度貼吧里一個普通的帖子 |
3、內容質量差:
百度搜索引擎認為主體內容信息量較少,或無有效信息、信息失效過期的都屬于內容質量差網(wǎng)頁,對用戶沒有什么實質性的幫助,應該減少其展現(xiàn)的機會。同時,如果一個網(wǎng)站內該類網(wǎng)頁的占比過大,也會影響百度搜索引擎對站點的評級,尤其是UGC網(wǎng)站、電商網(wǎng)站、黃頁網(wǎng)站要尤其重視對過期、失效網(wǎng)頁的管理。例如:
? 已下架的商品頁,或已過期的團購頁;
? 已過有效期的招聘、交易頁面;
? 資源已失效,如視頻已刪除、軟件下載后無法使用等。
4、沒有內容質量可言:
沒有內容質量可言的網(wǎng)頁指那些制作成本很低,粗制濫造;從別處采集來的內容未經(jīng)最起碼的編輯整理即放置線上;掛木馬等病毒;含有作弊行為或意圖;完全不能滿足用戶需求,甚至含有欺騙內容的網(wǎng)頁。例如:
? 內容空短,有很少量的內容,卻不能支撐頁面的主要意圖;
? 問答頁有問無答,或回答完全不能解決問題;
? 站內搜索結果頁,但沒有給出相關信息
除上述網(wǎng)頁外,欺騙用戶和搜索引擎的網(wǎng)頁在無內容質量可言集合里占很高比例。百度搜索引擎對作弊網(wǎng)頁的定義是:不以滿足用戶需求為目的,通過不正當手段欺騙用戶和搜索引擎從而獲利的網(wǎng)頁。目前互聯(lián)網(wǎng)上這部分網(wǎng)頁還屬少數(shù),但作弊網(wǎng)頁的價值是負向的,對用戶的傷害非常大,對這類網(wǎng)頁,搜索引擎持堅決打擊態(tài)度。
不同質量的網(wǎng)頁帶給用戶的瀏覽體驗會有很大差距,一個優(yōu)質的網(wǎng)頁給用戶的瀏覽體驗應該是正向的。用戶希望看到干凈、易閱讀的網(wǎng)頁,排版混亂、廣告過多會影響用戶對網(wǎng)頁主體內容的獲取。在百度搜索引擎網(wǎng)頁質量體系中,用戶對網(wǎng)頁主體內容的獲取成本與瀏覽體驗呈反比,即獲取成本越高,瀏覽體驗越低。面對內容質量相近的網(wǎng)頁,瀏覽體驗佳者更容易獲得更高的排位,而對于瀏覽體驗差的網(wǎng)頁,百度搜索引擎會視情況降低其展現(xiàn)的機率甚至拒絕收錄。
影響用戶瀏覽體驗好壞的因素很多,目前百度搜索引擎主要從內容排版、廣告影響兩方面對網(wǎng)頁進行考量:
內容排版:用戶進入網(wǎng)頁第一眼看到的就是內容排版,排版決定了用戶對網(wǎng)頁的第一印象,也決定了用戶對內容獲取的成本。
廣告影響:百度搜索引擎理解網(wǎng)站的生存發(fā)展需要資金支持,對網(wǎng)頁上放置正當廣告持支持態(tài)度。網(wǎng)頁應該以滿足用戶需求為主旨,最佳狀態(tài)即“主體內容與廣告一起滿足用戶需求,內容為主,廣告為輔”,而不應讓廣告成為網(wǎng)頁主體。
下面我們通過舉例來感受一下百度搜索引擎是如何對網(wǎng)頁的瀏覽體驗進行分類的,站長可以據(jù)此對比檢驗自己站點的瀏覽體驗如何:
1、瀏覽體驗好:
頁面布局合理,用戶獲取主體內容成本低,一般具有以下特征:
? 排版合理,版式美觀,易于閱讀和瀏覽;
? 用戶需要的內容占據(jù)網(wǎng)頁最重要位置;
? 能夠通過頁面標簽或頁面布局十分清楚地區(qū)分出哪些是廣告;
? 廣告不搶占主體內容位置,不阻礙用戶對主要內容的獲??;
實例參考:
示例 | 瀏覽體驗 | 說明 |
好 | 招聘、房產(chǎn)等網(wǎng)站首頁也有很多廣告,但都是招聘相關的,瀏覽體驗是ok的。 | |
好 | 文章頁,頁面布局合理,無廣告,排版好,結構合理 | |
好 | 游戲首頁,排版美觀,布局合理,無廣告,瀏覽體驗優(yōu) |
2、瀏覽體驗差:
頁面布局和廣告放置影響了用戶對主體內容的獲取,提高了用戶獲取信息的成本,令用戶反感。包括但不僅限于以下情況:
? 正文內容不換行或不分段,用戶閱讀困難;
? 字體和背景顏色相近,內容辨別困難;
? 頁面布局不合理,網(wǎng)頁首屏看不到任何有價值的主體內容;
? 廣告遮擋主體內容;或者在通用分辨率下,首屏都是廣告,看不到主體內容;
? 彈窗廣告過多;
? 影響閱讀的浮動廣告過多
? 點擊鏈接時,出現(xiàn)預期之外的彈窗;
? 廣告與內容混淆,不易區(qū)分;
用戶希望快速地從搜索引擎獲取到需要的信息,百度搜索引擎盡可能為用戶提供能一次性直接獲取所有信息的網(wǎng)頁結果。百度搜索引擎認為不能直接獲取到主體內容的網(wǎng)頁對用戶是不友好的,會視情況調整其展現(xiàn)機率。
百度搜索引擎會從正常打開、權限限制、有效性三方面判斷網(wǎng)頁的可訪問性,對于可以正常訪問的網(wǎng)頁,可以參與正常排序;對于有權限限制的網(wǎng)頁,再通過其它維度對其進行觀察;對于失效網(wǎng)頁,會降權其展現(xiàn)機制甚至從數(shù)據(jù)庫中刪除。
1、可正常訪問的網(wǎng)頁
無權限限制,能直接訪問所有主體內容的網(wǎng)頁。
2、有權限限制的網(wǎng)頁
此類網(wǎng)頁分為兩種:打開權限和資源獲取權限
1)打開權限:指打開網(wǎng)頁都需要登錄權限,沒有權限完全無法看到具體內容,普通用戶無法獲取或獲取成本很高,百度搜索引擎會降低其展現(xiàn)機率。不包括以登錄為主要功能的網(wǎng)頁。
2)資源獲取權限:指獲取網(wǎng)頁主要內容,如文檔、軟件、視頻等,需要權限或者需要安裝插件才能獲得完整內容。此時會分三種情況:
? 提供優(yōu)質、正版內容的網(wǎng)站,由于內容建設成本很高,盡管查看全文或下載時需要權限或安裝插件,但屬于用戶預期之內,百度搜索引擎也不認為權限行為對用戶造成傷害,給予與正??稍L問頁面相同的對待。
? 對于一些非優(yōu)質、非正版的資源,來自于用戶轉載甚至機器采集,本身成本較低,內容也不獨特,用戶獲取資源還有權限限制——需要用戶注冊登錄或者付費查看,百度搜索引擎會根據(jù)具體情況決定是否調整其展現(xiàn)。
? 還有一些視頻、下載資源頁,也許自身資源質量并不差,但需要安裝非常冷門的插件才能正常訪問,比如要求安裝“xx大片播放器”,百度搜索引擎會懷疑其有惡意傾向。
實例參考:
示例 | 可訪問性 | 說明 |
好 | CNKI上的一篇論文,收費才能下載,但有版權,瀏覽體驗好 | |
好 | 優(yōu)酷上一部新電影,需要付費才能觀看,瀏覽體驗好。 | |
中 | 內容是copy來,但是需要登錄才能看更多 | |
差 | 入黨申請書,本身就是轉載的,網(wǎng)上到處都是,但這個頁面仍然要求收費才能下載。 |
3、失效網(wǎng)頁
往往指死鏈和主體資源失效的網(wǎng)頁。百度搜索引擎認為這部分網(wǎng)頁無法提供有價值信息,如果站點中此類網(wǎng)頁過多,也會影響百度搜索引擎對其的收錄和評級。建議站長對此類網(wǎng)頁進行相應設置,并及時登錄百度站長平臺,使用死鏈提交工具告知百度搜索引擎。
失效網(wǎng)頁包括但不僅限于:
? 404、403、503等網(wǎng)頁;
? 程序代碼報錯網(wǎng)頁;
? 打開后提示內容被刪除,或因內容已不存在跳轉到首頁的網(wǎng)頁;
? 被刪除內容的論壇帖子,被刪除的視頻頁面(多出現(xiàn)在UGC站點)
來源:《百度搜索引擎網(wǎng)頁質量白皮書》
掃一掃在手機上閱讀本文章