搜索引擎優(yōu)化SEO規(guī)范
搜索引擎簡介和SEO基礎
搜索引擎及其用戶價值
搜索引擎,是對互聯(lián)網(wǎng)的數(shù)據(jù)信息進行收集、整理,并提供檢索查詢服務的系統(tǒng)。搜索引擎擅長理解用戶搜索需求、對海量數(shù)據(jù)抓取、信息甄別和打分、快速查詢等工作。
搜索引擎根據(jù)用戶的檢索查詢要求,對數(shù)據(jù)信息進行打分排序,并按照順序輸出呈現(xiàn),幫助用戶方便、快速、準確、全面地找到所需信息,這是搜索引擎最重要的用戶價值。
[提示]一切SEO工作,都應以遵循搜索引擎工作原理和用戶價值為前提。
白帽SEO和黑帽SEO
白帽SEO,指通過合理優(yōu)化網(wǎng)站,提升用戶體驗,與搜索引擎良好交互,真實反映網(wǎng)站質量和權威性的搜索引擎優(yōu)化方法。
黑帽SEO,以搜索引擎禁止的方法影響搜索引擎排序(作弊),與用戶價值和搜索體驗相背離,以短期利益為主要目標的搜索引擎優(yōu)化方法。搜索引擎會維護互聯(lián)網(wǎng)網(wǎng)站的公正排序,給用戶提供正確合理的搜索結果,而黑帽SEO的做法與此相違背。
搜索引擎在不斷通過技術革新、策略優(yōu)化來識別作弊行為。任何利用搜索引擎的策略缺陷漏洞,利用惡意手段獲取與網(wǎng)頁質量不符的排名,引起用搜索結果質量和用戶搜索體驗下降的行為都可能被搜索引擎識別為作弊行為。對待作弊行為,輕則被搜索引擎剝奪作弊權重,重則可能整個網(wǎng)站被搜索引擎拒絕收錄。
搜索引擎工作流程圖
[提示]對外,面向用戶和整個互聯(lián)網(wǎng)內容;對內,分為抓取、索引、檢索幾個重要模塊。
搜索引擎爬蟲
搜索引擎的爬蟲程序(也叫Spider、蜘蛛、爬蟲機器人),是搜索引擎收集信息、數(shù)據(jù)的工具。爬蟲程序不斷發(fā)現(xiàn)和下載互聯(lián)網(wǎng)網(wǎng)頁,這個過程是互聯(lián)網(wǎng)網(wǎng)頁進入搜索引擎內部必須經(jīng)歷的一關。
爬蟲程序擅長:分配下載資源,海量并發(fā)下載,讀取文字(特別是網(wǎng)頁文本),分析站點地圖并依此指引抓取頁面。相反爬蟲程序不擅長:讀取圖片、flash、JS、Ajax、frame,深層次、持續(xù)性抓取,讀取有權限控制的頁面,發(fā)現(xiàn)孤島頁面。
針對爬蟲程序的SEO工作應該根據(jù)其特點針對性進行。
[提示]搜索引擎爬行軌跡示意圖
搜索結果排序
搜索引擎通過理解用戶搜索詞、對數(shù)據(jù)進行檢索,可以得到諸多可能的搜索結果。對這些結果的排序要靠成百上千的相關性策略實現(xiàn)。
相關性排序的目的是將結果按照對用戶價值的高低排列,整個排序過程會參考網(wǎng)站、頁面的相關度、質量、時新性、權威性等諸多因素綜合考察。
SEO工作很大一部分跟搜索引擎相關性策略有關,簡單來講即通過SEO來告訴搜索引擎:哪些頁面更有價值,哪些頁面更搜索詞更相關,而應該被排序到更靠前的位置。
網(wǎng)站建立
域名注冊
域名是網(wǎng)站的重要品牌印象。域名注冊時應選擇簡單、易記、方便輸入、貼近網(wǎng)站名稱、能反映網(wǎng)站內容的域名。如fanli.qq.com、www.paipai.com。
域名一旦選定,不應隨意變更;同一網(wǎng)站擁有多個域名應確定主要域名,并設置其他域名向主要域名跳轉。
服務部署和網(wǎng)站上線
網(wǎng)站需要部署上線才能被用戶訪問。
租用/購買安全可靠、高速穩(wěn)定的服務器部署網(wǎng)站,是用戶訪問體驗的有效保障,同時會影響搜索引擎爬蟲的爬取。
網(wǎng)站部署上線并進行域名解析后,即面向用戶開發(fā)訪問,同時也意味著向搜索引擎爬蟲開放。
讓搜索引擎發(fā)現(xiàn)網(wǎng)站
新建立的網(wǎng)站是互聯(lián)網(wǎng)中的孤島,搜索引擎也很難發(fā)現(xiàn)和收錄它。在網(wǎng)站建立之初,可以將網(wǎng)站推薦給搜索引擎或者引導爬取收錄。
向搜索引擎提交網(wǎng)站域名或入口。如向SOSO的提交新網(wǎng)站,http://www.soso.com/help/usb/urlsubmit.shtml;
建立外鏈,如創(chuàng)建友情鏈接、向導航網(wǎng)站申請收錄等;
網(wǎng)站建立之初可重點經(jīng)營內容列表頁,在不影響用戶體驗的前提下,方便搜索引擎爬蟲一次發(fā)現(xiàn)更多鏈接。
內容建設
樹型扁平網(wǎng)狀結構
層級分明的樹型扁平網(wǎng)狀結構是較理想的網(wǎng)站部署結構,每個頁面與其父子頁面有鏈接關聯(lián),可以幫助用戶快速定位到感興趣的頻道、正文,也有利于搜索引擎理解網(wǎng)站結構層次和更好的爬取內容。
明確區(qū)分出,網(wǎng)站首頁、列表頁/索引頁/頻道頁、內容頁,根據(jù)各個頁面所在層級用鏈接相連,無孤島頁面;
層級、各層級分支內容不要過多,便于搜索引擎爬蟲爬取;
內容和質量相似的頁面組織在同一層級/目錄中,便于搜索引擎進行聚合挖掘;
越重要的內容,越應放置于高層級位置,或在高層級頁面中有鏈接直接可達;
在頁面中建立導航鏈接、面包屑,便于用戶和爬蟲理解網(wǎng)站結構和在不同層級內容間跳轉;
站點中新的內容應該盡量在深度較淺的列表頁或首頁發(fā)布入口,便于被搜索引擎爬蟲快速發(fā)現(xiàn)。
頁面標題
頁面標題是頁面內容的重要標識,準確簡潔的標題有助于用戶快速識別頁面內容。頁面標題會被搜索引擎展現(xiàn)在搜索結果列表中,是用戶通過搜索進入網(wǎng)站頁面的重要入口。
標題內容在頁面代碼中被
每個頁面都應該擁有標題內容,避免不寫標題,或無意義標題(如“無標題文檔”、“網(wǎng)站建設中”);
避免不同頁面使用相同標題(甚至全站公用相同標題);
不在標題內容中堆砌關鍵詞,避免影響可讀性和被判作弊;
“標題黨”、“文不對題”對用戶搜索體驗和搜索引擎收錄排序均有副作用,應堅決杜絕。
Meta信息
Meta信息中,keywords和description分別以關鍵詞和概括摘要兩種方式描述頁面內容,會被搜索引擎特別關注。
keywords部分應填入最能表現(xiàn)頁面內容的幾個關鍵詞,詞與詞之間以半角逗號間隔開;
description部分應填入一段介紹頁面內容的文字,這段文字有可能被搜索引擎選取作為結果摘要。網(wǎng)站首頁、索引頁、頻道入口等無大篇幅頁面正文的頁面,應該盡可能提供description信息。
keywords和description信息缺失不會對排序權重產(chǎn)生直接影響;在keywords和description信息中堆砌關鍵詞作弊可能受到搜索引擎懲罰。
鏈接
制定規(guī)范統(tǒng)一、簡潔、可讀的url,有利于搜索引擎的收錄和排序,也會方便用戶識別頁面內容,記錄和輸入鏈接。
每個頁面都應擁有其獨一無二的正常態(tài)url:
網(wǎng)站內統(tǒng)一使用正常url,不出現(xiàn)異常url;
指向同一頁面異常url,應跳統(tǒng)一跳轉到正常url上;
必須帶有參數(shù)的url需要精簡參數(shù)個數(shù)和內容,對頁面功能/展現(xiàn)無作用(如統(tǒng)計參數(shù))的應盡量去除。
鏈接結構設計建議:
url結構的設計應同時考慮用戶和搜索引擎的需求,方便用戶識別、記憶,并利于搜索引擎爬取和展現(xiàn);
url應盡量短。較短的url會在搜索結果頁完全展現(xiàn),方便用戶通過讀取其以了解頁面內容,也易于記憶和傳播。搜索引擎本身不會對url進行限制,排序跟url長度無關;
url目錄層級越少越好。層級過多的url設計可能對搜索引擎的爬取形成障礙,使得收錄變少或不收錄;
url中目錄名、文件名應具有描述性,不使用無意義的名稱;
url中盡量只使用小寫字母或數(shù)字,特別注意不要使用特殊字符,如“.”“,”“;”等;
去除url中不必要參數(shù)和靜態(tài)化。無論動態(tài)或靜態(tài)url ,搜索引擎均可正常爬取和檢索,但建議盡量精簡去除url中不必要的參數(shù),特別是與頁面功能/展現(xiàn)無關的參數(shù)。
錨文本設計建議
鏈接應選擇文字作為鏈接描述,即錨文本,盡量少使用圖片作為鏈接內容,必須使用圖片時,應同時使用alt標記補充文字描述,不要用flash、js替代文本鏈接(特別是重要入口);
錨文本應簡潔精煉,明確描述頁面內容;不要在錨文本里編寫與頁面內容無關的文字,更不要堆砌關鍵詞或者“標題黨”;
非必要的情況下,不要使用url本身作為錨文本。
鏈接設計GoodCase
http://finance.qq.com/stock,http://t.qq.com/liuxiang,子域名、目錄描述了頁面主題或內容;
http://finance.qq.com/a/20110317/005789.htm,新聞頁面目錄標識了發(fā)布日期;
鏈接設計BadCase
鏈接url為js生成,搜索引擎無法爬取到鏈接指向頁面。
http://7.sixjoy.com/webplat/info/news_version3/87/97/98/99/m51/201103/2763.shtml,鏈接陷阱/黑洞,這類url目錄構造對用戶和搜索引擎均無意義,搜索引擎可能不會爬取或者不索引這類url。
錨文本內容無意義。類似“更多”“返回”的文本對頁面內容的描述沒有貢獻,不建議使用。
首頁鏈接全部在flash內部,無法獲取更多站內鏈接,同時結果頁摘要顯相關較差。
全站頁面標題全部相同,無法體現(xiàn)頁面內容,在搜索結果和瀏覽器中均不易讓用戶識別,同時搜索引擎無法通過標題了解頁面內容;
頁面內容和服務
提供高質量的網(wǎng)站內容和服務是網(wǎng)站的立足之本,同時也是影響搜索引擎對網(wǎng)站內容評價的重要因素和指標。
提供圍繞網(wǎng)站主題或頁面主題的內容或數(shù)據(jù),自然、美觀的書寫頁面內容,滿足用戶的閱讀需求,這是對用戶最有價值的服務:
給用戶提供便于閱讀的頁面。頁面布局合理,突出展現(xiàn)重點內容,內容間有主次、段落,避免一大堆文字的粗暴羅列;
在頁面中放置面包屑導航。面包屑對用戶辨識頁面作為位置、層級有幫助,還能快速在不同頻道間切換。SOSO音樂/SOSO問問/騰訊網(wǎng)新聞頻道的面包屑導航:
提供與眾不同的原創(chuàng)內容或服務,避免抄襲內容或重復發(fā)布相似、相同內容;
與主題不相關或弱關性的內容,如廣告、站內推廣鏈接等,應放置于頁面次要內容,并且不占用過多篇幅;
不要有拼寫錯誤或錯別字。
同時,頁面內容建設也照顧搜索引擎讀取頁面的“感受”:
頁面正文用文本書寫,不要用圖片、flash代替,或用ajax生成;
站內導航和面包屑易于搜索引擎爬取頁面、獲取錨文本和分析鏈接權重;
使用圖片作為內容時,為圖片添加alt信息,圖片文件使用簡潔直白的命名(類似給頁面的命名);
不要使用iframe構造頁面。
robots.txt和Sitemap
robots.txt和sitemap是站長和搜索引擎交流的工具,為搜索引擎的爬取、收錄、排序行為提供參考。robots.txt和sitemap均不涉及對用戶體驗的直接影響。
robots.txt:
robots.txt文件,需要準確命名為”robots.txt”(文件名小寫,擴展名為txt,),放置于網(wǎng)站域名的根目錄下,能被正常訪問;
可以使用robots.txt限制搜索引擎爬蟲訪問某些頁面、目錄或者整合網(wǎng)站。如供網(wǎng)站管理員使用的在線管理系統(tǒng),或用戶隱私信息頁面,均可以此方法控制;
可以在robots.txt指定sitemap地址。
User-agent: *
Disallow: /admin/
Disallow: /ads/
Sitemap: http://www.soso.com/sitemap.xml
[提示]以上是一段robots.txt文件的示例。標識了拒絕搜索引擎訪問的路徑和sitemap地址
Sitemap:
Sitemap中可以指定url的更新時間、更新頻率、相對權重等信息;
重要的url應該出現(xiàn)在Sitemap中,給予較高權重;
搜索引擎會參考Sitemap中的信息進行爬取、索引和排序,但不會完全遵守;
其他
搜索引擎在響應網(wǎng)站內容變化需要時間,特別是針對網(wǎng)站內容建設的SEO是逐漸生效的,改變網(wǎng)站幾個頁網(wǎng)頁內容就能迅速提高網(wǎng)站排名的觀點是錯誤的;
搜索引擎對于不符合規(guī)范的網(wǎng)站建設方式或者過度SEO有一定容忍能力,并不會因為網(wǎng)站建設不當而直接拒絕爬取、收錄、索引某個網(wǎng)站;
面向SEO的網(wǎng)站建設策略和用戶體驗應兼顧,甚至更多考慮用戶體驗,避免為了SEO而SEO。
網(wǎng)站運營和推廣
面向用戶的網(wǎng)站運營和推廣工作,可以起到引入和沉淀用戶、建設網(wǎng)站口碑、增強用戶黏性的作用。而然,網(wǎng)站運營和推廣同樣可以在SEO工作中發(fā)揮作用,下面從這個維度來簡單介紹。
內容運營
原創(chuàng)內容建設
網(wǎng)站建設以內容為王,在內容質量、原創(chuàng)、全面、權威等方面有優(yōu)勢的網(wǎng)站,更容易贏得用戶好感,同時也會贏得搜索引擎收錄和排序的傾向。
搜索引擎非常喜歡原創(chuàng)內容(特別是對于新站來說)在網(wǎng)站上主動發(fā)布或引導用戶來發(fā)布原創(chuàng)內容,增加原創(chuàng)內容比例,會讓搜索引擎更快收錄,同時在內容排重、排序上占得優(yōu)勢。
規(guī)律的內容維護
規(guī)律的內容更新時間和更新規(guī)模,有助于搜索引擎合理調度爬蟲進行抓取。更新較快較多的網(wǎng)站,也容易贏得搜索引擎爬蟲的高頻率光顧。
廣告內容運營
廣告能為網(wǎng)站帶來收入,是網(wǎng)站運營不能回避的運營工作。從SEO角度看來,也有些應注意的優(yōu)化點。
網(wǎng)站內容和廣告內容應區(qū)分出主次,突出頁面核心內容,利于搜索引擎理解頁面內容,而不應滿屏廣告;
廣告內容應配合頁面內容,與頁面內容、主題相關(搜索引擎爬蟲可能采集廣告內容作為頁面正文);
不要將廣告內容偽裝成頁面正文或鏈接,誘導點擊。
增加外鏈和積累有效錨文本
站外鏈接和錨文本是網(wǎng)站的重要SEO資源,承擔著入口、頁面內容識別、權重引入等諸多參與搜索引擎爬取、排重、排序工作的信息。對外鏈和錨文本的建設,是SEO工作中極重要的一環(huán)。
以下是一些外鏈、錨文本建設的建議:
互換友情鏈接、申請導航站收錄;
建設外鏈資源時,應合理設置錨文本,盡量不要以url做錨文本;
不止網(wǎng)站首頁需要外鏈,二級列表頁、專題頁、頻道首頁、特色頁面等,同樣需要外鏈建設;
可以發(fā)布網(wǎng)站功能特色介紹的文章,期間包含網(wǎng)站外鏈;
博客博文、微博、論壇帖子中出現(xiàn)的網(wǎng)站鏈接,對外鏈和錨文本建設有益,可將網(wǎng)站介紹文章轉發(fā)于此,但不要泛濫建設;
博客評論區(qū)、留言板、bbs簽名檔等非主要區(qū)域的外鏈價值極低,可能被搜索引擎忽略;
外鏈、錨文本應避免泛濫建設,否則可能被判為作弊。
用戶推薦和評價
用戶有鑒別內容質量的能力,通過用戶對網(wǎng)站內容的推薦和評價,可以幫助網(wǎng)站篩選好的內容,甚至制造外鏈。
建立用戶對內容投票機制,獲取用戶評價;
提供方便的分享工具,可將內容推薦到其他產(chǎn)品平臺,形成有價值外鏈;
[提示]一個常見的分享功能設計
培養(yǎng)用戶黏性,并適當鼓勵用戶對朋友推薦網(wǎng)站內容(包括在IM、博客、論壇等平臺上推薦)。
TAG:
評論加載中...
|