網(wǎng)絡(luò)蜘蛛雖然不是人,但它同樣也有范圍,很顯然,對(duì)于浩瀚如海的網(wǎng)絡(luò)世界來(lái)說(shuō),網(wǎng)絡(luò)蜘蛛要想抓取互聯(lián)網(wǎng)所有的網(wǎng)頁(yè)幾乎是不可能的。從目前公布的數(shù)據(jù)來(lái)看,容量大的搜索引擎也不過(guò)只是抓取了其中的40%而已,有很多網(wǎng)頁(yè)根本無(wú)法被收錄。因此要想讓網(wǎng)絡(luò)蜘蛛抓到你,讓潛在客戶能從搜索引擎中找到你的信息,首先就必須先做好網(wǎng)站收錄的工作。
筆者一直都認(rèn)為網(wǎng)絡(luò)蜘蛛非常人性化,了解了網(wǎng)絡(luò)蜘蛛的工作原理,就能從如下7個(gè)步驟入手,讓網(wǎng)頁(yè)實(shí)現(xiàn)收錄。
(1) 向百度提交你的網(wǎng)站
這對(duì)新網(wǎng)站而言尤其重要。網(wǎng)絡(luò)蜘蛛也喜歡認(rèn)識(shí)“新朋友”,向百度提交你的網(wǎng)站就好像你在向百度提交你的“名片”一樣,讓人家記住你。一般情況下,網(wǎng)絡(luò)蜘蛛會(huì)在1~4周的時(shí)間內(nèi)對(duì)你的網(wǎng)站做出收錄回應(yīng)。但要注意的是,提交網(wǎng)站時(shí)只要提交網(wǎng)站首頁(yè)就可以了,沒(méi)必要提交內(nèi)容網(wǎng)頁(yè),因?yàn)橹灰o網(wǎng)絡(luò)蜘蛛一個(gè)開頭,它就會(huì)自動(dòng)爬遍每個(gè)“角落”。
百度網(wǎng)站提交網(wǎng)址:http://www.baidu.com/serach/url-submit.html
(2) 適度競(jìng)價(jià)排名
雖然百度收錄只與網(wǎng)頁(yè)價(jià)值有關(guān),與競(jìng)價(jià)排名等商業(yè)因素沒(méi)多大關(guān)系。但如果你的網(wǎng)站還未被百度收錄,進(jìn)行競(jìng)價(jià)排名不失為一種良策,此時(shí)網(wǎng)站猶如在“行賄”一樣,提醒百度蜘蛛記住你。
(3) 設(shè)置友情連接
這里的友情鏈接是指有“質(zhì)量”的友情鏈接,而不是垃圾鏈接(垃圾鏈接太多,反而會(huì)讓百度蜘蛛生厭,有損網(wǎng)絡(luò)收錄)。這個(gè)過(guò)程猶如從別人的網(wǎng)頁(yè)搭“橋”過(guò)來(lái),在百度蜘蛛收錄別人的同時(shí),順著“橋”會(huì)爬到你的網(wǎng)頁(yè)中。
(4) 給每個(gè)網(wǎng)頁(yè)加上與正文相關(guān)的標(biāo)題
之所以說(shuō)百度蜘蛛具有人性,其原因是百度只會(huì)收錄符合用戶搜索體驗(yàn)的網(wǎng)頁(yè)或網(wǎng)站。給每個(gè)網(wǎng)頁(yè)加上標(biāo)題,無(wú)疑就是為了符合用戶的閱讀習(xí)慣,想想你自己閱讀內(nèi)容的時(shí)候,是不是往往先看標(biāo)題是否感興趣,再?zèng)Q定是否看內(nèi)容,在這一點(diǎn)上,蜘蛛其實(shí)和你一樣。
對(duì)于網(wǎng)頁(yè)標(biāo)題的設(shè)置必須保證標(biāo)題的關(guān)鍵詞與正文有關(guān),如果是網(wǎng)站首頁(yè),那么標(biāo)題好是網(wǎng)站的名稱或公司的名稱。如果是其余頁(yè)面,標(biāo)題好是正文內(nèi)容的提煉。
(5) 設(shè)置容易提取的網(wǎng)頁(yè)形態(tài)
網(wǎng)絡(luò)蜘蛛能抓取下來(lái)的網(wǎng)頁(yè)有html、doc、pdf、圖片、多媒體、動(dòng)態(tài)網(wǎng)頁(yè)及其他格式。這些文件被抓取下來(lái)后,需要把這些文件中的文本信息提取出來(lái)。相對(duì)而言,doc、pdf等文檔比HTML、圖片、多媒體等文檔更容易提取,靜態(tài)網(wǎng)頁(yè)比動(dòng)態(tài)網(wǎng)頁(yè)更容易提取。
(6) 提高網(wǎng)頁(yè)的質(zhì)量
百度蜘蛛更喜歡高質(zhì)量的網(wǎng)頁(yè),因此網(wǎng)頁(yè)內(nèi)容好是原創(chuàng)性文章。如果是復(fù)制的文章很有可能不會(huì)被收錄。
(7) 經(jīng)常保持網(wǎng)站更新
經(jīng)常更新的網(wǎng)站,網(wǎng)絡(luò)蜘蛛就會(huì)經(jīng)常光顧,而長(zhǎng)期不更新的網(wǎng)站,網(wǎng)絡(luò)蜘蛛的到訪就會(huì)減少。同時(shí),網(wǎng)站的更新時(shí)間好是在工作日的9點(diǎn)到10點(diǎn)之間,這個(gè)時(shí)候是網(wǎng)絡(luò)蜘蛛進(jìn)行重新梳理的佳時(shí)間,因?yàn)榘俣仁珍洺藱C(jī)器收錄之外,還有人工收錄的方式。
如果上述工作都做了,還是沒(méi)有被百度收錄,建議你也可以發(fā)信息到webmaster@baidu.com去詢問(wèn)或者咨詢珍島專業(yè)的
SEO工程師。