前幾天有個朋友在MSN里面問搜索引擎友好指的(de)是什么,這是個涉及面(mian)挺寬的(de)問題,今(jin)天從幾(ji)方面(mian)談(tan)一下大(da)概。
假設我們從搜索引擎蜘蛛的角度去看待一個網頁,在抓取,索引和排名的時候會遇到哪些問題呢?解決了這些問題的網站設計就是搜索引擎友好的。
搜索引擎蜘蛛能(neng)不能(neng)找到你的網頁?
要讓搜索引擎找到你的(de)(de)主頁你就必須要(yao)有外部鏈(lian)接,在找到你的(de)(de)主頁之后,還必須能找到你的(de)(de)更深的(de)(de)內容頁,也(ye)就要(yao)求你要(yao)有良好的(de)(de)網站結構,符合邏輯,可能是(shi)一個扁平的(de)(de),可能是(shi)一個樹狀的(de)(de)。
而且(qie)這些網(wang)頁之間要有良好的(de)鏈(lian)接結構,這些鏈(lian)接以文字鏈(lian)接最好,圖(tu)像(xiang)鏈(lian)接也可以,但是(shi)JavaScript鏈(lian)接,下拉菜單鏈(lian)接,flash鏈(lian)接等就(jiu)會有問題。
一般推薦網站(zhan)需要有(you)一個網站(zhan)地圖(tu),把所有(you)重要的欄目(mu)和網頁都(dou)列進去。如果網站(zhan)比較大,網站(zhan)地圖(tu)還(huan)可以分成幾個。
網(wang)站的所有頁面都要(yao)能從主頁開始,順著鏈接找到,最好在3,4次點擊之內。
搜索引擎蜘蛛找(zhao)到網頁后能不能抓(zhua)取網頁?
網頁的URL必須是可以被抓取的,如果網頁是由數據庫動態生成的,那么URL一般要經過改寫成靜態的,也就是去掉那些URL中問號參數之類的東西, 也要去掉Session ID。技術上倒不是搜索引擎不能讀取這種URL,但是為了避免陷入無限循環,搜索引擎蜘蛛(zhu)通常要遠(yuan)離這類URL。
還有如果你的網站是一個整個的flash,那也沒辦法讀取。雖然搜索引擎在努力想(xiang)讀(du)取flash信息,但目(mu)前為止收效(xiao)甚微。
還有框架結構(frame),在網站剛出現的時候,框架結構風行一時,現在還有不少網站在用,這是搜索引擎蜘蛛的(de)大(da)敵。有的(de)時候可以抓取,但別自找麻煩。
還有盡量去除不必要的搜索引擎不能(neng)讀的東(dong)西,像音頻文件,圖片,彈出窗口等。
搜索引擎蜘(zhi)蛛抓(zhua)取網頁之后,怎樣提煉(lian)有用信息?
網頁的(de)(de)HTML碼必須很(hen)優化(hua),也就是格式(shi)標(biao)簽占的(de)(de)越少越好(hao)(hao)(hao),真正(zheng)內容占的(de)(de)越多越好(hao)(hao)(hao),整個文件越小越好(hao)(hao)(hao)。把(ba)CSS,JavaScript等放在外部文件。
把關鍵詞放在應該出(chu)現的地(di)方(fang)。
檢查網頁對不同(tong)操作系統,不同(tong)browser的兼(jian)容性。檢查是否符(fu)合W3C標(biao)準。
只有搜索引擎能順利找到你的所有網頁,抓取這些網頁并取出其中真正的有相關性的內容,這個網站才可以被視為是搜索引擎友好的。
旗下網站:耐思智慧 - - - 中文域名:
耐思智慧 © 版(ban)權所有(you) Copyright © 2000-2025 szjicheng.cn,Inc. All rights reserved
備案號碼:
公安備案號:
聲明:本網(wang)站中(zhong)所使用到的其他各(ge)種版(ban)(ban)權內(nei)容,包括但不(bu)限于文章、圖片、視頻(pin)、音頻(pin)、字體等內(nei)容版(ban)(ban)權歸原作(zuo)者所有(you),如權利(li)所有(you)人(ren)發現,請及時告知,以便我們刪(shan)除版(ban)(ban)權內(nei)容
本站程序(xu)界(jie)面、源代碼(ma)受相關法律(lv)保護, 未經(jing)(jing)授(shou)權(quan), 嚴(yan)禁(jin)使用; 耐思智慧 © 為我公(gong)司注冊商標, 未經(jing)(jing)授(shou)權(quan), 嚴(yan)禁(jin)使用
法律顧問: