前幾天有個朋友在MSN里面問搜索引擎友好指的是什么,這是個涉及(ji)面挺寬的問(wen)題,今天(tian)從幾(ji)方面談一下(xia)大概。
假設我們從搜索引擎蜘蛛的角度去看待一個網頁,在抓取,索引和排名的時候會遇到哪些問題呢?解決了這些問題的網站設計就是搜索引擎友好的。
搜索引擎蜘蛛能(neng)不能(neng)找到你的網頁?
要讓搜索引擎找到(dao)你的(de)(de)主(zhu)頁你就(jiu)必須要有外部鏈(lian)接,在找到(dao)你的(de)(de)主(zhu)頁之(zhi)后,還(huan)必須能找到(dao)你的(de)(de)更深的(de)(de)內容頁,也就(jiu)要求(qiu)你要有良好的(de)(de)網站結構,符合邏輯,可能是一個(ge)扁平的(de)(de),可能是一個(ge)樹狀(zhuang)的(de)(de)。
而且這(zhe)些網頁之間要有(you)良好的鏈接(jie)結構,這(zhe)些鏈接(jie)以文字鏈接(jie)最好,圖像鏈接(jie)也(ye)可以,但是JavaScript鏈接(jie),下拉菜單鏈接(jie),flash鏈接(jie)等就會有(you)問題。
一(yi)般推薦網(wang)站(zhan)需要有一(yi)個網(wang)站(zhan)地圖(tu),把所有重(zhong)要的欄(lan)目(mu)和網(wang)頁都列進去。如果網(wang)站(zhan)比較大,網(wang)站(zhan)地圖(tu)還可以分成幾個。
網(wang)站的所(suo)有(you)頁面都要能從主頁開始,順(shun)著鏈接(jie)找到,最好在(zai)3,4次點擊之內。
搜索引擎蜘(zhi)蛛找到網頁(ye)(ye)后能(neng)不能(neng)抓(zhua)取網頁(ye)(ye)?
網頁的URL必須是可以被抓取的,如果網頁是由數據庫動態生成的,那么URL一般要經過改寫成靜態的,也就是去掉那些URL中問號參數之類的東西, 也要去掉Session ID。技術上倒不是搜索引擎不能讀取這種URL,但是為了避免陷入無限循環,搜索引擎蜘蛛通常要遠離這類(lei)URL。
還有如果你的網站是一個整個的flash,那也沒辦法讀取。雖然搜索引擎在努(nu)力(li)想讀取flash信(xin)息,但目(mu)前為止收(shou)效甚微(wei)。
還有框架結構(frame),在網站剛出現的時候,框架結構風行一時,現在還有不少網站在用,這是搜索引擎蜘蛛的(de)大敵。有的(de)時候可以抓取,但別自找(zhao)麻煩。
還有盡量去除不必要的搜索引擎不能讀的東西,像音頻文件,圖片,彈出窗口等(deng)。
搜索引擎蜘蛛抓(zhua)取網頁之后,怎樣提煉有用信息(xi)?
網頁的(de)HTML碼(ma)必須很優化,也就是格式標簽占(zhan)的(de)越少越好(hao)(hao),真正內容(rong)占(zhan)的(de)越多(duo)越好(hao)(hao),整個文(wen)件(jian)越小越好(hao)(hao)。把(ba)CSS,JavaScript等(deng)放在外(wai)部文(wen)件(jian)。
把關鍵詞(ci)放在(zai)應該出現(xian)的地方(fang)。
檢查(cha)網頁(ye)對不同操作系統,不同browser的兼(jian)容性。檢查(cha)是(shi)否符合W3C標準。
只有搜索引擎能順利找到你的所有網頁,抓取這些網頁并取出其中真正的有相關性的內容,這個網站才可以被視為是搜索引擎友好的。
旗下網站:耐思智慧 - - - 中(zhong)文(wen)域名:
耐思智慧 © 版(ban)權所有 Copyright © 2000-2025 szjicheng.cn,Inc. All rights reserved
備案號碼:
公安備案號:
聲明:本網站中所使用到的其他各種版權內容(rong),包括但(dan)不(bu)限于文章、圖(tu)片、視頻(pin)、音(yin)頻(pin)、字體等內容(rong)版權歸原作(zuo)者所有,如權利(li)所有人發現,請及時告知,以便我(wo)們刪除版權內容(rong)
本站程序界面、源代碼受相(xiang)關法律保護, 未(wei)經(jing)(jing)授權(quan), 嚴(yan)禁使(shi)用; 耐思智慧(hui) © 為我公司注冊商標, 未(wei)經(jing)(jing)授權(quan), 嚴(yan)禁使(shi)用
法律顧問: