前幾天有個朋友在MSN里面問搜索引擎友好(hao)指的(de)是(shi)什(shen)么,這是(shi)個涉及面(mian)挺寬的(de)問題,今天從幾方面(mian)談一下大(da)概。
假設我們從搜索引擎蜘蛛的角度去看待一個網頁,在抓取,索引和排名的時候會遇到哪些問題呢?解決了這些問題的網站設計就是搜索引擎友好的。
搜索引擎蜘蛛能(neng)不能(neng)找到你(ni)的網頁?
要讓搜索引擎找(zhao)到你(ni)的主頁你(ni)就(jiu)(jiu)必須要有外部鏈接,在找(zhao)到你(ni)的主頁之后,還必須能找(zhao)到你(ni)的更深的內容頁,也就(jiu)(jiu)要求你(ni)要有良好的網站(zhan)結構(gou),符合邏輯,可能是一個扁平的,可能是一個樹狀(zhuang)的。
而且這些網頁之間要有良好的鏈(lian)接(jie)結構,這些鏈(lian)接(jie)以文字鏈(lian)接(jie)最好,圖像鏈(lian)接(jie)也可(ke)以,但是JavaScript鏈(lian)接(jie),下拉菜(cai)單鏈(lian)接(jie),flash鏈(lian)接(jie)等就會有問(wen)題。
一般推薦(jian)網站(zhan)需要(yao)有一個網站(zhan)地圖(tu),把所(suo)有重要(yao)的欄(lan)目和網頁都列進去。如果網站(zhan)比較(jiao)大,網站(zhan)地圖(tu)還可(ke)以分成幾個。
網站的所有頁(ye)(ye)面都要能從主頁(ye)(ye)開始,順著鏈(lian)接(jie)找(zhao)到,最好在3,4次(ci)點擊(ji)之內。
搜索引擎蜘蛛找到網頁(ye)后(hou)能(neng)(neng)不能(neng)(neng)抓取網頁(ye)?
網頁的URL必須是可以被抓取的,如果網頁是由數據庫動態生成的,那么URL一般要經過改寫成靜態的,也就是去掉那些URL中問號參數之類的東西, 也要去掉Session ID。技術上倒不是搜索引擎不能讀取這種URL,但是為了避免陷入無限循環,搜索引擎蜘蛛通常要(yao)遠離這(zhe)類URL。
還有如果你的網站是一個整個的flash,那也沒辦法讀取。雖然搜索引擎在(zai)努力(li)想讀取flash信息,但目前為止收效甚微。
還有框架結構(frame),在網站剛出現的時候,框架結構風行一時,現在還有不少網站在用,這是搜索引擎蜘(zhi)蛛的大敵。有的時候可以抓取(qu),但(dan)別自找麻煩。
還有盡量去除不必要的搜索引擎不能讀的(de)東西(xi),像音頻文件,圖片(pian),彈出窗口等(deng)。
搜索引擎蜘蛛抓取網頁(ye)之后,怎(zen)樣提(ti)煉有用信息?
網頁(ye)的(de)HTML碼必(bi)須很優化,也就是格式標簽占的(de)越少(shao)越好(hao),真正內容占的(de)越多越好(hao),整個文(wen)件越小越好(hao)。把CSS,JavaScript等放在外(wai)部文(wen)件。
把(ba)關鍵詞(ci)放在應該出現的地方。
檢查網頁對(dui)不同操作系統,不同browser的兼容性。檢查是否(fou)符合W3C標準(zhun)。
只有搜索引擎能順利找到你的所有網頁,抓取這些網頁并取出其中真正的有相關性的內容,這個網站才可以被視為是搜索引擎友好的。
旗下網站:耐思智慧 - - - 中文域名(ming):
耐思智慧 © 版權所有 Copyright © 2000-2025 szjicheng.cn,Inc. All rights reserved
備案號碼:
公安備案號:
聲(sheng)明:本網站中(zhong)所使用到(dao)的其他各(ge)種版權(quan)內容(rong)(rong),包括但不(bu)限于文章、圖片、視頻、音頻、字體等(deng)內容(rong)(rong)版權(quan)歸原作者所有(you),如權(quan)利所有(you)人發現,請及時告知,以便(bian)我們(men)刪除版權(quan)內容(rong)(rong)
本站程序(xu)界面、源代碼受相關法律保護, 未經(jing)授權(quan), 嚴(yan)禁(jin)使用; 耐思智慧 © 為我公司注冊(ce)商標(biao), 未經(jing)授權(quan), 嚴(yan)禁(jin)使用
法律顧問: