前幾天有個朋友在MSN里面問搜索引擎友好指的(de)是(shi)(shi)什么,這是(shi)(shi)個涉及面挺(ting)寬的(de)問題,今天從幾(ji)方面談一下(xia)大(da)概。
假設我們從搜索引擎蜘蛛的角度去看待一個網頁,在抓取,索引和排名的時候會遇到哪些問題呢?解決了這些問題的網站設計就是搜索引擎友好的。
搜索引擎蜘蛛能(neng)不能(neng)找到你的網頁(ye)?
要讓搜索引擎找(zhao)到你(ni)的(de)主頁(ye)你(ni)就必(bi)須要有外部鏈接,在找(zhao)到你(ni)的(de)主頁(ye)之后,還必(bi)須能找(zhao)到你(ni)的(de)更深的(de)內容頁(ye),也就要求你(ni)要有良好的(de)網站結構(gou),符合邏輯,可(ke)(ke)能是(shi)一個扁平的(de),可(ke)(ke)能是(shi)一個樹狀的(de)。
而且這些網(wang)頁之間(jian)要有良好的鏈(lian)接(jie)(jie)結構,這些鏈(lian)接(jie)(jie)以文(wen)字鏈(lian)接(jie)(jie)最(zui)好,圖像鏈(lian)接(jie)(jie)也可以,但是JavaScript鏈(lian)接(jie)(jie),下拉(la)菜單(dan)鏈(lian)接(jie)(jie),flash鏈(lian)接(jie)(jie)等就(jiu)會有問(wen)題(ti)。
一般推(tui)薦網(wang)站需要有一個網(wang)站地圖,把所有重要的欄目和網(wang)頁都列進去。如果網(wang)站比較(jiao)大,網(wang)站地圖還可以分成(cheng)幾個。
網站的所有(you)頁面都要能從(cong)主(zhu)頁開始(shi),順著鏈(lian)接找到,最(zui)好(hao)在3,4次(ci)點(dian)擊之內。
搜索引擎蜘蛛找到網(wang)頁后(hou)能不能抓取網(wang)頁?
網頁的URL必須是可以被抓取的,如果網頁是由數據庫動態生成的,那么URL一般要經過改寫成靜態的,也就是去掉那些URL中問號參數之類的東西, 也要去掉Session ID。技術上倒不是搜索引擎不能讀取這種URL,但是為了避免陷入無限循環,搜索引擎蜘蛛通常要遠離這(zhe)類URL。
還有如果你的網站是一個整個的flash,那也沒辦法讀取。雖然搜索引擎在(zai)努力想讀取(qu)flash信息,但(dan)目(mu)前為止收效甚微。
還有框架結構(frame),在網站剛出現的時候,框架結構風行一時,現在還有不少網站在用,這是搜索引擎蜘蛛的大敵。有的時候可(ke)以抓(zhua)取,但別(bie)自找麻煩。
還有盡量去除不必要的搜索引擎不能讀的(de)東(dong)西,像音頻(pin)文件,圖片(pian),彈出窗口等。
搜索引擎蜘蛛抓取網頁之后,怎樣提煉有用信(xin)息?
網頁的HTML碼(ma)必須很優化,也就是格式(shi)標(biao)簽(qian)占的越(yue)少越(yue)好(hao),真正(zheng)內容占的越(yue)多越(yue)好(hao),整個文件(jian)越(yue)小越(yue)好(hao)。把CSS,JavaScript等(deng)放在外(wai)部(bu)文件(jian)。
把關鍵詞(ci)放在(zai)應該出現的(de)地(di)方(fang)。
檢查網頁對不同(tong)操作系統,不同(tong)browser的(de)兼(jian)容(rong)性。檢查是否符合W3C標準(zhun)。
只有搜索引擎能順利找到你的所有網頁,抓取這些網頁并取出其中真正的有相關性的內容,這個網站才可以被視為是搜索引擎友好的。
旗下網站:耐思智慧 - - - 中文域名:
耐思智慧 © 版(ban)權所有 Copyright © 2000-2025 szjicheng.cn,Inc. All rights reserved
備案號碼:
公安備案號:
聲明:本網站(zhan)中所使用到的(de)其(qi)他各(ge)種版(ban)權(quan)內容,包括但不限(xian)于文(wen)章(zhang)、圖片、視(shi)頻(pin)、音頻(pin)、字體(ti)等內容版(ban)權(quan)歸原作者所有,如(ru)權(quan)利所有人發現,請及時告知,以便(bian)我們(men)刪除版(ban)權(quan)內容
本站程序(xu)界面、源代碼受相關法律保護(hu), 未經授權, 嚴禁使用(yong); 耐思智(zhi)慧(hui) © 為我公司注冊商(shang)標, 未經授權, 嚴禁使用(yong)
法律顧問: