前幾天有個朋友在MSN里面問搜索引擎友(you)好指的是什么,這是個涉及面(mian)挺寬的問(wen)題,今天從幾方面(mian)談一下大概。
假設我們從搜索引擎蜘蛛的角度去看待一個網頁,在抓取,索引和排名的時候會遇到哪些問題呢?解決了這些問題的網站設計就是搜索引擎友好的。
搜索引擎蜘蛛能不能找到你的網頁?
要讓搜索引擎找到(dao)你的(de)(de)主頁你就(jiu)必須(xu)要(yao)(yao)有外(wai)部鏈接,在(zai)找到(dao)你的(de)(de)主頁之后(hou),還必須(xu)能(neng)找到(dao)你的(de)(de)更深的(de)(de)內容頁,也就(jiu)要(yao)(yao)求你要(yao)(yao)有良好的(de)(de)網站結構,符合邏(luo)輯,可能(neng)是(shi)(shi)一個(ge)扁平(ping)的(de)(de),可能(neng)是(shi)(shi)一個(ge)樹狀的(de)(de)。
而(er)且這(zhe)(zhe)些網(wang)頁之間要有良好的鏈(lian)(lian)接(jie)結構,這(zhe)(zhe)些鏈(lian)(lian)接(jie)以文(wen)字鏈(lian)(lian)接(jie)最好,圖(tu)像鏈(lian)(lian)接(jie)也可以,但是JavaScript鏈(lian)(lian)接(jie),下拉菜單鏈(lian)(lian)接(jie),flash鏈(lian)(lian)接(jie)等就會有問題(ti)。
一般推薦(jian)網站需要有(you)一個(ge)(ge)網站地圖,把所有(you)重要的欄(lan)目和網頁都列進(jin)去(qu)。如(ru)果網站比較大,網站地圖還可以分成幾(ji)個(ge)(ge)。
網站(zhan)的所有頁面都要能從主(zhu)頁開始,順著鏈接(jie)找到,最(zui)好在3,4次點擊(ji)之內(nei)。
搜索引擎蜘蛛找到(dao)網頁(ye)(ye)后能不能抓取網頁(ye)(ye)?
網頁的URL必須是可以被抓取的,如果網頁是由數據庫動態生成的,那么URL一般要經過改寫成靜態的,也就是去掉那些URL中問號參數之類的東西, 也要去掉Session ID。技術上倒不是搜索引擎不能讀取這種URL,但是為了避免陷入無限循環,搜索引擎蜘蛛通常要遠離這類URL。
還有如果你的網站是一個整個的flash,那也沒辦法讀取。雖然搜索引擎在(zai)努力想讀取(qu)flash信息,但目前為止收效(xiao)甚微(wei)。
還有框架結構(frame),在網站剛出現的時候,框架結構風行一時,現在還有不少網站在用,這是搜索引擎蜘蛛的(de)大敵。有的(de)時候可以抓取,但別自(zi)找麻(ma)煩。
還有盡量去除不必要的搜索引擎不能讀的東西,像音頻(pin)文(wen)件,圖片,彈出(chu)窗口(kou)等。
搜索引擎蜘(zhi)蛛抓取網頁之后,怎樣提煉有(you)用信息?
網(wang)頁的HTML碼必(bi)須(xu)很(hen)優化(hua),也就是格式標(biao)簽占的越(yue)少越(yue)好,真正內容占的越(yue)多越(yue)好,整個文(wen)件越(yue)小越(yue)好。把CSS,JavaScript等(deng)放在外部文(wen)件。
把關鍵詞放(fang)在應該出現(xian)的地方。
檢查(cha)網頁(ye)對不同操作系統,不同browser的(de)兼(jian)容性。檢查(cha)是(shi)否符合(he)W3C標(biao)準。
只有搜索引擎能順利找到你的所有網頁,抓取這些網頁并取出其中真正的有相關性的內容,這個網站才可以被視為是搜索引擎友好的。
旗下網站:耐思智慧 - - - 中文域名(ming):
耐思智慧 © 版(ban)權所有 Copyright © 2000-2025 szjicheng.cn,Inc. All rights reserved
備案號碼:
公安備案號:
聲明:本(ben)網站中所(suo)(suo)使用到的其他各種版權內容(rong),包括但不限(xian)于(yu)文章、圖片、視頻(pin)、音頻(pin)、字體等內容(rong)版權歸原作者所(suo)(suo)有,如權利所(suo)(suo)有人發現,請及時告知,以便(bian)我們刪(shan)除(chu)版權內容(rong)
本站程序界面、源代碼受相關法(fa)律保護, 未(wei)經(jing)(jing)授權(quan), 嚴(yan)禁使用(yong); 耐思智(zhi)慧 © 為我公(gong)司注冊(ce)商標, 未(wei)經(jing)(jing)授權(quan), 嚴(yan)禁使用(yong)
法律顧問: