前幾天有個朋友在MSN里面問搜索引擎友(you)好指的是什么,這是個(ge)涉及(ji)面挺(ting)寬的問題,今天從幾方面談一(yi)下大概。
假設我們從搜索引擎蜘蛛的角度去看待一個網頁,在抓取,索引和排名的時候會遇到哪些問題呢?解決了這些問題的網站設計就是搜索引擎友好的。
搜索引擎蜘蛛能(neng)(neng)不能(neng)(neng)找到(dao)你的(de)網頁?
要讓搜索引擎找(zhao)到你(ni)的(de)(de)主頁(ye)你(ni)就必(bi)(bi)須要有(you)外部鏈接,在找(zhao)到你(ni)的(de)(de)主頁(ye)之后,還必(bi)(bi)須能(neng)找(zhao)到你(ni)的(de)(de)更深的(de)(de)內容頁(ye),也就要求你(ni)要有(you)良好(hao)的(de)(de)網(wang)站結(jie)構,符合邏輯,可能(neng)是一(yi)個扁平的(de)(de),可能(neng)是一(yi)個樹(shu)狀的(de)(de)。
而(er)且這些網頁之間(jian)要有良好的鏈(lian)接(jie)結(jie)構,這些鏈(lian)接(jie)以文字(zi)鏈(lian)接(jie)最好,圖像鏈(lian)接(jie)也可以,但是JavaScript鏈(lian)接(jie),下拉(la)菜單鏈(lian)接(jie),flash鏈(lian)接(jie)等就(jiu)會有問題。
一般推薦網站需要(yao)(yao)有一個(ge)網站地圖,把所有重要(yao)(yao)的欄(lan)目和網頁(ye)都列進去。如果網站比較大,網站地圖還可以(yi)分成幾(ji)個(ge)。
網站的所有(you)頁(ye)面都要能從主頁(ye)開(kai)始,順著鏈接找(zhao)到(dao),最好在3,4次點擊之內。
搜索引擎蜘蛛找(zhao)到網頁后能不(bu)能抓取網頁?
網頁的URL必須是可以被抓取的,如果網頁是由數據庫動態生成的,那么URL一般要經過改寫成靜態的,也就是去掉那些URL中問號參數之類的東西, 也要去掉Session ID。技術上倒不是搜索引擎不能讀取這種URL,但是為了避免陷入無限循環,搜索引擎蜘蛛通常要遠離這類URL。
還有如果你的網站是一個整個的flash,那也沒辦法讀取。雖然搜索引擎在努(nu)力想讀取flash信息,但目(mu)前為止收效(xiao)甚(shen)微。
還有框架結構(frame),在網站剛出現的時候,框架結構風行一時,現在還有不少網站在用,這是搜索引擎蜘蛛的大敵。有的時候可以抓取,但別自找麻煩(fan)。
還有盡量去除不必要的搜索引擎不能讀的東(dong)西,像音頻文件,圖片,彈出窗口等。
搜索引擎蜘蛛抓取網頁之后,怎樣(yang)提煉有用(yong)信息?
網頁的HTML碼必須很(hen)優(you)化,也就是格式(shi)標(biao)簽(qian)占(zhan)(zhan)的越(yue)少越(yue)好(hao)(hao),真正內容占(zhan)(zhan)的越(yue)多越(yue)好(hao)(hao),整個文件(jian)越(yue)小越(yue)好(hao)(hao)。把CSS,JavaScript等(deng)放在外部文件(jian)。
把(ba)關鍵詞放在應該出現(xian)的地方(fang)。
檢查網(wang)頁對不同(tong)操作系統,不同(tong)browser的兼容性。檢查是否符合W3C標準。
只有搜索引擎能順利找到你的所有網頁,抓取這些網頁并取出其中真正的有相關性的內容,這個網站才可以被視為是搜索引擎友好的。
旗下網站:耐思智慧 - - - 中(zhong)文域名:
耐思(si)智慧 © 版權所有 Copyright © 2000-2025 szjicheng.cn,Inc. All rights reserved
備案號碼:
公安備案號:
聲明:本網站中所(suo)使用到的其他(ta)各(ge)種版權(quan)內(nei)容(rong)(rong),包(bao)括但不限于(yu)文章、圖片、視(shi)頻(pin)、音頻(pin)、字體(ti)等內(nei)容(rong)(rong)版權(quan)歸(gui)原作者所(suo)有(you),如權(quan)利所(suo)有(you)人發現,請及(ji)時告知(zhi),以便我們刪除版權(quan)內(nei)容(rong)(rong)
本站(zhan)程序界(jie)面、源代碼受相關法律保護, 未經(jing)授權, 嚴禁(jin)使用(yong); 耐思智慧 © 為(wei)我公司注冊商標, 未經(jing)授權, 嚴禁(jin)使用(yong)
法律顧問: