前幾天有個朋友在MSN里面問搜索引擎友好指的是什么,這是個涉及面挺寬的問題,今天從幾方面談一下大概。
假設我們從搜索引擎蜘蛛的角度去看待一個網頁,在抓取,索引和排名的時候會遇到哪些問題呢?解決了這些問題的網站設計就是搜索引擎友好的。
搜索引擎蜘(zhi)蛛能不能找到(dao)你的(de)網頁?
要讓搜索引擎找(zhao)到你的主頁(ye)(ye)你就必須(xu)要(yao)有外部鏈接(jie),在找(zhao)到你的主頁(ye)(ye)之后,還必須(xu)能(neng)(neng)找(zhao)到你的更(geng)深(shen)的內(nei)容頁(ye)(ye),也(ye)就要(yao)求(qiu)你要(yao)有良好(hao)的網(wang)站結構,符合(he)邏(luo)輯,可(ke)能(neng)(neng)是一(yi)個扁(bian)平的,可(ke)能(neng)(neng)是一(yi)個樹狀的。
而且這(zhe)些網頁之間要(yao)有良好(hao)(hao)的鏈接(jie)結構,這(zhe)些鏈接(jie)以文(wen)字鏈接(jie)最好(hao)(hao),圖像鏈接(jie)也可以,但是JavaScript鏈接(jie),下拉菜單鏈接(jie),flash鏈接(jie)等就會(hui)有問題。
一般(ban)推(tui)薦(jian)網(wang)站需(xu)要(yao)有(you)一個網(wang)站地圖(tu)(tu),把(ba)所有(you)重(zhong)要(yao)的欄(lan)目和網(wang)頁都列進去。如果網(wang)站比較大,網(wang)站地圖(tu)(tu)還可以分成幾(ji)個。
網站的所有頁(ye)面都要(yao)能從主(zhu)頁(ye)開始,順著鏈接找到,最好(hao)在3,4次點擊之內。
搜索引擎蜘蛛找到網頁后能不能抓(zhua)取網頁?
網頁的URL必須是可以被抓取的,如果網頁是由數據庫動態生成的,那么URL一般要經過改寫成靜態的,也就是去掉那些URL中問號參數之類的東西, 也要去掉Session ID。技術上倒不是搜索引擎不能讀取這種URL,但是為了避免陷入無限循環,搜索引擎蜘蛛通常(chang)要遠離這類URL。
還有如果你的網站是一個整個的flash,那也沒辦法讀取。雖然搜索引擎在努力想讀取flash信息,但目前為止收效甚微(wei)。
還有框架結構(frame),在網站剛出現的時候,框架結構風行一時,現在還有不少網站在用,這是搜索引擎蜘蛛的(de)大(da)敵。有(you)的(de)時候可以抓取,但別自找麻煩。
還有盡量去除不必要的搜索引擎不能(neng)讀(du)的東西,像音(yin)頻文件,圖片,彈出窗口等。
搜索引擎蜘蛛抓取網頁之后,怎樣提煉有(you)用信息?
網頁的HTML碼必須很優化,也(ye)就是格式標簽占(zhan)的越少越好(hao)(hao),真正內容占(zhan)的越多(duo)越好(hao)(hao),整個文件(jian)越小越好(hao)(hao)。把CSS,JavaScript等放在外(wai)部(bu)文件(jian)。
把關鍵詞放在應該出現的(de)地方。
檢查網頁對不同操作系統,不同browser的兼容(rong)性。檢查是否符合W3C標準。
只有搜索引擎能順利找到你的所有網頁,抓取這些網頁并取出其中真正的有相關性的內容,這個網站才可以被視為是搜索引擎友好的。
旗下網站:耐思智慧 - - - 中文域名:
耐(nai)思智慧(hui) © 版權所有 Copyright © 2000-2025 szjicheng.cn,Inc. All rights reserved
備案號碼:
公安備案號:
聲明:本網(wang)站(zhan)中(zhong)所(suo)(suo)使用到(dao)的其他各種版權(quan)內(nei)容(rong),包括但不限于文章、圖片、視頻、音(yin)頻、字體等內(nei)容(rong)版權(quan)歸原作者所(suo)(suo)有(you),如權(quan)利所(suo)(suo)有(you)人發現(xian),請及時告(gao)知,以便(bian)我們刪除(chu)版權(quan)內(nei)容(rong)
本站程序界面、源代碼受(shou)相關(guan)法律保護, 未經授(shou)權(quan)(quan), 嚴(yan)禁(jin)使用; 耐(nai)思智慧 © 為我(wo)公司注(zhu)冊商(shang)標, 未經授(shou)權(quan)(quan), 嚴(yan)禁(jin)使用
法律顧問: