前幾天有個朋友在MSN里面問搜索引擎友好指的是(shi)什么,這是(shi)個涉及面(mian)挺寬的問題,今天從(cong)幾方面(mian)談一下大概。
假設我們從搜索引擎蜘蛛的角度去看待一個網頁,在抓取,索引和排名的時候會遇到哪些問題呢?解決了這些問題的網站設計就是搜索引擎友好的。
搜索引擎蜘蛛能不能找到你的網(wang)頁?
要讓搜索引擎找(zhao)到(dao)(dao)你(ni)(ni)(ni)的(de)主頁你(ni)(ni)(ni)就必(bi)須要有外部鏈接(jie),在(zai)找(zhao)到(dao)(dao)你(ni)(ni)(ni)的(de)主頁之后(hou),還必(bi)須能找(zhao)到(dao)(dao)你(ni)(ni)(ni)的(de)更深的(de)內(nei)容頁,也就要求(qiu)你(ni)(ni)(ni)要有良好的(de)網站結構(gou),符合邏(luo)輯,可能是(shi)一(yi)(yi)個扁平的(de),可能是(shi)一(yi)(yi)個樹狀的(de)。
而且這些(xie)網頁(ye)之間(jian)要(yao)有良好的(de)鏈接(jie)(jie)(jie)結構(gou),這些(xie)鏈接(jie)(jie)(jie)以文字鏈接(jie)(jie)(jie)最好,圖像鏈接(jie)(jie)(jie)也可以,但(dan)是JavaScript鏈接(jie)(jie)(jie),下拉(la)菜單鏈接(jie)(jie)(jie),flash鏈接(jie)(jie)(jie)等(deng)就(jiu)會有問(wen)題(ti)。
一般推(tui)薦網(wang)站(zhan)需要(yao)有(you)一個網(wang)站(zhan)地圖(tu),把(ba)所有(you)重要(yao)的(de)欄(lan)目和網(wang)頁都列進去。如果網(wang)站(zhan)比較大,網(wang)站(zhan)地圖(tu)還可(ke)以分成幾個。
網(wang)站的所有頁面都要(yao)能從主頁開始,順著(zhu)鏈接找到,最好在3,4次(ci)點擊之內(nei)。
搜索引擎蜘蛛找到(dao)網(wang)頁(ye)后能不能抓取網(wang)頁(ye)?
網頁的URL必須是可以被抓取的,如果網頁是由數據庫動態生成的,那么URL一般要經過改寫成靜態的,也就是去掉那些URL中問號參數之類的東西, 也要去掉Session ID。技術上倒不是搜索引擎不能讀取這種URL,但是為了避免陷入無限循環,搜索引擎蜘蛛(zhu)通常要(yao)遠離(li)這類URL。
還有如果你的網站是一個整個的flash,那也沒辦法讀取。雖然搜索引擎在努力想讀取flash信息,但目前(qian)為(wei)止收(shou)效(xiao)甚微。
還有框架結構(frame),在網站剛出現的時候,框架結構風行一時,現在還有不少網站在用,這是搜索引擎蜘蛛(zhu)的(de)大敵。有的(de)時(shi)候(hou)可以(yi)抓取(qu),但別(bie)自(zi)找麻(ma)煩。
還有盡量去除不必要的搜索引擎不能讀的東西,像音頻文(wen)件(jian),圖片(pian),彈出(chu)窗口(kou)等。
搜索引擎蜘(zhi)蛛抓取網頁(ye)之(zhi)后,怎樣提煉有用信息?
網頁(ye)的HTML碼必須(xu)很優(you)化,也(ye)就(jiu)是格式(shi)標簽占的越(yue)少(shao)越(yue)好,真正內容(rong)占的越(yue)多(duo)越(yue)好,整個文件(jian)越(yue)小(xiao)越(yue)好。把(ba)CSS,JavaScript等放在(zai)外(wai)部(bu)文件(jian)。
把關(guan)鍵詞(ci)放在(zai)應(ying)該出現(xian)的地方。
檢查網頁對不同操作系統(tong),不同browser的兼容性。檢查是(shi)否符合W3C標(biao)準。
只有搜索引擎能順利找到你的所有網頁,抓取這些網頁并取出其中真正的有相關性的內容,這個網站才可以被視為是搜索引擎友好的。
旗下網站:耐思智慧 - - - 中文(wen)域名:
耐思智慧 © 版權所有 Copyright © 2000-2025 szjicheng.cn,Inc. All rights reserved
備案號碼:
公安備案號:
聲明:本網站中所使用到的其他(ta)各種(zhong)版(ban)權內(nei)(nei)容(rong)(rong)(rong),包括但不限于文章、圖片、視頻、音頻、字體等內(nei)(nei)容(rong)(rong)(rong)版(ban)權歸(gui)原作者所有(you),如權利所有(you)人(ren)發(fa)現,請(qing)及時告知,以便我們(men)刪除(chu)版(ban)權內(nei)(nei)容(rong)(rong)(rong)
本站程序界面、源代碼(ma)受相(xiang)關法(fa)律(lv)保護(hu), 未經授權(quan), 嚴禁使用; 耐思智慧 © 為我公(gong)司注冊(ce)商標, 未經授權(quan), 嚴禁使用
法律顧問: