|
4 Z* [6 M0 |3 i1 A( N 百度互联网创业俱乐部搜 & ]5 \& n; k% `) o
索引擎优化指南
5 q. z, x |! I, l% c6 x- }) a. i版本号:V1.0 . p9 b, }; t1 W* m, R5 G/ Z1 }& a( A
@ Baidu 2010
9 {; i m' D! ~. G2 百度搜索引擎优化指南 0 ^0 \" \, H7 ^" T1 e2 g. k, q4 G
3 x3 c) Y/ L' S 6 @/ V% q1 o3 M' L5 ~! n2 H5 l
6 s! {0 _- D* N6 q2 j( F
前言
) S& ^, k5 ^# h' I$ ~SEO(Search engine optimization,搜索引擎优化),指为了提升网页在搜索引擎
, ^5 r& f. M; o2 t( n( Z; v自然搜索结果中(非商业性推广结果)的收录数量以及排序位置而做的优化行为,这一行为
" g0 q" O7 x3 h0 [8 q- y的目的,是为了从搜索引擎中获得更多的免费流量,以及更好的展现形象。而SEM(Search
; U/ d; A! d6 K3 Iengine marketing,搜索引擎营销),则既包括了SEO,也包括了付费的商业推广优化。
# k1 {* t& k" N1 a2 o- F2 A毋庸讳言,SEO 自从1997 年左右出现以来,就和搜索引擎处于某种对立状态。这种 % K6 p: I0 H) o7 ~
对立源于两方面:
/ P; j) C: Z* A3 S一方面,大量SEO 行为只考虑了如何获得更多的“免费”流量,至于多的这些流量是否
3 ]" V4 }" O+ H q5 F+ J( t符合搜索用户价值,则不在考虑范围之内。这种SEO 被称为“黑帽”,历来受到搜索引擎的
" k# L3 H# |9 a& ]5 y严厉打击。 ' U- i$ t) W4 q* b" ~; S v: _
另一方面,SEO 的目的是为了获取更多的“免费”流量,这和搜索引擎的商业推广是对立
# O$ o9 m- M! H* ~( @1 [的。所以很多SEO 的从业者,包括相当多的搜索引擎从业者,从心底里认为,两者的利益 ! R; _% h$ C/ S& a# j7 Q
就是不可调和的。
- j* ]0 k+ }% K$ N0 {& J但如果从更加长远的角度来看,搜索引擎和SEO 从业者的利益,实际是有高度一致的 ) d% V f1 i* e; L" g2 E$ k! E
地方的:
: Q M8 T0 W0 W7 e, @" S+ J首先,搜索引擎的搜索质量改善,很大程度上受到资源形态的影响。比如很多优质资源,
4 g1 [$ g3 d2 W: ^是用Flash 或者Ajax 做的,搜索引擎就无法很好的爬取和索引。搜索引擎无法独立承担起
3 I2 D5 O$ Z$ N9 D& i4 T这个引导教育职责,有了SEO 参与其中,这些优质资源就可以更好的发挥其检索效果,改 3 A/ H% }- Z" \# A+ u
善用户搜索体验。
. Y+ i( y; R, f7 t! I: J1 T其次,SEO 从业者也是搜索引擎商业价值很好的布道者。尤其对于中国这样的新兴市
# B2 D" d4 c+ I. i场,传统的中小企业对于如何触网,如何做互联网营销,并无多少经验。SEO 在其中可以 * G( x/ J8 q* j$ W8 f- R
扮演非常重要的角色。而这种布道,对于搜索引擎产业价值的拓展,是很有好处的。 , W& n5 U% P& ^
基于以上原因,我们需要重新审视搜索引擎和SEO 之间的关系。两者宜建立起一种更 5 D) K' i6 M: B+ {/ s. `
加良性的共生关系,驱逐劣币,提携良币,以使互联网生态圈得到更加健康有序的发展。百
0 s# q+ D3 J' \" o度作为中文搜索领域的领导者,有责任和义务来推进这个事情。这也是本文档发布的初衷。
& M- `& X+ J$ Q4 |' m( R# r8 m我们先来看一下过去的问题所在。
" d' j, a) b! I(1) 黑帽SEO 大行其道,占据了SEO 主流话语权 . O* S `* F! ] q& P. F5 Q
黑帽SEO 行为,通常就是一般所谓的“搜索引擎作弊”。利用和放大搜索引擎的策略缺 5 {4 x- a" u% W$ h
陷(实际上完美的系统是不存在的)获取更多用户访问量。而这种更多的访问量,是以伤害
7 M+ Y8 B0 g- M) |+ b4 c# R+ [3 百度搜索引擎优化指南 2 ]5 a! i/ v/ [& q- [
用户体验为代价的,而这会危及一个搜索引擎的生存基础。所以,面对这样的行为,如果短 ; S `5 i8 I+ l
期内无法修补系统,搜索引擎也会通过一些临时策略进行遏制以免事态的失控。在作弊领
& I6 b% `) @; j; r/ X8 C0 e域,破窗效应是非常明显的。 " _6 y# ?1 ?' z8 F1 v$ {) v
很多人会说,整天说作弊作弊,到底哪些行为是作弊?这是无法穷尽的。互联网在动态
( K z) h( L; }! c# h! R; Z- U; D# V6 L的发展,搜索引擎也在动态的发展,作弊行为自然也是在动态的发展。最基本的界定法则, " C$ c2 S6 N! ~$ w5 K1 `
就是这个行为的泛滥,是否会影响搜索系统,最终伤害到用户的搜索体验。 1 _) K# L; {3 ]3 |
对黑帽SEO 行为放任不管,不仅会造成搜索引擎质量的下降,还会恶化互联网生态环
& o" U) C( J- `5 b' E% ], u境,并使得良性的建站积极性受到打压,最终形成劣币驱逐良币的恶劣后果。在过去,黑帽
8 M& c0 C4 l: ]( B* oSEO 者面对惩罚,振振有词,甚至将搜索引擎告上法庭,这种状况,严重影响了正常的舆
2 \" E g5 f0 C5 y/ s( q论氛围。这是我们必须要去扭转的。
+ h' [1 i8 |: U2 K总之,搜索引擎和黑帽SEO 行为之间的矛盾,是不可调和的;过去如此,现在如此,
- m$ `' O2 Q8 x3 C将来也一定如此。打击黑帽SEO,会始终是搜索引擎质量控制的关键环节之一。而营造黑 , v# @* [! ^ S5 Y
帽SEO 者“老鼠过街,人人喊打”的舆论氛围,也是我们需要努力的目标。 R0 d7 k, W9 }2 t
(2) 白帽SEO 行为得到的指引不够清晰
+ M, v/ Z) O, }6 }* x所谓白帽SEO,就是能起到改良和规范网站设计,使之对搜索引擎和用户更加友好, & J( e6 L8 _' }* x1 ]
并从中获取更多合理流量的优化行为。但过去的问题在于,我们过去较少的界定,什么样的 - S$ R* e" i* ~ w; [6 N. c6 x
行为是推荐的。这导致很多白帽优化心存顾虑。 ) H/ i- c! W; n* O' W4 c4 @, H" W7 B
正是鉴于上述问题,百度决定提供更加公开化的白帽SEO 指南,营造更好的舆论氛围, 9 r- t. V4 `) _ v! n
以使SEO 行业,有更加良性的发展。 ( K$ C+ M/ a1 C* D! o, }; B
需要指出的是,我们所颁布的SEO 指南,虽然听取了众多站长的意见和建议,但离完 5 N. j- {( |+ P! F5 s5 S
美仍有相当距离。所以,我们会通过“百度站长俱乐部”这个渠道, 收集更多的建设性意见,
- [$ R3 T8 @( d$ U* e2 r v7 f来不断的完善这一指南。
0 \" d! F1 D" x. H K5 h4 百度搜索引擎优化指南 + h3 z Y/ u" B/ d
目录 & l: x. k: r% z; x
前言.. 2 ) e1 G/ z1 A. S
目录.. 4
) o, o! M7 g- B: N6 s9 ]5 l1 前期准备.................................................................................................................... 5
1 r6 {! {* z3 G* C* [( C/ q1.1 域名注册.................................................................................................................... 5
% M6 j6 [# d3 a8 \: X8 q, y1.2 服务器、空间租用..................................................................................................... 5 6 o6 T; S. [3 i0 g
2 面向搜索引擎的网站建设.......................................................................................... 6 0 V [: e' q* M/ g
2.1 良好收录.................................................................................................................... 6
/ D: f' C1 u5 @& k2.2 良好排序.................................................................................................................. 11
# m: y2 l$ d; a% x' z2.3 良好展现.................................................................................................................. 13 ) |, t7 _) v- A; `
3 网站运营.................................................................................................................. 15 % s( h2 L1 {; J# T- q8 O
3.1 目标=转化率............................................................................................................ 15 " L0 I Q: G/ \" h' R2 Z
3.2 搜索引擎流量分析................................................................................................... 15
/ F3 Q8 R6 @( |7 q3.3 网站信任度.............................................................................................................. 16 . {9 c; J z3 O
3.4 不断强化品牌概念................................................................................................... 16 9 U% F. G# v0 _$ j9 d/ d
4 作弊与惩罚.............................................................................................................. 16 + {; h5 c0 I5 E' p. \
4.1 百度如何定义作弊................................................................................................... 16 7 T3 l1 j- }) o! m! T3 l5 b. `8 J
4.2 作弊会受到怎样的惩罚............................................................................................ 18
2 E8 ?& r' o r# N2 y5 G4 b& X4.3 改正后能否解除惩罚? ............................................................................................ 18
3 r* ?8 m% c; d5 联系与反馈.............................................................................................................. 18
; _0 [9 i; T" s* R6 O6 关于百度的十万个为什么........................................................... 错误!未定义书签。 + l! T$ N& Y: R
5 百度搜索引擎优化指南 8 [4 L9 `7 q' N( e
1 前期准备
* \ \7 \, g) S4 x" I. y域名和服务器空间是网站建设的基础。
! `- G% t; z+ Y1 E4 O, G2 E1.1 域名注册 : M1 s) c; R% f# f7 u! N; A' c
域名是用户对网站的第一印象,能否让用户迅速记住域名对网站发展非常重要。建议注 + L6 ^% `: o# }
册域名时选择容易让用户记忆、容易产生信任感的域名,这样可以提高回头率,并方便用户
3 N T3 V4 e& a5 s+ B' m0 l$ W推荐。
Z* {+ f! b" l) U1 R(1) 域名尽量简短,越短的域名,用户的记忆成本就越低
, b) O& {3 n% f- D0 Z$ L4 H(2) 域名可以和网站主题或网站名称相呼应,让人看到域名就能联想到网站内容,比如 1 l. b+ a" n! M& _% O* h
使用公司名称、商标、网站名称或者公司产品等信息来选择域名 & c2 X- S& S! d6 U
(3) 使用何种形式的域名后缀对百度网页搜索没有影响,但域名后缀也需要考虑方便用 `* R4 w2 I- x/ I9 a( [7 v( O
户记忆。.com、.cn、.net 等常见的域名后缀用户更容易记忆,一些不常见的后缀可
8 E4 n, O5 {4 @& e0 z, }$ L能会让用户产生不信任感,增加用户的判断成本。
3 C+ f& Z, O9 t- l1.2 服务器、空间租用
9 B' k; T1 {; G& ]服务器、空间的速度和稳定性直接影响网站的用户体验,也会影响搜索引擎的抓取。建
6 `: V3 o- e" C- V9 v" v议选择服务稳定、速度快的服务器或者空间。 . ~$ L3 ?* I/ G# D' C" H
(1) 选择有实力的正规空间商 ! ~4 @2 L1 \5 r+ [8 Y
服务器和空间的稳定性需要一定的技术实力来保障,一些没有实力的空间商,可能无力 % t+ q' c1 N( t }. C4 [% Y
提供良好的服务,服务的稳定性无法保证。甚至有空间商为了节省资源,故意屏蔽掉 / q2 `' ^- r6 c! i
Baiduspider 的抓取,导致网站无法被百度网页搜索收录。
+ A5 B2 s+ |) m) c(2) 保证用户的访问速度和稳定性
& c% v# F9 A r9 C8 P! Y6 E$ `(3) 根据网站规模和要提供的服务来决定选择购买何种空间(服务器)
# f7 z$ `6 ?/ `+ ^& ?2 V通常空间都会有流量、连接数以及功能上的限制,因为是多个网站共用一台服务器,稳 / d+ d& r6 o) F2 Z" l+ A* ?
定性会受到影响,但价格便宜;服务器各种限制较少,可以更自主的管理,但价格较贵。可 9 P* B% d) B8 R( K
以根据自己的需求来进行合理的选择。
, e/ ?6 Q" U* m" b- q(4) 根据用户群分布选择接入商
3 Q% J1 k- u) K% |- r/ w2 L由于互通问题的存在,选择接入商也很重要,如果用户群主要在联通,就尽量选择联通
2 \9 t* C' c7 \( K5 P, n) @7 ^0 T访问较好的接入商,如果用户群主要在电信,则选择电信访问较好的接入商。如果用户群在 9 {1 E j: y5 z; @% Y
全国,那就选择一家互通处理的比较好的接入商。 1 w4 l1 d/ J6 h J
6 百度搜索引擎优化指南 8 g: t% H, x2 m! X
购买之前,可以先找一两个空间商现有的客户网站,测试访问情况如何。
' `' B- `+ d6 z/ V2 面向搜索引擎的网站建设 & B; v% b5 \' z1 o6 T* G
搜索引擎只是网站上一个普通的访客,对网站的抓取方式、对网站/网页的价值判断,
6 T6 S" E2 w; Y% S也都是从用户的角度出发的,任何对用户体验的改进,都是对搜索引擎改进。对搜索引擎的
7 b1 O5 n' d" N: n优化,同时也会让用户受益。
1 u0 v% C: `3 x$ x面向搜索引擎的网站建设,主要分为三个部分:如何更好的让搜索引擎收录网站中的内
; L& \% C X* P- T! u9 U; w容、如何在搜索引擎中获得良好的排名、如何让用户从众多的搜索结果中点击你的网站。简
7 i8 m0 A6 ?" h/ L! T1 N单来说,就是收录、排序、展现。下面我们将从这三个方面分别介绍。 0 Y# j" k8 v1 l! o. j6 z
2.1 良好收录 , T' D" N0 S' T2 \% O6 w- V" |
2.1.1 机器可读 % a9 D/ o* y0 y6 l+ x" ^
百度通过一个叫做Baiduspider 的程序抓取互联网上的网页,经过处理后建入索引中。
+ L0 J: i+ N3 m1 g) t. A- x1 r目前Baiduspider 只能读懂文本内容,flash、图片等非文本内容暂时不能处理,放置在flash、
7 u" Y. W0 r& |) E- x图片中的文字,百度无法识别。 9 | o3 U0 t8 ~$ ^/ T3 n2 I
建议使用文字而不是flash、图片、Javascript 等来显示重要的内容或链接,搜索引擎
2 s$ Z9 R9 q2 p V# `' G暂时无法识别Flash、图片、Javascript 中的内容,这部分内容无法搜索到;仅在flash、
0 m2 H2 d0 d* K. P2 G+ l ZJavascript 中包含链接指向的网页,百度可能无法收录。
d7 |/ E; ?. G7 A" U9 @冘 使用文字而不是flash、图片、Javascript 等来显示重要的内容或链接
) a. I) ]7 i& r6 }+ w- C1 G冘 如果必须使用Flash 制作网页,建议同时制作一个供搜索引擎收录的文字版,并在首页 $ M9 u3 k# @$ l
使用文本链接指向文字版
+ b2 _) x( s- \; H+ y冘 Ajax 等搜索引擎不能识别的技术,只用在需要用户交互的地方,不把希望搜索引擎“看”
: t3 Z0 A: g/ F. [& T到的导航及正文内容放到Ajax 中 9 Z& a/ `) E* P4 Y, T. t, D
冘 不使用frame 和iframe 框架结构,通过iframe 显示的内容可能会被百度丢弃 - v9 F$ h- R) B: l6 E
我们建议:
( j" G, N7 i8 V" _" N7 百度搜索引擎优化指南
/ P7 P- [" N* R& G上面例子中,虽然网页上提供了很丰富的信息,但由于信息都在falsh 中,搜索引擎无法提取,对 ( R$ |# n* K* `$ B: K1 l& O2 v
搜索引擎来讲,这个网页没有任何内容。
% n' d5 U5 g! o* x9 V7 W3 ~2.1.2 网站结构
, t7 u$ U- w( U8 @! O3 U网站应该有清晰的结构和明晰的导航,这能帮助用户快速从你的网站中找到自己需要的 $ K) t( g# U+ g
内容,也可以帮助搜索引擎快速理解网站中每一个网页所处的结构层次。 ( L, _5 n$ Z- W1 y% X. F- B
网站结构建议采用树型结构,树型结构通常分为以下三个层次:首页——频道——文章 : a* l9 K5 g7 d; T h
页。象一棵大树一样,首先有一个树干(首页),然后再是树枝(频道),最后是树叶(普通
Q) R# c2 u m2 d内容页)。树型结构的扩展性更强,网站内容变多时,可以通过细分树枝(频道)来轻松应
0 e3 N$ y; j1 V对。
+ t0 o: E5 y4 G+ w) b/ S理想的网站结构应该是更扁平一些,从首页到内容页的层次尽量少,这样搜索引擎处理 , \( v# ^7 Y( M
起来,会更简单。
6 c, w' Q5 ^ F8 O0 s, O同时,网站也应该是一个网状结构,网站上每个网页都应该有指向上、下级网页以及相
2 M7 d/ m' H4 U关内容的链接:首页有到频道页的链接,频道页有到首页和普通内容页的链接、普通内容页 + X2 A6 \4 H, t5 s, k) E3 s
有到上级频道以及首页的链接、内容相关的网页间互相有链接。
8 C! E* M# V; D5 U4 m网站中每一个网页,都应该是网站结构的一部分,都应该能通过其他网页链接到。 2 Y, i, `/ r4 q0 a' d
总结一下,合理的网站结构应该是一个扁平的树型网状结构.........。
( _) o2 O- P& y J: v4 ~冘 确保每个页面都可以通过至少一个文本链接到达。 6 C4 w+ @3 i6 C, s
冘 重要的内容,应该能从首页或者网站结构中比较浅的层次访问到。 - Z9 z; o: t. d' p$ O, D8 l
我们建议: , t2 }# j3 w: z" e, |$ `2 a
8 百度搜索引擎优化指南 6 N8 [4 J; K6 j; t7 k4 E3 l+ I$ o
冘 合理分类网站上的内容,不要过度细分。
6 }2 W4 A) E) f3 O: n网站应该有简明、清晰的导航,可以让用户快速找到自己需要的内容,同时也可以帮助
0 f" r. n2 D0 z2 @3 W搜索引擎更好的了解网站的结构。
4 g0 `) B) O1 U$ z7 [2 y冘 为每个页面都加上导航栏,让用户可以方便的返回频道、网站首页,也可以让搜索引擎
) `6 t4 v D5 K方便的定位网页在网结构中的层次。
3 v* l* g8 i1 P+ Z9 j/ C冘 内容较多的网站,建议使用面包屑式的导航,这更容易让用户理解当前所处的位置:网
! M& a+ w+ N `# u+ G站首页> 频道> 当前浏览页面 % w( t+ B8 y: E
通过面包屑导航,用户可以很清楚的知道自己所在页面在整个网站中的位置,可以方便的返回上
* F9 {, I) j0 y" {: t/ J一级频道或者首页也很方便。
4 Z0 u: w' J* K6 F6 Z' c0 a; n冘 导航中使用文字链接,不使用复杂的js 或者flash ; T) |+ s* U8 g% o. o* @! p. C
冘 使用图片做导航时,可以使用Alt 注释,用Alt 告诉搜索引擎所指向的网页内容是什么
1 }3 p- f6 ]' R. E& p9 I* v2.1.3 子域名与目录的选择
( l$ B6 S+ g7 l选择使用子域名还是目录来合理的分配网站内容,对网站在搜索引擎中的表现会有较大
/ I7 M8 R) a/ M+ \1 _的影响。 $ d8 X1 W6 t# P5 y q( Y4 C
冘 在某个频道的内容没有丰富到可以当做一个独立站点存在之前,使用目录形式;等频 6 r; d% [! ?; q% y
道下积累了足够的内容,再转换成子域名的形式 , W5 m T9 |0 n4 }, G( ?
一个网页能否排到搜索结果的前面,“出身”很重要,如果出自一个站点权重较高的
+ _1 D3 Y% z" w+ L网站,那排到前面的可能性就越大,反之则越小。通常情况下主站点的权重是最高的, ! ^( t \- B7 N8 _; ^
子站点会从主站点继承一部分权重,继承的多少,视子站点质量而定。
O+ w5 \( Z; \在内容没有丰富到可以做为一个独立站点之前,内容放到主站点下一个目录中能在 . _* c2 R7 Z. O A4 F4 g
搜索引擎中获得更好的表现。 / ]( r8 D" @6 t9 P
冘 内容差异度较大、关联度不高的内容,使用子站点形式 % T! o' H5 h3 j4 E+ S% {6 t
搜索引擎会识别站点的主题,如果站点中内容关联度不高,可能导致搜索引擎错误
2 n* p# I9 V' I5 N9 F* `6 b的识别。关联度不高的内容,放在不同的子域名下,可以帮助搜索引擎更好的理解站点 , z% ?! R" r) o* W0 `# p3 l
的主题。
* P1 Q. [, y! Q; a- W- c6 z7 h冘 域名间内容做好权限,互相分开,a. example.com 下的内容,不能通过b.
+ }4 n/ `5 U1 Y/ Z% f+ O8 Iexample.com 访问
# d% Y6 I& ^6 R5 m% I; j子域名间的内容可以互相访问,可能会被搜索引擎当做重复内容而进行除重处理, + m* H$ y/ ~6 b& t
我们建议: " q/ J( A5 X4 o7 B" U
我们建议:
: X* G% r+ |' t4 V4 \( A8 B6 d% P2 b6 P9 百度搜索引擎优化指南
! ~7 ^9 Z& N- d, k/ B/ D保留的url 不一定是正常域名下的。
. m, j. Y) }1 I/ N3 P! z: p冘 不要滥用子域名 2 j; Q1 e2 @" D" P/ `
无丰富内容而滥用大量子域名,会被搜索引擎当做作弊行为而受到惩罚。
|