|
( k- ?: G' i$ G
百度互联网创业俱乐部搜
' X: g; e1 {( q" K( x [& p" T索引擎优化指南
' M' d1 ^* L8 D版本号:V1.0
/ w5 O6 [4 p$ Y- }@ Baidu 2010 . R9 j0 t6 ], g% H% }
2 百度搜索引擎优化指南 2 S5 D1 B/ s1 ^0 T" J, ?
: V2 ]. j& F5 a% p! O" A0 |, r! a
* |( M1 K$ L' P2 ]0 d
# k& ]; G7 R* c! D" r前言 % L8 I% G1 s! c' D! p, J( e7 S# c
SEO(Search engine optimization,搜索引擎优化),指为了提升网页在搜索引擎
/ P1 ~; T( @' ^, f- M自然搜索结果中(非商业性推广结果)的收录数量以及排序位置而做的优化行为,这一行为 . U1 I' K7 ]" o6 X
的目的,是为了从搜索引擎中获得更多的免费流量,以及更好的展现形象。而SEM(Search / \, P# P6 Z# S9 _; d/ J ~% |
engine marketing,搜索引擎营销),则既包括了SEO,也包括了付费的商业推广优化。
9 |9 \# E( B6 X' b毋庸讳言,SEO 自从1997 年左右出现以来,就和搜索引擎处于某种对立状态。这种
e$ h. @% D7 u5 [3 t7 o对立源于两方面:
7 Q; t- Y* v# _1 @一方面,大量SEO 行为只考虑了如何获得更多的“免费”流量,至于多的这些流量是否
$ W4 O# r. ~: V2 V; ~7 S6 T符合搜索用户价值,则不在考虑范围之内。这种SEO 被称为“黑帽”,历来受到搜索引擎的 * q6 v1 C: u' X6 Z+ }( ]
严厉打击。 ' {% x' B( w; U( {
另一方面,SEO 的目的是为了获取更多的“免费”流量,这和搜索引擎的商业推广是对立
# L, G( i2 T# B' I k4 B的。所以很多SEO 的从业者,包括相当多的搜索引擎从业者,从心底里认为,两者的利益 3 x& w4 f% c; a+ O
就是不可调和的。
; a2 }$ e/ J# X- H5 f但如果从更加长远的角度来看,搜索引擎和SEO 从业者的利益,实际是有高度一致的 ' A1 }, `1 k8 y4 X& ]( Q! A9 a/ z2 P/ g
地方的:
3 K, B* B9 {' c @; s0 Y首先,搜索引擎的搜索质量改善,很大程度上受到资源形态的影响。比如很多优质资源,
- B8 N- [& y8 ~' t6 @是用Flash 或者Ajax 做的,搜索引擎就无法很好的爬取和索引。搜索引擎无法独立承担起 . e$ R7 V g# m* F
这个引导教育职责,有了SEO 参与其中,这些优质资源就可以更好的发挥其检索效果,改 * O3 |! X5 Q/ g$ F$ Y! W
善用户搜索体验。 ( `4 v7 U( t& _" |# m
其次,SEO 从业者也是搜索引擎商业价值很好的布道者。尤其对于中国这样的新兴市
3 X: H* q# }; m场,传统的中小企业对于如何触网,如何做互联网营销,并无多少经验。SEO 在其中可以 & Z" q; |! ?: v
扮演非常重要的角色。而这种布道,对于搜索引擎产业价值的拓展,是很有好处的。
6 {) r8 ~8 }) h8 `1 o* p) m6 I- s基于以上原因,我们需要重新审视搜索引擎和SEO 之间的关系。两者宜建立起一种更
1 ^0 M5 x* G! k: @& P加良性的共生关系,驱逐劣币,提携良币,以使互联网生态圈得到更加健康有序的发展。百 9 N0 t5 d& Y) P4 o, K7 e: y2 e
度作为中文搜索领域的领导者,有责任和义务来推进这个事情。这也是本文档发布的初衷。
3 G" L' }# S" k; M我们先来看一下过去的问题所在。 ; q" b# j+ @2 N3 B9 y- i' [$ A
(1) 黑帽SEO 大行其道,占据了SEO 主流话语权
J5 A, F9 d) K" v" [3 L! A黑帽SEO 行为,通常就是一般所谓的“搜索引擎作弊”。利用和放大搜索引擎的策略缺 # d; I: \" w3 \* A
陷(实际上完美的系统是不存在的)获取更多用户访问量。而这种更多的访问量,是以伤害 9 q4 a( |, A" L7 ~" u5 b
3 百度搜索引擎优化指南 3 n V: r* b) E: |0 q! ]: j8 ^
用户体验为代价的,而这会危及一个搜索引擎的生存基础。所以,面对这样的行为,如果短
( Y* B3 l6 h" g4 Y期内无法修补系统,搜索引擎也会通过一些临时策略进行遏制以免事态的失控。在作弊领 1 f: Y( J, x) f, g! G3 p& U3 w. f
域,破窗效应是非常明显的。
1 C9 y3 r/ D8 a" G. g& a3 e很多人会说,整天说作弊作弊,到底哪些行为是作弊?这是无法穷尽的。互联网在动态 3 I% X# H z7 K! Q
的发展,搜索引擎也在动态的发展,作弊行为自然也是在动态的发展。最基本的界定法则,
. k7 t# j b$ X" z* F就是这个行为的泛滥,是否会影响搜索系统,最终伤害到用户的搜索体验。
! i6 i1 A f" g0 ]/ j0 U对黑帽SEO 行为放任不管,不仅会造成搜索引擎质量的下降,还会恶化互联网生态环 0 R+ z7 d; N4 |6 F9 ~5 }$ @
境,并使得良性的建站积极性受到打压,最终形成劣币驱逐良币的恶劣后果。在过去,黑帽
0 Z2 p* N. [) Y4 \SEO 者面对惩罚,振振有词,甚至将搜索引擎告上法庭,这种状况,严重影响了正常的舆 ; P1 x3 I9 z7 i, a$ L3 P3 z2 [2 ?
论氛围。这是我们必须要去扭转的。 + d5 ?5 N4 w) T3 R5 L* n
总之,搜索引擎和黑帽SEO 行为之间的矛盾,是不可调和的;过去如此,现在如此, 9 e( Q" T) n, q7 Z5 U
将来也一定如此。打击黑帽SEO,会始终是搜索引擎质量控制的关键环节之一。而营造黑
/ {9 K$ [3 Q% _9 F帽SEO 者“老鼠过街,人人喊打”的舆论氛围,也是我们需要努力的目标。 . z: |3 ^( B' g r. L! [! K
(2) 白帽SEO 行为得到的指引不够清晰 + j" {: b8 G; d; ~' h
所谓白帽SEO,就是能起到改良和规范网站设计,使之对搜索引擎和用户更加友好,
% l0 Z& w9 v+ n0 w并从中获取更多合理流量的优化行为。但过去的问题在于,我们过去较少的界定,什么样的 , V* B" V2 g! N% l( q5 b
行为是推荐的。这导致很多白帽优化心存顾虑。 ) Z) L w0 E4 x2 m
正是鉴于上述问题,百度决定提供更加公开化的白帽SEO 指南,营造更好的舆论氛围,
0 R& V \- s5 p. V) C) H以使SEO 行业,有更加良性的发展。
8 P% r+ D! N9 F6 R/ Z需要指出的是,我们所颁布的SEO 指南,虽然听取了众多站长的意见和建议,但离完
8 f2 K! o4 o, M- }9 [5 @: A美仍有相当距离。所以,我们会通过“百度站长俱乐部”这个渠道, 收集更多的建设性意见,
& d5 j: C7 v, i8 T来不断的完善这一指南。
$ P5 H) S3 L+ a$ z) e" \4 百度搜索引擎优化指南
: ^! W4 Q+ H' z目录 : J& T y0 {2 a
前言.. 2
6 M" v6 u$ `* V. F目录.. 4
& | i: i w% L" V" L( o7 @1 前期准备.................................................................................................................... 5
' g3 H6 p$ s7 r+ Q: x: x1 I1.1 域名注册.................................................................................................................... 5 _% a7 T3 @$ z1 x, b( y. L, W% Y
1.2 服务器、空间租用..................................................................................................... 5
8 e# }' R4 m1 o9 v; b8 ~ `& E6 C2 面向搜索引擎的网站建设.......................................................................................... 6
* ]% }: F+ x& D* \/ r) B+ q R2.1 良好收录.................................................................................................................... 6
" }5 M; n( v7 o; f5 | N& s0 ~2.2 良好排序.................................................................................................................. 11 ) Z& B5 j, _1 g( a, a! D
2.3 良好展现.................................................................................................................. 13
' b7 \, b" n v: i3 ]* J# G' S d1 \3 网站运营.................................................................................................................. 15
?4 z( Q$ @) s/ e3.1 目标=转化率............................................................................................................ 15 7 y; p& m9 i( l8 O5 b: h+ \
3.2 搜索引擎流量分析................................................................................................... 15
* R; a* i6 Y" n5 q$ e: G. e3.3 网站信任度.............................................................................................................. 16
( W! R8 T i# }* E) u3 M% q3.4 不断强化品牌概念................................................................................................... 16
9 I, b6 l" w% I) a& _4 作弊与惩罚.............................................................................................................. 16 2 ?5 h% G" K" D
4.1 百度如何定义作弊................................................................................................... 16 1 I- n A- w( ~! E% Q/ W
4.2 作弊会受到怎样的惩罚............................................................................................ 18
) k8 _# f& @" A* J2 Q/ v4.3 改正后能否解除惩罚? ............................................................................................ 18
7 u2 J+ G. q+ Q5 联系与反馈.............................................................................................................. 18
' A0 A3 b7 a1 \5 s6 关于百度的十万个为什么........................................................... 错误!未定义书签。
8 M8 Q0 c6 c L4 ?+ \# Z) h5 百度搜索引擎优化指南
6 K e. i J8 a, B4 i& J& w1 前期准备 T- O0 J% o" _4 C& q
域名和服务器空间是网站建设的基础。
u4 R( C( q o# W1.1 域名注册
5 k& [/ A: G" u+ q: Q域名是用户对网站的第一印象,能否让用户迅速记住域名对网站发展非常重要。建议注 8 k4 Q2 i2 z1 u' I( e) i
册域名时选择容易让用户记忆、容易产生信任感的域名,这样可以提高回头率,并方便用户
8 O8 Q4 U' T. R# S! L推荐。
; D8 p. P" j; A6 k, e(1) 域名尽量简短,越短的域名,用户的记忆成本就越低 5 X5 w( F* ?& \! |! W$ H0 d& Z
(2) 域名可以和网站主题或网站名称相呼应,让人看到域名就能联想到网站内容,比如 3 k& ^3 ^ A0 I* S# S( P
使用公司名称、商标、网站名称或者公司产品等信息来选择域名
7 E, E7 N* h Q. c) S(3) 使用何种形式的域名后缀对百度网页搜索没有影响,但域名后缀也需要考虑方便用 ) z7 o+ d% j) @, W) m5 b9 `
户记忆。.com、.cn、.net 等常见的域名后缀用户更容易记忆,一些不常见的后缀可 ) J+ H8 Z I. k) I
能会让用户产生不信任感,增加用户的判断成本。
8 u5 t/ b! B" y/ G9 A1.2 服务器、空间租用 % }" W. R& x" ~3 t# }0 o: a( w- E
服务器、空间的速度和稳定性直接影响网站的用户体验,也会影响搜索引擎的抓取。建
* N% m o `) N3 g7 {$ @( a1 X/ R议选择服务稳定、速度快的服务器或者空间。 ( H2 f% c- m$ C- ~* E) N
(1) 选择有实力的正规空间商 . b8 P7 G/ }+ g/ z, ]# ^: ~8 a
服务器和空间的稳定性需要一定的技术实力来保障,一些没有实力的空间商,可能无力
7 e$ I' _/ x- c* G+ _- U! Q提供良好的服务,服务的稳定性无法保证。甚至有空间商为了节省资源,故意屏蔽掉
, D! k9 g/ |' S8 A# z- DBaiduspider 的抓取,导致网站无法被百度网页搜索收录。
: g% [7 S4 D/ k2 _" z(2) 保证用户的访问速度和稳定性 $ E4 g9 Q9 ^& b+ |0 S. t* Q! {
(3) 根据网站规模和要提供的服务来决定选择购买何种空间(服务器) ' _: Z( A2 |( Z5 L# O) S- v" z
通常空间都会有流量、连接数以及功能上的限制,因为是多个网站共用一台服务器,稳
6 ^( F3 u0 F! e9 y Z5 o( w& X b定性会受到影响,但价格便宜;服务器各种限制较少,可以更自主的管理,但价格较贵。可 + g) Z& e) q0 }2 K1 x
以根据自己的需求来进行合理的选择。 8 i9 }$ J+ U* z7 W0 J; T
(4) 根据用户群分布选择接入商 * _0 H8 I; |( b" p* E
由于互通问题的存在,选择接入商也很重要,如果用户群主要在联通,就尽量选择联通 8 T: P9 P, o3 M# R9 q3 U
访问较好的接入商,如果用户群主要在电信,则选择电信访问较好的接入商。如果用户群在
" ~7 K O# t1 \& V全国,那就选择一家互通处理的比较好的接入商。
3 p+ b2 j) c M7 a, N- v! R* y2 n6 百度搜索引擎优化指南 $ H+ Z# d. _ Z4 |
购买之前,可以先找一两个空间商现有的客户网站,测试访问情况如何。
* [. j6 B; [' Y7 Q3 Q6 w2 面向搜索引擎的网站建设 9 L3 |9 T% _( m! i& a! O9 {
搜索引擎只是网站上一个普通的访客,对网站的抓取方式、对网站/网页的价值判断,
) [. Y/ o! ^; \! J9 K# f0 G5 U( F也都是从用户的角度出发的,任何对用户体验的改进,都是对搜索引擎改进。对搜索引擎的
5 |) ]7 D# ?' s% z$ ?) y优化,同时也会让用户受益。 ) W* ?; F. R- n; d' _
面向搜索引擎的网站建设,主要分为三个部分:如何更好的让搜索引擎收录网站中的内 0 L: W+ ^1 G+ v* M- e' p9 e$ J
容、如何在搜索引擎中获得良好的排名、如何让用户从众多的搜索结果中点击你的网站。简 ) f6 |5 j# e9 J( E) { M& J
单来说,就是收录、排序、展现。下面我们将从这三个方面分别介绍。
! w* a/ c/ J) W) V$ C+ a" T, e; o! q4 m2.1 良好收录 ( @8 s, r6 q. L, {2 H
2.1.1 机器可读
' M% Q1 M B ~ \! g e% C百度通过一个叫做Baiduspider 的程序抓取互联网上的网页,经过处理后建入索引中。
" G, w8 G7 _! l目前Baiduspider 只能读懂文本内容,flash、图片等非文本内容暂时不能处理,放置在flash、
; V9 B; o4 `" O+ s3 @8 p# \6 X图片中的文字,百度无法识别。 . k/ `3 x8 Y4 z( G1 k8 {6 a' F
建议使用文字而不是flash、图片、Javascript 等来显示重要的内容或链接,搜索引擎 6 w7 y, W/ H8 _; w% r5 I7 c7 R
暂时无法识别Flash、图片、Javascript 中的内容,这部分内容无法搜索到;仅在flash、
3 P& l( B5 t/ Z" |Javascript 中包含链接指向的网页,百度可能无法收录。
& A+ A: l ~+ Q( M5 A0 q! M冘 使用文字而不是flash、图片、Javascript 等来显示重要的内容或链接 1 k6 l4 P% L+ x) ~: @
冘 如果必须使用Flash 制作网页,建议同时制作一个供搜索引擎收录的文字版,并在首页
, U: p! h/ Z) m使用文本链接指向文字版 & B! ^0 ^; R& d/ V( }7 c. P# b
冘 Ajax 等搜索引擎不能识别的技术,只用在需要用户交互的地方,不把希望搜索引擎“看”
+ i2 G; h5 L& B' r4 A C到的导航及正文内容放到Ajax 中 0 t1 _1 d, V* R% t; J
冘 不使用frame 和iframe 框架结构,通过iframe 显示的内容可能会被百度丢弃
- Y6 `/ U8 x- |- e我们建议: - r) u- h$ c7 o
7 百度搜索引擎优化指南 : e, W; p9 Q; X4 Y
上面例子中,虽然网页上提供了很丰富的信息,但由于信息都在falsh 中,搜索引擎无法提取,对
; G6 c! A2 b9 X& G搜索引擎来讲,这个网页没有任何内容。 ' D* l5 |5 A( @, Q- B' S, p8 B
2.1.2 网站结构
. ^8 d2 B& F) v9 W! b& a' s5 z' o网站应该有清晰的结构和明晰的导航,这能帮助用户快速从你的网站中找到自己需要的
% s: Z8 B1 B% `) K: n1 v内容,也可以帮助搜索引擎快速理解网站中每一个网页所处的结构层次。 0 R1 v7 E) o/ I4 v g3 Y' a1 G
网站结构建议采用树型结构,树型结构通常分为以下三个层次:首页——频道——文章
- j' @( T& c7 i9 D5 c9 ?, |页。象一棵大树一样,首先有一个树干(首页),然后再是树枝(频道),最后是树叶(普通
5 g0 x- S' G! N* B* J内容页)。树型结构的扩展性更强,网站内容变多时,可以通过细分树枝(频道)来轻松应
- q. b" i! O ^4 P" k9 j对。
, A N8 w( \' M理想的网站结构应该是更扁平一些,从首页到内容页的层次尽量少,这样搜索引擎处理
4 R- ^) V6 b3 s/ |9 c1 d+ Y3 A起来,会更简单。 ( A q& O d9 I& G
同时,网站也应该是一个网状结构,网站上每个网页都应该有指向上、下级网页以及相
9 Z3 V C' J1 I/ l关内容的链接:首页有到频道页的链接,频道页有到首页和普通内容页的链接、普通内容页 " K- a: c! ]+ {6 g# S: h) L/ K
有到上级频道以及首页的链接、内容相关的网页间互相有链接。 1 V8 {$ }: Z( ]# t) [! O; t
网站中每一个网页,都应该是网站结构的一部分,都应该能通过其他网页链接到。 1 @$ x# E$ d$ C2 a! T
总结一下,合理的网站结构应该是一个扁平的树型网状结构.........。
$ H# n- R( Y# U/ c( m. [& [( m冘 确保每个页面都可以通过至少一个文本链接到达。
8 K" m0 p2 Y. ~7 M+ q冘 重要的内容,应该能从首页或者网站结构中比较浅的层次访问到。
, r* b" E9 Y9 d" \ B3 Y5 p我们建议: & ^6 y. d/ m- _8 k/ t) y9 w! @
8 百度搜索引擎优化指南
$ D, ?0 V$ o* s5 o冘 合理分类网站上的内容,不要过度细分。 2 N0 |# _5 n: L6 M
网站应该有简明、清晰的导航,可以让用户快速找到自己需要的内容,同时也可以帮助
9 c y2 v# n) ]& t$ g B搜索引擎更好的了解网站的结构。
, u- R/ ~; P2 K7 N冘 为每个页面都加上导航栏,让用户可以方便的返回频道、网站首页,也可以让搜索引擎
6 l) ?1 U1 n; g0 J3 u" u3 u方便的定位网页在网结构中的层次。
: U7 \2 Q( I1 ~+ I4 P9 L' ^3 G' w9 p冘 内容较多的网站,建议使用面包屑式的导航,这更容易让用户理解当前所处的位置:网 0 m* s+ }& \ o8 i& e( \
站首页> 频道> 当前浏览页面
' O7 d4 A* h* j' ?通过面包屑导航,用户可以很清楚的知道自己所在页面在整个网站中的位置,可以方便的返回上
" A& ~; K8 j' a一级频道或者首页也很方便。
" O; c4 Z3 ]# m. u {; {& i: |冘 导航中使用文字链接,不使用复杂的js 或者flash ) k4 P5 o4 x* I, j; i8 b% e
冘 使用图片做导航时,可以使用Alt 注释,用Alt 告诉搜索引擎所指向的网页内容是什么 ( G' } H! V8 \2 a4 r M
2.1.3 子域名与目录的选择
/ O# v5 p7 l5 g! H- a选择使用子域名还是目录来合理的分配网站内容,对网站在搜索引擎中的表现会有较大 ' W4 ?( O' V8 f' o% a
的影响。
; g6 ^: @% e: n冘 在某个频道的内容没有丰富到可以当做一个独立站点存在之前,使用目录形式;等频
3 H/ V2 `8 k4 q; @, C3 b1 |道下积累了足够的内容,再转换成子域名的形式
6 Q4 F* p, u8 A! D( O8 ]一个网页能否排到搜索结果的前面,“出身”很重要,如果出自一个站点权重较高的
/ s2 u% j9 n! f' M8 w, G( O# `网站,那排到前面的可能性就越大,反之则越小。通常情况下主站点的权重是最高的, 1 q. r& W5 p, b4 H& a
子站点会从主站点继承一部分权重,继承的多少,视子站点质量而定。 / C4 X% V0 X! E4 Q2 g4 H
在内容没有丰富到可以做为一个独立站点之前,内容放到主站点下一个目录中能在
+ B/ M8 L/ H. O2 L搜索引擎中获得更好的表现。 # _1 ]! _1 h. G3 M- ^
冘 内容差异度较大、关联度不高的内容,使用子站点形式 , b3 f/ E( a) r4 V& [5 l8 [# K% q0 l
搜索引擎会识别站点的主题,如果站点中内容关联度不高,可能导致搜索引擎错误
% P% w- }) K+ p的识别。关联度不高的内容,放在不同的子域名下,可以帮助搜索引擎更好的理解站点
" W" o* y& J) o的主题。
7 y+ R( s+ h* y7 Q冘 域名间内容做好权限,互相分开,a. example.com 下的内容,不能通过b. 9 W3 [& s- V6 C( ?' k
example.com 访问 - a& K$ Z, t8 Q% _. Y
子域名间的内容可以互相访问,可能会被搜索引擎当做重复内容而进行除重处理, 1 U( l2 N' j; e8 A) e
我们建议:
% L2 B8 x5 _. c: n% Q/ j我们建议:
% I2 H+ s7 o7 v% h5 x9 百度搜索引擎优化指南 # f5 G- G7 v; o" s
保留的url 不一定是正常域名下的。
$ M5 v2 q/ i4 {& c$ U9 M冘 不要滥用子域名
' |- `) n8 x$ b# z" C3 B0 q无丰富内容而滥用大量子域名,会被搜索引擎当做作弊行为而受到惩罚。
|