|
1 ^1 F9 h% V! A o 百度互联网创业俱乐部搜 * F7 I6 P- @* q0 I1 r1 A$ T
索引擎优化指南 / D, Z! r+ S* b& F1 v6 {% V
版本号:V1.0
/ k/ h' z$ m7 U( F( L* `@ Baidu 2010 ( V3 T1 Y+ w; o7 W9 S% h
2 百度搜索引擎优化指南
* E4 {0 b/ b; W% s; l: u+ k
' v8 M5 c. s J j2 V/ X( y3 u
8 k8 |/ [4 p9 a / s b, {& e8 u) e7 C
前言 ! w* ^% K$ y! b/ X
SEO(Search engine optimization,搜索引擎优化),指为了提升网页在搜索引擎 F" {! i- f) i2 W* Z, U/ _
自然搜索结果中(非商业性推广结果)的收录数量以及排序位置而做的优化行为,这一行为
, a1 z9 c2 o. o& q+ j的目的,是为了从搜索引擎中获得更多的免费流量,以及更好的展现形象。而SEM(Search H7 n$ x. \1 z7 Y6 n
engine marketing,搜索引擎营销),则既包括了SEO,也包括了付费的商业推广优化。
1 q2 s8 n2 n! G0 f0 ]2 `7 ?毋庸讳言,SEO 自从1997 年左右出现以来,就和搜索引擎处于某种对立状态。这种
9 [( F+ A0 r: p8 w对立源于两方面: ! F% U' o/ E' ^: T3 K
一方面,大量SEO 行为只考虑了如何获得更多的“免费”流量,至于多的这些流量是否 ) [' l* [7 Z( J& O( S4 ?7 U; w
符合搜索用户价值,则不在考虑范围之内。这种SEO 被称为“黑帽”,历来受到搜索引擎的
/ p* v( o) v( @+ }0 u1 o严厉打击。
- i, r) d: t2 o- C另一方面,SEO 的目的是为了获取更多的“免费”流量,这和搜索引擎的商业推广是对立 - g! M4 d A$ `4 z( a
的。所以很多SEO 的从业者,包括相当多的搜索引擎从业者,从心底里认为,两者的利益
$ }, A2 J# q1 R9 j$ ]( e就是不可调和的。
) t2 O* t4 w$ W$ G+ j9 \但如果从更加长远的角度来看,搜索引擎和SEO 从业者的利益,实际是有高度一致的
6 [. b* q$ v/ K$ ^' H地方的: , t8 Q. X4 ?- a" @( U
首先,搜索引擎的搜索质量改善,很大程度上受到资源形态的影响。比如很多优质资源,
$ b# ^# ?$ l6 V( s; L是用Flash 或者Ajax 做的,搜索引擎就无法很好的爬取和索引。搜索引擎无法独立承担起
: v" f" f# x& d \9 W这个引导教育职责,有了SEO 参与其中,这些优质资源就可以更好的发挥其检索效果,改 " r: R+ h5 Y# L! D F
善用户搜索体验。 : N+ x! ~$ H$ h# o* q5 S5 X) B; l' V
其次,SEO 从业者也是搜索引擎商业价值很好的布道者。尤其对于中国这样的新兴市
. @+ `! b; l) ^! u& t9 L场,传统的中小企业对于如何触网,如何做互联网营销,并无多少经验。SEO 在其中可以
! F6 s* Q( x1 m2 F+ J$ i" o+ y; S扮演非常重要的角色。而这种布道,对于搜索引擎产业价值的拓展,是很有好处的。 3 O: O: b; G/ w8 Z8 |
基于以上原因,我们需要重新审视搜索引擎和SEO 之间的关系。两者宜建立起一种更
$ r1 J" l; U: {6 l8 Y4 ^# @加良性的共生关系,驱逐劣币,提携良币,以使互联网生态圈得到更加健康有序的发展。百 2 m! D5 f) G$ Z! |4 y
度作为中文搜索领域的领导者,有责任和义务来推进这个事情。这也是本文档发布的初衷。
( A8 [, _& q9 e: y5 x" w我们先来看一下过去的问题所在。
9 Y# u; J7 `4 @, Y. A/ Q(1) 黑帽SEO 大行其道,占据了SEO 主流话语权
; o; N5 ~2 F) b @! P. g2 ^8 i黑帽SEO 行为,通常就是一般所谓的“搜索引擎作弊”。利用和放大搜索引擎的策略缺 % e4 I% F+ [$ ^
陷(实际上完美的系统是不存在的)获取更多用户访问量。而这种更多的访问量,是以伤害 % K O* b& r* ^' U1 }+ |
3 百度搜索引擎优化指南 7 R. v$ I W% ?4 G: M6 l& a' T
用户体验为代价的,而这会危及一个搜索引擎的生存基础。所以,面对这样的行为,如果短
0 h, F( ]* ^; D! F. _2 @$ C1 g期内无法修补系统,搜索引擎也会通过一些临时策略进行遏制以免事态的失控。在作弊领
, U6 _* a- ]. `' `; r域,破窗效应是非常明显的。 0 J; [8 S2 s: n, J, I
很多人会说,整天说作弊作弊,到底哪些行为是作弊?这是无法穷尽的。互联网在动态 " ]" S( g, b# m# ~5 F) p
的发展,搜索引擎也在动态的发展,作弊行为自然也是在动态的发展。最基本的界定法则,
$ {9 K3 n# X5 t M就是这个行为的泛滥,是否会影响搜索系统,最终伤害到用户的搜索体验。
( t) \) {8 O' L对黑帽SEO 行为放任不管,不仅会造成搜索引擎质量的下降,还会恶化互联网生态环
4 |; g+ ?, U9 w8 E0 ^; \境,并使得良性的建站积极性受到打压,最终形成劣币驱逐良币的恶劣后果。在过去,黑帽
' w8 p- O1 W8 f- f$ nSEO 者面对惩罚,振振有词,甚至将搜索引擎告上法庭,这种状况,严重影响了正常的舆
/ _/ f% J, V; v$ ~9 L论氛围。这是我们必须要去扭转的。 ) V; A4 G8 v* x- T* u6 |2 M
总之,搜索引擎和黑帽SEO 行为之间的矛盾,是不可调和的;过去如此,现在如此, , ^/ v' a! u) I# h" M" r: P
将来也一定如此。打击黑帽SEO,会始终是搜索引擎质量控制的关键环节之一。而营造黑 " o, D- M$ r# x" B+ C# ^
帽SEO 者“老鼠过街,人人喊打”的舆论氛围,也是我们需要努力的目标。
" {& e& J Z/ ~& u" K(2) 白帽SEO 行为得到的指引不够清晰
3 W5 D( m! g2 F7 [4 q1 k所谓白帽SEO,就是能起到改良和规范网站设计,使之对搜索引擎和用户更加友好, 4 n) \, }7 v# d% I
并从中获取更多合理流量的优化行为。但过去的问题在于,我们过去较少的界定,什么样的
, L; O! G! z j2 ?行为是推荐的。这导致很多白帽优化心存顾虑。 $ a: j% U# X7 Q. \
正是鉴于上述问题,百度决定提供更加公开化的白帽SEO 指南,营造更好的舆论氛围,
- `9 [7 b& u6 U A9 a, _8 L以使SEO 行业,有更加良性的发展。 6 a/ A9 k: l! x* K2 w& A
需要指出的是,我们所颁布的SEO 指南,虽然听取了众多站长的意见和建议,但离完
* w$ W3 n) f `, K美仍有相当距离。所以,我们会通过“百度站长俱乐部”这个渠道, 收集更多的建设性意见, g, ^; j2 {8 z& z) h+ _
来不断的完善这一指南。
( B1 D, T# C+ T" `4 N1 s# s4 百度搜索引擎优化指南
) \& \* K% I5 ?, U目录 % y; s$ U* n, F+ Q4 {
前言.. 2
: H& h: E+ ^7 E目录.. 4 # E6 `+ L" B, d5 f3 J' S6 h
1 前期准备.................................................................................................................... 5 # n/ a) I$ B1 ^
1.1 域名注册.................................................................................................................... 5
' T3 H/ m+ y4 u; z, y! Q1.2 服务器、空间租用..................................................................................................... 5
, i( t) E2 n( M7 [2 面向搜索引擎的网站建设.......................................................................................... 6 # t" F7 Z" B8 J* I- j; `* H/ F: n
2.1 良好收录.................................................................................................................... 6
, J# B/ n/ Y, T8 v1 y2 i% g2.2 良好排序.................................................................................................................. 11 4 @$ T2 U6 `0 x
2.3 良好展现.................................................................................................................. 13 , [0 {+ ]6 c# D2 F
3 网站运营.................................................................................................................. 15 1 z$ S1 q& C' T$ g
3.1 目标=转化率............................................................................................................ 15
# C9 C5 k1 A( o5 ?# F) E0 o3.2 搜索引擎流量分析................................................................................................... 15 % K3 R, G w; \4 R
3.3 网站信任度.............................................................................................................. 16 " p& }8 f2 r& S$ `. g. Q- p& g
3.4 不断强化品牌概念................................................................................................... 16 ! z- o% A+ h* Q" E! E7 W
4 作弊与惩罚.............................................................................................................. 16 + O, f. D* U8 N& p# B! `; g
4.1 百度如何定义作弊................................................................................................... 16
; k+ [7 K! }$ Z0 x8 |; g' K+ e r4.2 作弊会受到怎样的惩罚............................................................................................ 18
: g- @0 o6 N: T Q4.3 改正后能否解除惩罚? ............................................................................................ 18
* u& \* p& ^. F" L4 k: |, |8 v+ G( [5 联系与反馈.............................................................................................................. 18
5 E5 F# _, ? ]- h) n* W. Z6 关于百度的十万个为什么........................................................... 错误!未定义书签。
( @ i) ^ J& e8 q( Y& F5 百度搜索引擎优化指南 + t# J" q+ ]! F
1 前期准备
! i: k, U4 M, B8 i8 l& Q: c1 |. o域名和服务器空间是网站建设的基础。 $ P; g$ Y7 ]4 G- w
1.1 域名注册 * m* r" g1 Y' x+ Q1 n
域名是用户对网站的第一印象,能否让用户迅速记住域名对网站发展非常重要。建议注 6 Q4 ^$ [7 F9 c/ G' X
册域名时选择容易让用户记忆、容易产生信任感的域名,这样可以提高回头率,并方便用户
2 {6 F2 S; g' B推荐。 ' _# w4 ]4 F( q% m ]! ~3 C: {
(1) 域名尽量简短,越短的域名,用户的记忆成本就越低 5 e8 e3 R% i# W, Z3 i* s
(2) 域名可以和网站主题或网站名称相呼应,让人看到域名就能联想到网站内容,比如
( m4 T, A! T E7 ~6 p8 @! |3 L: K" d使用公司名称、商标、网站名称或者公司产品等信息来选择域名
( {; E& d' y1 r, p(3) 使用何种形式的域名后缀对百度网页搜索没有影响,但域名后缀也需要考虑方便用 % `, K# @) ^. Y: ]
户记忆。.com、.cn、.net 等常见的域名后缀用户更容易记忆,一些不常见的后缀可
' x, U3 I; t; z" f# J8 U! ?能会让用户产生不信任感,增加用户的判断成本。
4 f# C0 |0 L) B( e7 I1 E1.2 服务器、空间租用
- N1 F6 u2 U% b; i服务器、空间的速度和稳定性直接影响网站的用户体验,也会影响搜索引擎的抓取。建 5 w3 `9 Y7 l( `5 O h
议选择服务稳定、速度快的服务器或者空间。 / j% D7 H( l% Y; p4 Q/ V0 E
(1) 选择有实力的正规空间商
$ J; o$ M! ~$ a- {. c3 s服务器和空间的稳定性需要一定的技术实力来保障,一些没有实力的空间商,可能无力
/ k- h1 m& q' p f9 r1 f, W( u. C提供良好的服务,服务的稳定性无法保证。甚至有空间商为了节省资源,故意屏蔽掉 ( W( ]2 @5 B# N1 P
Baiduspider 的抓取,导致网站无法被百度网页搜索收录。
" V$ R( k1 [# d4 C& C$ k(2) 保证用户的访问速度和稳定性 9 c6 K' V' Q& f5 b' v4 }
(3) 根据网站规模和要提供的服务来决定选择购买何种空间(服务器) ; s1 |( Q' O; [5 C
通常空间都会有流量、连接数以及功能上的限制,因为是多个网站共用一台服务器,稳 ! Q) P! S+ M3 F/ u8 u+ w! Z) m5 ~
定性会受到影响,但价格便宜;服务器各种限制较少,可以更自主的管理,但价格较贵。可 4 u* v/ d' L! F8 R; R# T+ V7 v
以根据自己的需求来进行合理的选择。
4 F. m- }# q$ j/ C5 K! Q(4) 根据用户群分布选择接入商 : I+ j5 S1 w. G/ M- W9 |1 I
由于互通问题的存在,选择接入商也很重要,如果用户群主要在联通,就尽量选择联通 - H6 e% a) I w7 H
访问较好的接入商,如果用户群主要在电信,则选择电信访问较好的接入商。如果用户群在 / h5 Z: S& K/ C
全国,那就选择一家互通处理的比较好的接入商。
2 p8 p1 `: U3 k' S) g+ L6 百度搜索引擎优化指南
: `: C* v' e+ {, f/ K, l0 U购买之前,可以先找一两个空间商现有的客户网站,测试访问情况如何。
' d5 Q0 {& P" b2 面向搜索引擎的网站建设 3 t, Q! i! _4 E' d6 {/ g% _# `; o% Y# z
搜索引擎只是网站上一个普通的访客,对网站的抓取方式、对网站/网页的价值判断,
$ g& ]. P- x! W* w; v5 e' @也都是从用户的角度出发的,任何对用户体验的改进,都是对搜索引擎改进。对搜索引擎的
" j! a6 a4 }4 G: G优化,同时也会让用户受益。 8 q: F& V1 |. G3 l/ ~
面向搜索引擎的网站建设,主要分为三个部分:如何更好的让搜索引擎收录网站中的内 x2 v) I& v$ |5 M- E
容、如何在搜索引擎中获得良好的排名、如何让用户从众多的搜索结果中点击你的网站。简 0 ?2 Y6 R; Q1 W) D1 E
单来说,就是收录、排序、展现。下面我们将从这三个方面分别介绍。
5 z7 S' ]; M4 _, A2.1 良好收录
8 K* a& \( c9 d' r6 e$ P2.1.1 机器可读 # d5 X. P4 |* |! ]) {% i0 H/ |/ q/ }
百度通过一个叫做Baiduspider 的程序抓取互联网上的网页,经过处理后建入索引中。
5 X' P; U) k% ?# p" l目前Baiduspider 只能读懂文本内容,flash、图片等非文本内容暂时不能处理,放置在flash、 ( C1 S* w+ C3 M+ r$ e6 f
图片中的文字,百度无法识别。 & Z: O2 }$ e7 X
建议使用文字而不是flash、图片、Javascript 等来显示重要的内容或链接,搜索引擎 . I4 z5 ]# W4 Q
暂时无法识别Flash、图片、Javascript 中的内容,这部分内容无法搜索到;仅在flash、
- \ Z W- l2 m0 OJavascript 中包含链接指向的网页,百度可能无法收录。 & R l# ^' [8 K
冘 使用文字而不是flash、图片、Javascript 等来显示重要的内容或链接 & D* t0 l+ X) S* q8 R9 n$ V' \
冘 如果必须使用Flash 制作网页,建议同时制作一个供搜索引擎收录的文字版,并在首页 # d+ l. n; K* \5 t1 ?- a
使用文本链接指向文字版
# O; j4 U4 k0 r' V冘 Ajax 等搜索引擎不能识别的技术,只用在需要用户交互的地方,不把希望搜索引擎“看” $ x8 x5 U# \* j3 u3 _: j
到的导航及正文内容放到Ajax 中 . N$ ^/ D% h# }, W
冘 不使用frame 和iframe 框架结构,通过iframe 显示的内容可能会被百度丢弃
/ h/ `+ @ i% d7 l/ i) V我们建议: / D4 ]$ H/ t% e" J$ l- e( L
7 百度搜索引擎优化指南 ; p+ v$ K9 ^1 f$ U! Q g
上面例子中,虽然网页上提供了很丰富的信息,但由于信息都在falsh 中,搜索引擎无法提取,对 ( T& X2 H- k5 d2 S
搜索引擎来讲,这个网页没有任何内容。 3 u- w5 z2 g8 f
2.1.2 网站结构
0 Y& e n# X8 i# K2 k; ~网站应该有清晰的结构和明晰的导航,这能帮助用户快速从你的网站中找到自己需要的
- q; @8 A1 n2 t9 T1 ^% ~内容,也可以帮助搜索引擎快速理解网站中每一个网页所处的结构层次。 1 w2 v7 i6 e$ s: _) ~( D
网站结构建议采用树型结构,树型结构通常分为以下三个层次:首页——频道——文章 % \. \- {! Z' n4 d2 T6 n
页。象一棵大树一样,首先有一个树干(首页),然后再是树枝(频道),最后是树叶(普通 ?4 u* @4 R3 m/ f3 A+ c
内容页)。树型结构的扩展性更强,网站内容变多时,可以通过细分树枝(频道)来轻松应 5 V" n1 y+ n5 x* ?9 c" @3 l
对。
7 |$ s8 f8 C. H: h7 |理想的网站结构应该是更扁平一些,从首页到内容页的层次尽量少,这样搜索引擎处理
8 V* a2 x. p+ m起来,会更简单。 1 q1 n- n {6 ?. x0 e. e" s! G
同时,网站也应该是一个网状结构,网站上每个网页都应该有指向上、下级网页以及相
' i8 O$ j! d. x/ O% v关内容的链接:首页有到频道页的链接,频道页有到首页和普通内容页的链接、普通内容页 9 e& \1 \0 F& B
有到上级频道以及首页的链接、内容相关的网页间互相有链接。
0 W1 A0 P! B0 \/ ^* X7 V5 N. }网站中每一个网页,都应该是网站结构的一部分,都应该能通过其他网页链接到。 5 t# l4 @! a$ Z$ z; J) p
总结一下,合理的网站结构应该是一个扁平的树型网状结构.........。
0 c/ Y0 G2 K: S' \1 R/ C3 E冘 确保每个页面都可以通过至少一个文本链接到达。 5 W. `1 N9 |& v& S3 d. n0 x
冘 重要的内容,应该能从首页或者网站结构中比较浅的层次访问到。 + I. y% L, T4 b- m Y$ u1 d
我们建议: - @ t& [: F: G7 o @& [9 A& ]
8 百度搜索引擎优化指南 % Y4 B) F" r: {
冘 合理分类网站上的内容,不要过度细分。
3 J, M+ M( A$ |& c F1 b: V' f网站应该有简明、清晰的导航,可以让用户快速找到自己需要的内容,同时也可以帮助 8 R/ Y+ X4 k5 q* f3 `) N. t: z6 K
搜索引擎更好的了解网站的结构。
% g( G/ ~3 B' T冘 为每个页面都加上导航栏,让用户可以方便的返回频道、网站首页,也可以让搜索引擎
/ E7 r5 l c4 L' y' \方便的定位网页在网结构中的层次。 . }& J4 D; r" h8 y/ i d. |2 v
冘 内容较多的网站,建议使用面包屑式的导航,这更容易让用户理解当前所处的位置:网 ( v1 }5 z2 D& \/ j
站首页> 频道> 当前浏览页面
5 V/ l1 m; l& C通过面包屑导航,用户可以很清楚的知道自己所在页面在整个网站中的位置,可以方便的返回上 4 G; C$ o6 m0 Q+ ^# ^" Q
一级频道或者首页也很方便。 6 O. [9 {1 P0 Z( H: G
冘 导航中使用文字链接,不使用复杂的js 或者flash 1 c4 d/ j1 R0 T5 J2 Y
冘 使用图片做导航时,可以使用Alt 注释,用Alt 告诉搜索引擎所指向的网页内容是什么 , D5 k* `& J! j' p' C3 K
2.1.3 子域名与目录的选择 4 B# {2 @% [4 K# R
选择使用子域名还是目录来合理的分配网站内容,对网站在搜索引擎中的表现会有较大
. p' O0 G, `* f$ E6 _的影响。
/ o# B8 O8 ^. U" C9 Q2 y/ k( b' {9 ]冘 在某个频道的内容没有丰富到可以当做一个独立站点存在之前,使用目录形式;等频 1 |6 [+ r" n, [1 P5 V
道下积累了足够的内容,再转换成子域名的形式 4 v$ v( @, W' I Y. P
一个网页能否排到搜索结果的前面,“出身”很重要,如果出自一个站点权重较高的 0 o! Q& l% c- \2 N5 b: b4 _9 w
网站,那排到前面的可能性就越大,反之则越小。通常情况下主站点的权重是最高的,
( j! V. l8 b8 {2 @( d5 A$ @子站点会从主站点继承一部分权重,继承的多少,视子站点质量而定。
+ c/ y1 E/ m( r# I! W9 P在内容没有丰富到可以做为一个独立站点之前,内容放到主站点下一个目录中能在
2 V$ \! G0 n/ F8 k1 O% Z7 U9 W搜索引擎中获得更好的表现。
) a0 G- F1 @& a; n, |* _% ~( \* N, Y冘 内容差异度较大、关联度不高的内容,使用子站点形式 ! w8 |/ l8 |/ n5 q
搜索引擎会识别站点的主题,如果站点中内容关联度不高,可能导致搜索引擎错误
6 u- j& Z2 i: F0 H的识别。关联度不高的内容,放在不同的子域名下,可以帮助搜索引擎更好的理解站点 ) W- k5 F, w3 X" l
的主题。
1 h+ i# P# E4 p# z! w+ `冘 域名间内容做好权限,互相分开,a. example.com 下的内容,不能通过b. 3 a! @& ~4 m1 L( l
example.com 访问
# M- j, S- G* X8 Z) b( K: Q/ T子域名间的内容可以互相访问,可能会被搜索引擎当做重复内容而进行除重处理,
5 q2 v6 u$ T+ E$ [4 n0 M我们建议:
- U1 a8 a) e' L& |我们建议:
$ U. Y5 G) b/ B# G- w$ i$ V( Z! M' q9 百度搜索引擎优化指南 3 C& q/ T! [9 o: ~8 T+ i
保留的url 不一定是正常域名下的。 % U. z D n; X
冘 不要滥用子域名
. B# Y3 G, ^4 ~6 ]: a无丰富内容而滥用大量子域名,会被搜索引擎当做作弊行为而受到惩罚。
|