观察网站两面,体味网络人生!

Google排名优化-面向Google(Search Engine Friendly)的URL设计

上一篇 / 下一篇  2008-05-22 17:59:49 / 个人分类:seo


世界经理人管家5s4U{0@z*`l0r.gs

内容摘要:不得不承认,将动态网页链接rewriting成静态链接是最保险和稳定的面向搜索引擎优化方式

U\!KA$bf;R P:M7G0世界经理人管家o{9U aj'e'E'mw4GDR

此外随着互联网上的内容以惊人速度的增长也越来越突出了搜索引擎的重要性,如果网站想更好地被搜索引擎收录,网站设计除了面向用户友好(User Friendly)外,搜索引擎友好(Search Engine Friendly)的设计也是非常重要的。进入搜索引擎的页面内容越多,则被用户用不同的关键词找到的几率越大。Google的算法调查一文中提到一个站点被Google索引页面的数量其实对PageRank也是有一定影响的。由于Google 突出的是整个网络中相对静态的部分(动态网页索引量比较小),链接地址相对固定的静态网页比较适合被Google索引(怪不得很多大网站的邮件列表归档和BLOG按日期归档的文档很容被搜的到),因此很多关于面向搜索引擎 URL设计优化(URI Pretty)的文章中提到了很多利用一定机制将动态网页参数变成像静态网页的形式:世界经理人管家rPQ~u {.Q)Y
比如可以将:世界经理人管家[8RYb&f4p8G Cb
http://phpunixman.sourceforge.net/index.php?mode=man&parameter=ls

V:w${*gN+c1Tl"P0变成:http://phpunixman.sourceforge.net/index.php/man/ls世界经理人管家)BZ[#c(QP hEt5|c
世界经理人管家~ E6s+Tj?|*V2|

-ps]8u5fD P1^"u8tJ0实现方式主要有2种:世界经理人管家2U*\[(i_!w7m*D8A
世界经理人管家0a4sk4jjP

把URI地址用作参数传递:URL REWRITE世界经理人管家L%z(V-|"D^

JK t9?3k'R`Qf1UE0最简单的是基于各种WEB服务器中的URL重写转向(Rewrite)模块的URL转换:世界经理人管家 PI9c^F)Sd
这样几乎可以不修改程序的实现将 news.asp?id=234 这样的链接映射成 news/234.html,从外面看上去和静态链接一样。Apache服务器上有一个模块(非缺省):mod_rewrite:URL REWRITE功能之强大足够写上一本书。世界经理人管家G:V6KQ,tX7L8oz
世界经理人管家V-T ?9U9C9i(|_8B3_5N

9@;E s4DIY Y&{d0当我需要将将news.asp?id=234的映射成news/234.html时,只需设置:世界经理人管家'FG6D3nU%mH7}9C
RewriteRule /news/(\d+)\.html /news\.asp\?id=$1 [N,I]世界经理人管家3US!_0yuM\1P/ySU
这样就把 /news/234.html 这样的请求映射成了 /news.asp?id=234
6n3V O/^5DmH!~1gP0当有对/news/234.html的请求时:web服务器会把实际请求转发给/news.asp?id=234世界经理人管家p\)t(rQ[|&e!S~

$o \{e#Nb;R?0世界经理人管家+}wB9V6qn8s pt@~

而在IIS也有相应的REWRITE模块:比如ISAPI REWRITEIIS REWRITE,语法都是基于正则表达式,因此配置几乎和apache的mod_rewrite是相同的:世界经理人管家@%K/[+Ws_D'yB

qV#v'KL"[U0比对于某一个简单应用可以是:
{Z$d~AV_?0RewriteRule /news/(\d+)\.html /news/news\.php\?id=$1 [N,I]
"x/A.[ M4Y4u3k;c%~0这样就把 http://www.chedong.com/news/234.html 映射到了 http://www.chedong.com/news/news.php?id=234世界经理人管家!nlI;gy:{5F/}7\-G

{/I7w#a,V~0一个更通用的能够将所有的动态页面进行参数映射的表达式是:世界经理人管家s5r7WG'Z|!{ }s
把 http://www.myhost.com/foo.php?a=A&b=B&c=C世界经理人管家9}rk"cKy%X#O
表现成 http://www.myhost.com/foo.php/a/A/b/B/c/C。世界经理人管家hj8Ss,Sy
RewriteRule (.*?\.php)(\?[^/]*)?/([^/]*)/([^/]*)(.+?)?$1(?2$2&:\?)$3=$4?5$5: [N,I]世界经理人管家8y"z`LW${

Xv*i2Jd6F0以下是针对phpBB的一个Apache mod_rewrite配置样例:世界经理人管家AcqAagc

RewriteEngine On
    RewriteRule /forum/topic_(.+)\.html$  /forum/viewtopic.php?t=$1 [L]
    RewriteRule /forum/forum_(.+)\.html$ /forum/viewforum.php?f=$1 [L]
    RewriteRule /forum/user_(.+)\.html$  /forum/profile.php?mode=viewprofile&u=$1  [L]

2W6RB9\`J J `Rc0这样设置后就可以通过topic_1234.html forum_2.html user_34.html这样的链接访问原来的动态页面了。

C"FR&eV.E?f2[@9q0

2{"c ilB#d5G0通过URL REWRITE还有一些好处:
:yCta&GG7J0mod_rewrite和isapirewrite基本兼容,但是还是有些不同,比如:isapirewrite中"?"需要转义成"\?",mod_rewrite不用,isapirewrite支持 "\d+" (全部数字),mod_rewrite不支持

lldK/oX0
  • 隐藏后台实现:这在后台应用平台的迁移时非常有用:当从asp迁移到java平台时,对于前台用户来说,根本感受不到后台应用的变化;
  • 简化数据校验:因为像(\d+)这样的参数,可以有效的控制数字的格式甚至位数;

Y2w;kX-kO{'fJ0比如我们需要将应用从news.asp?id=234迁移成news.php?query=234时,前台的表现可以一直保持为 news/234.html。从实现应用和前台表现的分离:保持了URL的稳定性,而使用mod_rewrite甚至可以把请求转发到其他后台服务器上。世界经理人管家;l+cY)sLjt0u$ynA3j
世界经理人管家o$j-}&o(_|N

基于PATH_INFO的URL美化

世界经理人管家9y"I(d&h F5]

Url美化的另外一个方式就是基于PATH_INFO:世界经理人管家 l&Q,sMa LbeSa1i
PATH_INFO是一个CGI 1.1的标准,经常发现很多跟在CGI后面的"/value_1/value_2"就是PATH_INFO参数:
s6ZG0q"qZ;yr[2m0比如:http://phpunixman.sourceforge.net/index.php/man/ls中:$PATH_INFO = "/man/ls"世界经理人管家u1P2IHi[ O
世界经理人管家g4hLi.u/AN`2_S

世界经理人管家{nqZ2p'U

PATH_INFO是CGI标准,因此PHP Servlet等都有的支持。比如Servlet中就有request.getPathInfo()方法。世界经理人管家,Ad3\Yh.uS,s
注意:/myapp/servlet/Hello/foo的 getPathInfo()返回的是/foo,而/myapp/dir/hello.jsp/foo的getPathInfo()将返回的 /hello.jsp,从这里你也可以知道jsp其实就是一个Servlet的PATH_INFO参数。ASP不支持PATH_INFO世界经理人管家 Cr7YO R P@^zg,JW
PHP中基于PATH_INFO的参数解析的例子如下:世界经理人管家a7E"X|}3zM)ymF|
//注意:参数按"/"分割,第一个参数是空的:从/param1/param2中解析出$param1 $param2这2个参数
&e ?RcE0if ( isset($_SERVER["PATH_INFO"]) ) {
Y4Y D"| \I\)^zG0    list($nothing, $param1, $param2) = explode('/', $_SERVER["PATH_INFO"]);
v g"OW4vZ0}世界经理人管家h @/p(O:D3XF
世界经理人管家#x,q'oO+pK7ta
如何隐蔽应用:例如 .php,的扩展名:
&a'mF"{+Hv6M0在APACHE中这样配置:
y T,iY0kp[6]0<FilesMatch "^app_name$">世界经理人管家?(F+?5n8q4e HJx
    ForceType application/x-httpd-php世界经理人管家S!i"W9x2UD\.q
</FilesMatch>世界经理人管家Z|%Q%OR)r/UU2Q B

!O }%h@H{0如何更像静态页面:app_name/my/app.html
F GEH]3xj-R x}0解析的PATH_INFO参数的时候,把最后一个参数的最后5个字符“.html”截断即可。世界经理人管家`"C {s&~_s5i5b l
注意:APACHE2中缺省是不允许PATH_INFO的,需要设置 AcceptPathInfo on
+uS6CTC aY0世界经理人管家Gh!q/[.|3Dd
特别是针对使用虚拟主机用户,无权安装和配置mod_rewrite的时候,PATH_INFO往往就成了唯一的选择。
:{Lf,{b8P.i"J*B&Z\0世界经理人管家bh7{9T0M:}7g
OK,这样以后看见类似于http://www.example.com/article/234这样的网页你就知道可能是 article/show.php?id=234这个php程序生成的动态网页,很多站点表面看上去可能有很多静态目录,其实很有可能都是使用1,2个程序实现的内容发布。比如很多WIKIWIKI系统都使用了这个机制:整个系统就一个简单的wiki程序,而看上去的目录其实都是这个应用拿后面的地址作为参数的查询结果。
gL_uh{ U0V.M A0世界经理人管家Uf \#o+Y2MC x%?
利用基于MOD_REWRITE/PATH_INFO + CACHE服务器的解决方案对原有的动态发布系统进行改造,也可以大大降低旧有系统升级到新的内容管理系统的成本。并且方便了搜索引擎收录入索引。世界经理人管家.rWqV Y

附:如何在IIS上利用PHP支持PATH_INFO

kX4Gp"G4Mm0PHP的ISAPI模式安装备忘:只试成 php-4.2.3-Win32世界经理人管家/]B0g.T9D+@S
世界经理人管家:x6zo$o4gR
解包目录
I0bG't'VY)Q0========
&\+@9B2ya i$C0php-4.2.3-Win32.zip c:\php世界经理人管家{.D)z\%|da#C.H6C#jU3a

'n8m#mhH0PHP.INI初始化文件世界经理人管家%?Ri FZ$[@
=================世界经理人管家0U2br%zxO*TQ%d
复制:c:\php\php.ini-dist 到 c:\winnt\php.ini
U"L7E4}"@ y7Nr0世界经理人管家l2fI:q'r`&p)U
配置文件关联世界经理人管家0@a7Y:V|(i
============世界经理人管家-C:W5E5\(T'E7JY2`g2{
按照install.txt中的说明配置文件关联
:eS!P^tM8}C0
XL\%c e0运行库文件世界经理人管家YT*PbT y9s
==========
Pqp)w5B0复制 c:\php\php4ts.dll 到 c:\winnt\system32\php4ts.dll世界经理人管家5vJ2Tl A

8GSo!V S3w0B$\0这样运行后:会发现php把PATH_INFO映射到了物理路径上世界经理人管家Iz i4Y2NYbI ?
Warning: Unknown(C:\CheDong\Downloads\ariadne\www\test.php\path): failed to create stream: No such file or directory in Unknown on line 0
d!Su2]gw1` B1\0世界经理人管家MD m:Zm,o.Mc
Warning: Unknown(): Failed opening 'C:\CheDong\Downloads\ariadne\www\test.php\path' for inclusion (include_path='.;c:\php4\pear') in Unknown on line 0世界经理人管家9u,~9J4Hi*d
世界经理人管家C(r z-a-g\
安装ariadne的PATCH
`6_Ehc5C![7p;p0==================世界经理人管家 X_,Q9I,Hp2YS
停止IIS服务世界经理人管家)Q(|Qy7\ Y-v Pu/P
net stop iisadmin世界经理人管家+JF f!`&n%ar
ftp://ftp.muze.nl/pub/ariadne/win/iis/php-4.2.3/php4isapi.dll
'axJm7x7u0覆盖原有的c:\php\sapi\php4isapi.dll世界经理人管家3F-A o Hn2v O;j
世界经理人管家~4@+q%i)lzR
注:
B)]h/w6r pT P0ariadne是一个基于PATH_INFO的内容发布系统,世界经理人管家L| f~$Dg&t.B
PHP 4.3.2 RC2中CGI模式的PATH_INFO已经修正,照常安装即可。
/Z-Z`9\3?r#D2sYE0

,xn n]1L{-UfW0

#Td f!DY,R0参考资料:世界经理人管家kr Ar"ZGvWV Q"L0pWT
URL Rewrite文档:世界经理人管家9rL5x"J)ade
ISAPI REWRITE文档世界经理人管家m'L8yP!?)AJ3k'_
IIS的ISAPI REWRITE下载(免费)
%z)D)?9]0L/C lUh3B0http://httpd.apache.org/docs/mod/mod_rewrite.html世界经理人管家5FzHe?0Oz
http://httpd.apache.org/docs-2.0/mod/mod_rewrite.html
~Oj P)B0世界经理人管家P&VlXkq"oT

M `6uh+JO)p0搜索引擎友好的URL设计世界经理人管家5l,Af6F0_.O+RZ G
http://www.sitepoint.com/article/485
+h[+v2BB0说不定这个URL原来就是articel.php?id=485
1W.L:r v0^0
世界经理人管家UL.ln,[#g

/R.sD3I6Ro2J0一个基于PATH_INFO的开源内容管理系统世界经理人管家_:Wz6[!j7dU c\~%x*I%C
http://typo3.com/
|{+m m7Xyo{,o0

,aLf&| CIU6nuVst0世界经理人管家9L-ZYOOH(r4\_ _w

Google的PageRank算法说明:
U ~,\ ZRIz-fT*\0http://pr.efactory.de/世界经理人管家_;Y/[JM

{&a'H~.p0
站内搜索:

TAG:

 

评分:0

我来说两句

显示全部

:loveliness: :handshake :victory: :funk: :time: :kiss: :call: :hug: :lol :'( :Q :L ;P :$ :P :o :@ :D :( :)

lastsmiler

lastsmiler

网络运营管理者,SEO研究者

日历

« 2008-08-21  
     12
3456789
10111213141516
17181920212223
24252627282930
31      

数据统计

  • 访问量: 11198
  • 日志数: 263
  • 建立时间: 2008-03-19
  • 更新时间: 2008-08-20

RSS订阅

Open Toolbar