网址URL规范化
网址URL规范化(URL canonicalization)是SEO过程中常见因而必须了解和避免的一个很重要问题。它指的是网站上由于种种原因,同一个页面可能出现多个网址,搜索引擎挑选显示的URL很可能不是最适当的URL网址,SEO需要做一些工作,使搜索引擎更容易选出真正的、所谓规范化的网址。
举例来说,下面这几个URL一般来说指的是同一个文件或网页:
https://www.www.xqblog.com
https://xqblog.com
https://www.xqblog.com/index.html
https://xqblog.com/index.html
……………………………………
从技术上来讲,这几个URL网址都是不同的。虽然在绝大部分情况下,这些网址所返回的都是相同的文件,也就是你的主页。但是从技术上来说,主机完全可以对这几个网址返回不同的内容。
当搜索引擎要规范化网址时,搜索引擎需要从这些选择当中挑一个最好的代表。一般来说,你的主页应该是固定的,只有一个。但是有的时候,在很多网站上站长在链接回主页时,所使用的URL并不是唯一的。很可能在你的网站上,一会连到URL https://www.xqblog.com,一会儿连到URL https://www.xqblog.com/index.html 。
使用nginx/apache rewrite使URL规范
nginx/apache是常用的搭建WEB的主程序, 使用rewrite(伪静态)功能使网站url入口统一,其实也就是做301重定向到这个网址;
1. nginx .conf文件配置rewrite规则
if ($host != 'www.xqblog.com') { rewrite ^/(.*)$ https://www.xqblog.com/$1 permanent; }
2.apache .htaccess rewrite规则:
RewriteEngine On RewriteCond %{HTTP_HOST} !^www.xqblog.com$ [NC] RewriteRule ^(.*)$ https://www.xqblog.com/$1 [L,R=301]
以上都是301重定向哦,非常方便使用wordpress程序的用户。
从站长SEO优化的角度来看:
1)你的网站内部在链接到其他网页,尤其是主页时,只使用一种URL。不管是包含www或不包含www,你要由始至终只使用一个版本。这样搜索引擎也就明白哪一个是规范化的主页网址。
2)但是你没办法控制别的网站用哪一个网址连向你的主页。所以你应该在你的主机服务器上,把所有有可能成为主页网址的URL,做301重定向到你所选择的主页网址版本。
很重要的一点是,如果你的网站出现了URL规范化的问题,千万不要在站长工具删除其中的一个网址版本,尤其是首页。比如说,你所要的是带有www的版本千万不能到百度站长平台或Google站长工具填表,要求没有www的主页网址被删除掉。因为那样做的话,你整个的域名有可能被删除。
当然,除了包含www和不包含www的两个版本以外,还有其他类型的URL规范化问题。比如有的时候,搜索引擎会去掉或加上网址尾端最后的斜线。有的时候会尝试把大写字母换成小写字母,有的时候可能尝试去掉会话ID(session ID)等等,这些都有可能造成网址规范化问题。
注:本文部分内容来自SEO每天一贴;站长:Zac著有《SEO实战密码》、《网络营销实战密码》