欢迎光临来到我们官方网站!
打开客服菜单
南京网站优化
南京网站优化首页 > SEO经验 > 网址规范化有什么好处,应该怎么做?
网址规范化有什么好处,应该怎么做?
时间 : 2018-09-10 16:39 浏览量 : 72

网址规范化(URL canonicalization)指的是搜索引擎挑选最合适的U URLAIERL作为真正规范化的网址的过程,

  1. 为什么出现不规范网址

    举例来说,下面这几个URL一般指的是同一个文件:

    http://www.domainname.com

    http: //domainname.com

    http: //www.domainname.com/index.html

    http: //domainname.com/index.html ,从技术上来讲,这几个URL都是不同的网址,搜索引擎也确实把它们当作不同的网址。虽然在绝大部分情况下,这些网址所返回的是相同的文件,也就是网站首页,但是从技术上说主机完全可以对这几个网址返回不同的内容。

    除了上面因为带与不带www造成的,,以及结尾是否带 index.. htmlhtml文件&名造成的不规范网址,网址规范化问题还可能由于如下原因出现:

    ·CMS系统原因,使同一篇文章(也可以是产品、帖子等)可以通过几种不同的URL访问。这种情况大量存在。

    ·URL静态化设置错误,同一篇文章有多个静态化URL·URL静态化后,静态和动态URL共存,都有链接,也都可以访问。

    ·目录后带与不带斜杠。 

    http: //www. domainname. com和http://ww.domainname.com/是不同网址,但其实是一个页面。

    ·加密网址。

    http: //www. domainname. com和https: //www. domainname.com,同时存在,都可以访问。

    URL中有端口号。 

    http://www. domainname.com: 80 http://www.domainname. com。

    跟踪代码。有的联署计划或广告服务在URL后面加跟踪代码,如http: //www.domainname.. com/?affid=100 和 http: //www. domainname. com/m和http:/www.domainnaecom/显示的都是首页内容。

  2. 网址规范化问题

    网站出现多个不规范网址会给搜索引擎收录和排名带来很多麻烦。比如,网站首页应该是固定的,只有一个,但很多站长在链接回首页时所使用的URL并不是唯一的,一会儿连到http://www.domainname.com,一会儿连到http:www.domainname.com/index.html。

    虽然不会给用户造成什么麻烦,因为这些网址其实是同一个文件,但是给搜索引擎造成了困惑,哪一个网址是真正的首页呢?哪一个网址应该被当作首页返回呢?如果网站上不同版本的网址同时出现,那么两个或更多版本的URL都可能被搜索引擎收录,这就会造成复制内容。搜索引擎计算排名时必须找到所谓规范化的网址,也就是搜索引擎认为的最合适的URL版本。

    网址规范化造成几个问题:

    ·CMS系统在不同地方链接到不同的URL,分散了页面权重,不利于排名。·外部链接也可能指向不同URL,分散权重。

    ·搜索引擎判断的规范化网址可能不是站长想要的那个网址。

    ·如果网址规范化问题太严重,也可能影响收录一个权重不很高的域名,能收录的总页面数和蜘蛛总爬行时间是有限的。搜索引擎把资源花在收录不规范的网址上,留下给独特内容的资源就减少了。

    ·复制内容过多,搜索引擎可能认为内容质量不高。

  3. 解决网址规范化问题

    要解决URL规范化问题有很多方法,比如:

    ·确保使用的CMS系统只产生规范化网址,无论是否有静态化。

    ·所有内部链接保持统一,都指向规范化网址。以带与不带www为例,确定一个版本为规范化网址,网站内链接统一使用这个版本这样搜索引擎也就明白哪个是站长希望的规范化网址。由于用户习惯,通常选择带www的版本为规范化网址。

    · 在Google站长工具中设置首选域。

    ·使用301转向,把不规范化URL全部转向到规范化URL。下一节将深入讨论。

    · 使用 canonical标#签。.后面将深入讨论。.

    ·提交给搜索引擎的XML网站地图中全部使用规范化网址。

    但这些方法都各有局限:

     Google站长工具不适用于其他搜索引擎。

    ·有的网站因为技术原因做不了301转向。

    .CMS系统经常不受自己控制。

    .内部链接自己可以控制,但外部链接不受控制。

    所以,虽然有解决方法备选,但到目前为止网址规范化一直是困扰站长及搜索引擎的一个问题。据估计,网上有10%~30%的URL是内容相同但URL不一样的不规范化网址。为了万无一失,经常需要综合使用多个方法。

  4. 301转向

    1.什么是301转向

    301转向(或叫301重定向、301跳转)是用户或蜘蛛向网站服务器发出访问请求时,服务器返回的HTTP数据流中头信息(header)部分状态码的一种,表示本网址永久性转移到另一个地址。

    其他常见的状态码如下。

    200:一切正常。

    404:网页不存在。

    302:临时性转向。

    500:内部程序错误。

    网址转向还有其他方法,如02转向、JavaScript转向、PHP/ASP/CGI程序转向、 Meta Refresh等。除了301转向外,其他方法都是常用的作弊手法。.虽然方法本身没有对错之分,但被作弊者用多了,搜索引擎对可疑的转向都很敏感。

    2.301转向传递权重

    网页A用301重定向转到网页B,搜索引擎可以肯定网页A永久性改变地址,或者说实际上不存在了,搜索引擎就会把网页B当作唯一有效目标。这是搜索引擎唯一推荐的不会产生怀疑的转向方法,更重要的是,网页A积累的页面权重将被传到网页B.

    所以,假设http: //www. domainname. com是选定的规范化网址,下面几个网址: 

     .  http: //domainname. com

     . http: //www.domainname. com/index.html

     . http: //domainname. com/index.html

    都做301转向到http: //www.domainname.com, 搜索引擎就知道http:/www.domainnamecom是规范化网址,而且会把上面列的网址权重传递集中到规范化网址。

    目前 Google 会传递大部分权重,但不是百分之百权重。百度会传递所有权重。Google对301的识别、反应、完成权重传递,需要1~3个月时间。百度对301处理则比较保守,新旧URL会同时存在于数据库很长时间,经常看到做了301转向一年的URL还出现在百度结果中。

    3.怎样做301转向

    如 果 网站使用 LAMP(Linux++Apache++MySQL++PPHPHP)主机,可以使用.htaccess文件做301转向。.htaccess是一个普通文件,用 Notepad等文 字编辑软件创建和编辑, 存在网站根目录下。.htaccess文件中的指令用于目录特定操作,如密码保护、转向、错误处理等。

    比如把页面old.htm301转向到http: //www.domain.cor.com/new.htm,可以在htaccess文件中放上这个指令:

     redirect 301 /old.htm http: //www. domain. com/new. htm

    4.301转向的其他用途

    除了解决网址规范化问题,还有很多需要做301转向的情形。比如,为保护版权公司拥有不同TLD的多个域名:

    company..com

     company.net

     company. org

     company. com. cn

     company.cn

    为避免造成大量复制内容,应该选定一个为主域名,如  company.com,其他域名做301转向到company.com.

    网站改版也经常需要用到301转向,如页面删除、改变地址、URL命名系统改变等。更换域名也需要整站从旧域名做301转向到新域名

    动态URL静态化也可能要做301,将旧的、态的URL做301到新的、静态的URL.


标签:
no cache
Processed in 0.321532 Second.