规范标记是一个HTML元素,通知搜索引擎,即一组类似或重复页面具有要索引的首选版本。

换句话说,如果在不同的URL下具有相同(或类似)内容,则可以使用规范标记来指定Google应该关注的版本和索引。

例如,如果您有两个以下URL ...

example.com/c/collectibles/musicboxes.html.example.com/c/musicboxes/collectibles.html.

......这两个URL都用于相同的内容(即它们都会导致同一页面)。通过添加规范标签,谷歌将选择一个URL作为规范版本并爬网。规范版本是首选版本。其他URL将被视为重复的内容,因此将比规范版本逐渐爬出。

设置规范标记

规范标签使用简单且一致的语法,并放置在网页的部分内。这是规范标签的示例:

<链接rel =“canonical”href =“https://example.com/abc”/>

这是该代码的每个部分的意思:

  • 链接rel =“canonical”:此标记中的链接是此页面的主设备(即规范或首选)版本。
  • hreflang =“https://example.com/abc”:可以在此URL找到规范版本。

这就是该代码示例在直播网站上的样子:

(页面源代码中的rel = canonical标记。)

为什么规范标签很重要?

规范标签是防止重复内容问题的关键。具有重复内容,它使Google更难选择:

  • 哪个版本的页面索引
  • 排名的页面的哪个版本
  • 它们是否应该在一个页面上整合链接公平,或者在多个版本之间拆分它

实现规范标签,有助于防止重复内容问题,因为搜索引擎知道页面组的首选版本 - 规范URL。

重复的内容太多也可以影响您的爬网预算。这意味着Google可能最终浪费时间爬行同一页面的多个版本,而不是在网站上发现其他重要内容。

以下是您的网站可能有重复或非常相似的页面的一些常见原因:

1。具有搜索参数的参数化URL(example.com?q=search-term)。

2。具有会话ID的参数化URL(https://example.com?sessiond=3)。

3.具有不同设备类型的页面(example.com和m.example.com)。

4.具有页面的AMP和非放大器版本(example.com/page和amp.example / page)。

5。在非WWW和WWW Variants(https://example.com和https://www.example.com)提供相同的内容。

6。在非HTTPS和HTTPS变体上为相同的内容提供服务(http://www.example.com和https://www.example.com)。

7。为具有和而无需追踪斜杠的相同内容(https://example.com/page/和https://www.example.com/page)。

8。在页面的默认版本(如索引页面(https://www.example.com/,https://www.example.com/index.htm,https://www.example.com/)上为相同的内容提供服务index.html,https://www.example.com/index.php,https://www.example.com/default.htm等)。

9。为具有和没有大写字母的相同内容(https://example.com/page/和https://www.example.com/page/)。

规范标签的最佳实践

为避免任何重复的内容问题,重要的是正确实现规范标记。以下是使用规范标签的最佳实践列表。

1.使用绝对URL。

虽然您可以添加相对URL,但它是最好的练习来使用绝对URL。这样,它将被正确解释。

使用以下结构粘附到绝对的URL方法......

<链接rel =“canonical”href =“https://example.com/abc/”/>

而不是......

<链接rel =“canonical”href =“/ abc /”/>

2.在URL中使用小写。

即使它们指向相同的目标,谷歌可能将大写和小写URL视为两个不同的URL。因此,首先强制服务器上的小写URL,然后对您的规范标记使用小写URL。

3.使用正确的域版本(即https vs. http)。

如果您的网站已切换到SSL(安全套接字层)或HTTPS,那么请不要在规范标记中声明任何非SSL(那将是HTTP)URL。

4.使用自引导规范标签。

无论您是否有重复的内容,谷歌的John Mueller表示,虽然不强制,但建议使用自信的规范标签。

5.每页使用一个规范标记。

如果页面有多个规范标记,则谷歌将忽略两者。这导致搜索引擎选择哪个页面是首选页面。

6. Canonicalize跨域重复。

如果控制两个站点,则可以在域中使用规范标记。

常见的规范标签问题

在实现规范标签时要注意以下常见问题。

1.规范指向NoIndex URL。

这意味着在规范标记中包含的URL是NOINDEX(例如,Page A CANONICALIZE与Page B是NOINDEX)。

2.页面之外的规范。

这意味着有问题的URL具有在HTML中指定的规范标签元素,但在之外。

3.规范畸形或空虚。

这意味着有问题的URL具有指定的规范标记元素,但规范URL丢失或无效。如果搜索引擎遇到畸形或空的规范标签,它们将完全忽略规范教学。

4.规范环。

这意味着所讨论的URL具有规范标签,即规范URL实际上将返回到原始URL(例如,Page A为Page B,然后将其计算回页面A)。

5.规范点与错误消息的URL。

这意味着有问题的URL具有规范标签,由此在错误(即5xx或404)中被解析规范URL本身。

6.规范指向重定向URL。

这意味着所讨论的URL具有规范标签,由此被重定向的规范URL本身(例如,Page A为Page B的Page B)重定向到Page C)。

7.规范指向另一个规范化URL。

这意味着所讨论的URL具有规范元件,由此规范URL本身也是规范化的(例如,Page A为Page B,然后可以为Page C)。

8. HTML和HTTP标头中的Canonical标签不匹配。

这意味着有问题的URL具有在HTML和HTTP标题中指定的规范元素,其中规范URL不同。

9.多重不匹配的规范标签。

这意味着所讨论的URL具有在多个位置中指定的规范元素(在HTML中,在HTTP标头中或两者的组合中),并且指定的规范URL不一样。

10.只有在渲染的DOM中发现的规范。

这意味着所讨论的URL具有仅存在于呈现的DOM中的规范元素,并且不存在于源HTML中。

11.渲染的规范与HTML源不同。

这意味着所讨论的URL在呈现的DOM中具有规范元素,其与源HTML中的一个不同。

12. HTML和HTTP标头中的规范标记。

这意味着有问题的URL具有在HTML和HTTP标头中指定的规范标记。它被认为只使用一种方法来指定规范的最佳做法。