|
Post by account_disabled on Dec 19, 2023 23:39:01 GMT -5
此过程有时称为标准化或规范化。 根据 Google 网站管理员趋势分析师 Gary Illyes 的说法,大约 60% 的互联网都是重复内容。 规范化很复杂并且经常被误解。我不认为大多数复制品都是邪恶的。造成这些问题的主要原因是技术问题。我们稍后会详细讨论这一点。我将讨论规范化过程的工作原理以及以下内容: 规范化信号 如何检查规范 常见错误 规范化信号 许多不同的信号都会进入规范化过程。根据 Google 的 Gary Illyes 的说法,有 20 种不同的信号。 这些包括: 重复项 规范链接元素 站点地图 URL 内部链接 外部链接 重定向 赫夫朗 网页排名 HTTP 上的 HTTPS 页面 较短的 URL 优于较长的 URL 内容首次发布/查看的位置 站点级 特殊数据 信号,例如抓取内容的历史记录 PDF 上的页面 谷歌会查看所有不同的信号并对其进行权衡以确定规范版本应该是什么。这是它将索引的页面版本以及通常向用户显示的内容。这个过程由机器学习系统处理。 体重秤。 “站点地图中的 URL”和“重复内容”较轻; 主机端的“内部链接”和“规范 URL” Google 根据内部链接和规范 URL 决定规范的潜在场景。 重复项 对于重复的内容,Google 将选择一个规范版本进行索引。 所有符合条件的页面形成一个页面集群,并且进入该集群中页面的信号将在所选规范处进行合并。该规范甚至可能随着时间的推移而改变。 重复信号如何整合 一些 SEO 认为存在重复内容,Google 可能会选择错误的规范。这可能包括博客主页面、分页页面、标签页面、类别页面或提要页面。 抄袭或联合内容– 内容联合最佳实践通常建议使用规范标签返回原始内容或至少提供原始内容的链接。这是因为选择的规范可以是完全不同的域。他们尝试选择原始来源作为规范,但在某些情况下,他们选择了错误的页面。 其中大多数通常不是问题。正如我所提到的,谷歌通常会选择一个或另一个版本作为规范。
|
|