避免大量重复网址被百度收录_头条_资讯

避免大量重复网址被百度收录

文章导读：本文主要阐述了“避免大量重复网址被百度收录”首先，我们只讨论具有检索意义的url，即用户会从搜索引擎找到的页面。按照通常的方式阻止其他页面即可。由于很多站长喜欢讨论整体收藏量，我必须泼冷水。也许你的有效收藏是1/10。网址参数也称为 url 查询，这是一个更复杂的问题，更容易被忽视，也更容易受到损害。它是网站...，本文由跨屏网最后更新于2023-11-11，全文共1136个字，预计阅读时长3分47秒。

首先，我们只讨论具有检索意义的url，即用户会从搜索引擎找到的页面。按照通常的方式阻止其他页面即可。由于很多站长喜欢讨论整体收藏量，我必须泼冷水。也许你的有效收藏是1/10。
网址参数
也称为 url 查询，这是一个更复杂的问题，更容易被忽视，也更容易受到损害。它是网站运营的重要组成部分。如果简单地去掉，其他部门就无法工作。
这类问题有几个缺点：
1、浪费搜索引擎对你网站的配额，从而影响其他正常页面。
2、大量本该失去的链接奖励积分都失去了。来自场外渠道的链接通常质量更高。同一url的得分可能分散为几十个部分。
3. seo流量统计到其他渠道（因为跟踪字段写在其他渠道，并且被收录和点击）
4. 经常出现这样的情况：产品使用一组 url，而 seo 使用另一组 url。使用不同的url，甚至不同的渠道使用不同的url，后期开发和维护的成本极高。
为了解决这个问题，首先要明确url的定义。以我的理解，每个url都是一个静态的、独立的、不重复的、有意义的实体，一般都具有检索意义（即有人可以搜索到）。例如，一个人、一辆车、一条路、一个物体。它不能混杂成各种“状态”。比如说这个人生病的时候，他不就是他自己吗？处于促销状态的一种产品是另一种产品吗？
理论上canonical标签可以解决这个问题，但是从实际测试结果来看，百度对于这个标签的支持优先级非常0，几乎可以忽略不计。那么我的解决方案是这样的：
1.为网站建立良好的思维导图和元信息。
2.所有与seo元信息相关的参数都放在路径中
3、所有与seo元信息无关的参数都放在#后面，因为#后面不影响web服务器返回的结果。内容。简单来说，就是用“#”代替“?”。
4、每个页面中使用js获取#后面的参数对，并通过第二次请求发送回统计服务器
5、如果#后面的参数影响页面内容，比如酒店入住日期。那么这部分内容就可以使用ajax来加载了。它不稳定并且不是页面内容的一部分。（当然还有解决办法，所以我就不详细说了。）
6.原来的#锚点定义肯定会冲突。 #后面定义一个变量，用js控制屏幕滚动，起到原来锚点的作用。
可能有人认为，根据ua的判断，如果是搜索引擎爬虫，就用跳转的方式去掉url参数。但更有效的方法一定是从一开始就不显示错误的url。那么经过优化后，前面的例子就变成了：
事实上，很多网站已经使用了这种方法，但是仍然有很多网站由于开发效率问题而无法及时实施。因此，对于普通的小型网站，一定要考虑开发成本，不要轻易贸然投入。只要能够避免问题，就有很多解决方法。
在路径中使用非必要元素

跨屏网（网站建设）总结：
1.各部门均使用seo定义的url，屏蔽非seo url的入口。
2. 使用“#”代替“?”
3. 始终使用小写字母
4. 目录规范
5.从非标准url跳转到标准url