首先,我们只讨论具有检索意义的url,即用户会从搜索引擎找到的页面。按照通常的方式阻止其他页面即可。由于很多站长喜欢讨论整体收藏量,我必须泼冷水。也许你的有效收藏是1/10。
网址参数
也称为 url 查询,这是一个更复杂的问题,更容易被忽视,也更容易受到损害。它是网站运营的重要组成部分。如果简单地去掉,其他部门就无法工作。
这类问题有几个缺点:
1、浪费搜索引擎对你网站的配额,从而影响其他正常页面。
2、大量本该失去的链接奖励积分都失去了。来自场外渠道的链接通常质量更高。同一url的得分可能分散为几十个部分。
3. seo流量统计到其他渠道(因为跟踪字段写在其他渠道,并且被收录和点击)
4. 经常出现这样的情况:产品使用一组 url,而 seo 使用另一组 url。使用不同的url,甚至不同的渠道使用不同的url,后期开发和维护的成本极高。
为了解决这个问题,首先要明确url的定义。以我的理解,每个url都是一个静态的、独立的、不重复的、有意义的实体,一般都具有检索意义(即有人可以搜索到)。例如,一个人、一辆车、一条路、一个物体。它不能混杂成各种“状态”。比如说这个人生病的时候,他不就是他自己吗?处于促销状态的一种产品是另一种产品吗?
理论上canonical标签可以解决这个问题,但是从实际测试结果来看,百度对于这个标签的支持优先级非常0,几乎可以忽略不计。那么我的解决方案是这样的:
1.为网站建立良好的思维导图和元信息。
2.所有与seo元信息相关的参数都放在路径中
3、所有与seo元信息无关的参数都放在#后面,因为#后面不影响web服务器返回的结果。内容。简单来说,就是用“#”代替“?”。
4、每个页面中使用js获取#后面的参数对,并通过第二次请求发送回统计服务器
5、如果#后面的参数影响页面内容,比如酒店入住日期。那么这部分内容就可以使用ajax来加载了。它不稳定并且不是页面内容的一部分。 (当然还有解决办法,所以我就不详细说了。)
6.原来的#锚点定义肯定会冲突。 #后面定义一个变量,用js控制屏幕滚动,起到原来锚点的作用。
可能有人认为,根据ua的判断,如果是搜索引擎爬虫,就用跳转的方式去掉url参数。但更有效的方法一定是从一开始就不显示错误的url。那么经过优化后,前面的例子就变成了:
事实上,很多网站已经使用了这种方法,但是仍然有很多网站由于开发效率问题而无法及时实施。因此,对于普通的小型网站,一定要考虑开发成本,不要轻易贸然投入。只要能够避免问题,就有很多解决方法。
在路径中使用非必要元素
跨屏网(网站建设)总结:
1.各部门均使用seo定义的url,屏蔽非seo url的入口。
2. 使用“#”代替“?”
3. 始终使用小写字母
4. 目录规范
5.从非标准url跳转到标准url
写在最后,以上就是对于“避免大量重复网址被百度收录”的一些看法,欢迎指正、交流。
信息题目:避免大量重复网址被百度收录
标题路径:http://test.kuaping.com/article/show9388.html
027-817-77732
133-434-77732