« 沉井施工图片,沉井下井示意图桥梁的基本组成图片 »

网站SEO噪音理论

2017年顺利通过一建市政,点击此处查看我的考试经验及心得

2018年一级建造师考试押题资料团购啦

很多外贸B2C网站,页面底部有一大堆链接,包括

关于我们  联系我们  代理合作

注册  登录  购物车 付款 …

货运条款  退货原则  付款方式  批发合作 私隐保护 …

一般的B2C网站都有数万个产品页面,每个页面都含有上述链接,很容易让搜索引擎判断失误,把这些链接当成是重要链接。

 

BuyOnMe的底部

 

 

京东商城的底部

 

这里就有一个链接结构和权重分配的问题。解决思路都是一样的,就是降低或者取消这些链接的权重。

 

几种方法:

1.  用 nofollow 标签

诸如 <a href=”URL” rel=”nofollow” >不重要的链接</a>,起码google和百度都是认nofollow的。根据zac以前提到的,据研究:nofollow虽然不会给目标链接带来权重,但还是会占据原来页面的权重。就比如,页面原来有10个完全平级普通链接,链接总权重10分,每个链接分配1分;如果我们将其中一个链接添加Nofollow,那么剩下9个还是每个一分,添加nofollow的则一分都没有了。

当然上面的只是大家对搜索引擎的猜测。经常我们说SEO是伪技术,很多就是这个原因,所有的人都只是猜猜猜,因为百度和谷歌不是SEOer自己家开的小店,你永远不知道对方的规则什么时候调整。我相信既然nofollow被百度和谷歌所采用,肯定会对添加nofollow标签的内容加以区别。因为nofollow不像<,meta name=keywords>标签可以很容易被滥用。一个人在自己网站里面添加了nofollow,更多的是告诉搜索引擎:这个链接不重要,别重视它,不会误导搜索引擎,所以搜索引擎没有理由不尊重nofollow标签的含义。

 

2. 用js代码

实际上搜索引擎对JS代码的穿透力很强,除非你刻意将JS写得很复杂,否则Google和百度都是能找到的。

这就提供了一种又能避免普通链接分权重,又不用担心搜索引擎进不去的方法。

比如可以用 windows.open (“”) 或者其他js代码来打开一个窗口。Buyonme网站就是用这种模式+nofollow模式实现的。

 

3. 用iframe的方法

因为可能会引起蜘蛛爬行的混乱,以及在不同平台浏览器下的现实效果差异,所以不太推荐这种方法。

 

4. 用Ajax控制隐藏和显示

上面是 amazon.cn 亚马逊中国的例子。在每个产品下面,都有大量的用户评论和相关论坛话题,包含很多链接。这些内容,对搜索引擎来说,会分散产品页的主题,但对用户又不能不显示。所以amazon采用了很巧妙的方法,利用ajax技术,当下拉条移动到最下方的时候,才显示出来,否则就不显示。类似的例子,在京东商城中也见到了。

在笔者最常接触的外贸B2C网站(china-based)内,好像还没有印象见到这种做法,包括newegg


什么是网页噪音?所谓的网页噪音,就是我们在浏览网页,从中获取所需信息的同时,看见大量和我们所关心内容无关的内容,如广告信息、版权信息等,以及大量存在于整个网站中的模块等,这些都属于噪音。

有效的去除和网页主题内容无关的噪音内容,提取网页的元数据信息,如关键词、摘要、网页内容类别等,是Web信息处理的一项重要内容。在网页搜集的过程中,通过两个数据结构unvisited_table和visited_table,我们可以完全避免对相同的url执行多次网页抓取过程。但这并不保证抓到系统中来的网页都是不同的。

网络上大量的转载现象使得内容真正“独一无二的”网页要比实际搜集到的网页少很多。将相似的网页识别出来,当查询发生时只返回一个代表,这既是提高查询服务效率的需要,也是提高查询服务质量的需要。

搜索引擎消除噪音的前提就是准确判断出噪音块,噪音块的特征有:一般链接居多,多数处于网页中的边栏、页眉(导航条)、页脚等等。

搜索引擎要消除网页噪音的目的很明确,为了更好的得知页面的主题内容,也就是正文内容。如果没有消噪的话,页面上的一大堆无意义信息都会被计入。比如新浪这种大型网站,往往边栏的总信息量是接近甚至超出正文的,把这些噪音内容计入排名的话,显然不怎么妥当。

然后就是搜索引擎对于正文内容的定义,首先正文的文字内容自然是毋庸置疑的包括在其中,另外正文底下(注意位置,放在边栏很可能不算)的相关文章链接也是计入正文内容的,因为浏览者想要进入下一个页面继续浏览的话,一般都会去点击相关链接。但不排除少数时候有人也会去点击边栏上的不相关链接,但是其几率相对而言低得多,所以SEO上来讲,噪音链接效果虽然有,也就差得多。

之后噪音内容的定义,就是与正文无关的链接、文本等等,也可以说是一个集合中的共性。如果一堆页面里,所有页面的同一个块地方都是同样的几个链接,那么这一块地方就肯定算做是噪音块。从这点上也可以解释为什么全站链接的效果没以前好。

那么,是不是网页中噪音越低越好?其实并不是,如果看过类似“高频无关词”之类的理论的话,就会知道搜索引擎其实是会根据噪音块来确定正文位置,然后赋予正文一定的权重。