广东省快乐十分开奖网址

您现在的位置是:广东省快乐十分开奖网址 > 建站 > 网站优化网站优化

网页反作弊思路及处理方法

重庆seo博客2019-09-11【网站优化】人已围观

简介广东省快乐十分开奖网址受商业利益的驱使,许多站长会分析搜索引擎的排名,并采取一些措施来提高排名。这种行为没有错。许多优化行为符合搜索引擎排名规则,但同时也存在许多恶意优化行为。因此,网页反作弊也是所有商业搜索引擎需要解决的一个重要难题。

  一、网页反作弊出现背景

  受商业利益的驱使,许多站长会分析搜索引擎的排名,并采取一些措施来提高排名。这种行为没有错。许多优化行为符合搜索引擎排名规则,但同时也存在许多恶意优化行为。因此,网页反作弊也是所有商业搜索引擎需要解决的一个重要难题。

  快速跟踪技术(VX:seouakiapai)空雨将会谈到一些常见的互联网网页作弊方法,反作弊的整体思路,以及淘宝搜索的反作弊机制与传统网页搜索的异同。

  二、网页作弊类型内容作弊

广东省快乐十分开奖网址  从大的分类来看,主要的欺骗方法包括:内容欺骗、链接欺骗、隐藏欺骗和近年来兴起的web2.0欺骗方法。笔者认为内容欺诈与当前的业务密切相关,因此本文将重点探讨这种类型及相关的反欺诈理念。

  内容欺骗的目的是仔细改变或规范网页的内容,以便网页能够获得与它们的网页在搜索引擎排名中不相称的高排名。常见的欺骗方法包括:重复关键词、不相关的查询词、替代标签文本、页面标题、重要标签和元信息。通过这些常见的作弊方法,作弊者的作弊意图不过是以下几点:

广东省快乐十分开奖网址  1.增加目标作弊词的频率以影响排名;

广东省快乐十分开奖网址  2.增加无关内容或热门查询的流量;

  3.将目标作弊词插入关键位置会影响排名。

广东省快乐十分开奖网址  谷歌在2011年2月宣布,将高调调整低质量网页的排名算法。据报道,该算法已经影响了约11.8%的网页排名。调整措施专门针对需求媒体(成立于2006年5月,有500名员工,业务相当复杂,包括域名注册和内容广告交易)。它的主要业务之一是拥有一个由65个社交媒体组成的网站群。)该网站代表农场作弊行为的内容。

  内容农场的经营者以低廉的价格雇佣大量自由职业者来支持他们支付写作费用,但是内容通常质量很差,许多文章是通过复制和粘贴制作的。然而,关键是他们将研究搜索引擎等流行的搜索词,并将这些词有机地添加到写作内容中。这样,普通搜索引擎用户在搜索时会被内容农场网站吸引,通过大量低质量内容吸引流量,内容农场可以赚取广告费用。

  与传统的欺骗方法相比,内容农场不使用机械方法,例如通过机器拼接内容,而是雇用人员来书写。这种作弊方法往往很难让搜索引擎给出是否作弊的明确定义,但它严重影响了搜索结果的质量,因此是一种很难处理的作弊方法。

  三、网页反作弊技术的总体思路

广东省快乐十分开奖网址  目前,在搜索引擎中有各种各样的作弊方式。当搜索引擎相互响应时,它们也会相应地调整自己的技术思维。因此,如果你理清反作弊的思路,你会发现有很多技术方法,理清思路真的不容易。尽管如此,如果对大多数反作弊思想进行深入分析,就会发现总体思想仍然是有规律的。从基本思维的角度来看,反作弊方法大致可以分为以下三种类型:信任传播模型、不信任传播模型和异常发现模型。

广东省快乐十分开奖网址  1.信任传播模型(Trust propagation model):在海量的网页数据中,一些完全信任的网页(在我们日常生活中可以理解为白名单)通过某些技术手段或者人工和半人工手段被筛选出来。该算法使用这些白名单中的页面作为起点,并给予白名单中的页面节点更高的信任分数。其他页面是否作弊取决于它们与白名单中节点的链接关系。白名单中的节点通过链接关系向外扩展信任分数。如果节点最终获得的信任分数高于某个值,则认为没有问题。如果低于这个值,将被判定为作弊。

  2.不信任传播模型:就大的技术框架而言,它非常类似于信任传播模型。最大的区别是初始页面本身不是一个可信的页面节点,而是一组确认作弊存在的页面(也就是我们日常生活中所谓的黑名单)。给黑名单中的页面节点不可信的分数,并通过链接传播这种不可信的关系。如果最后一页节点的不可信分数大于设定值,将被判定为作弊。

  3.异常发现模型:对网页内容进行简单分析以发现异常,如词频和链接,对网站用户行为异常进行复杂分析等。异常发现模型通常与信任传播模型和不信任传播模型相结合。

  事实上,目前单纯的技术手段还不能完全解决作弊问题。因此,用户在浏览搜索结果甚至上网时报告作弊网页是很常见的。搜索引擎公司将有一个特别的团队来审查和积极寻找可疑的网页。经过验证的网页可以被列入黑名单或白名单。综上所述,有必要将人工手段和技术手段相结合,以达到更好的反作弊效果。

  四、通用链接反作弊方法

广东省快乐十分开奖网址  1.信任等级算法(属于信任传播模型)

广东省快乐十分开奖网址  2.badrank算法(属于不可信传播模型,据说是谷歌的反链接欺骗算法)。注意:不要链接到作弊页面)

广东省快乐十分开奖网址  3.spamrank(属于异常发现模型)

  Spamrank的基本假设是:

广东省快乐十分开奖网址  3.1 .对于普通页面,其支持者页面的pangrank值应满足幂律分布,即pr值从大到小变化。

广东省快乐十分开奖网址  3.2、作弊网页不同,一般有以下三个特点:

  一、支持者的页数很大

  二.支持者页面的pangrank得分很低。

广东省快乐十分开奖网址  三.支持者页面的pangrank值在一个小的浮动范围内。

  五、特殊环节反作弊技术

  1.识别关联农场:

  2.网页链接的统计分布规律,作弊网页链接不符合幂律分布

广东省快乐十分开奖网址  二.网页链接的统计分布规律。作弊网页链接不符合幂律分布

  Iii .url名称的统计特征。作弊网页的网址更长,包含更多的虚线和数字等。

广东省快乐十分开奖网址  四.虽然许多作弊网站的网址不同,但它们对应着相同的ip地址。

  ⅴ.网页功能会随着时间而变化,例如入站链接和出站链接的增长率。

广东省快乐十分开奖网址  ⅵ.相连农场的结构特征。农场中网页之间的链接非常紧密。

  2.识别谷歌炸弹:

广东省快乐十分开奖网址  判断锚文本是否与所指向的页面有语义关系

  六、识别内容作弊

  1.关键字的重复出现,以判断同一关键字是否连续出现在文本中某个大小的窗口中

  2.标题关键词作弊

广东省快乐十分开奖网址  3.统计正常页面中的句子长度、停顿词分布和词性分布规则

  七、反隐性作弊

  常见的隐藏欺骗方法包括页面隐藏和页面重定向。

  1.识别页面隐藏

  通过模拟手动访问网页的方式,对网页进行两次爬网,第一次爬网是普通搜索引擎,第二次爬网。这种方法非常昂贵。

广东省快乐十分开奖网址  2.识别网页重定向

广东省快乐十分开奖网址  Strider系统提供了一种基于网页重定向来识别哪些作弊网页的解决方案。

  八:石榴算法介绍

  2013年5月17日下午,百度网站搜索反作弊团队在百度站长平台上宣布,将在一周内正式推出新算法石榴算法。在新算法的早期阶段,重点将放在纠正包含大量妨碍用户正常浏览的不良广告的页面上。百度称此举是为了尊重搜索用户,净化互联网的生态环境。

广东省快乐十分开奖网址  攻击目标:针对大量不良广告页面和低质量内容页面,阻碍用户正常浏览。石榴算法特别针对弹出大量低质量弹出广告并混淆页面主要内容的垃圾广告页面。与之前的百度绿玫瑰算法相对应,这是百度搜索引擎提高用户体验和搜索质量的有力手段。2013年5月17日下午,百度网站搜索反作弊团队在百度站长平台上宣布,将在一周内正式推出新算法石榴算法。在新算法的早期阶段,重点将放在纠正包含大量妨碍用户正常浏览的不良广告的页面上。百度称此举是为了尊重搜索用户,净化互联网的生态环境。

  整改建议:有弹出窗口广告吗?并将其显示在主要内容位置?迅速摆脱它,获得短期利益,长期利益不受重视,就像借钱一次却忘记偿还一样。感觉像是你应得的,但事实上不是。你在别人心中的可信度正在逐渐减弱。这种类型的页面分数也会降低。

Tags:反作弊

很赞哦! ()

文章评论

    共有条评论来说两句吧...

    用户名:

    验证码:

本站推荐

站点信息