浅析Google对原创文章的判定标准

Posted October 8, 2008

      阅读本文需要首先明确一个前提,就是Google对于原创内容的真正判定标准是绝密的。目前网上关于谷歌对原创网文的判定标准的文章都是推断性的。本文也跑不出这个范畴。其中的一些判定标准是大家公认的,还有一些内容是本人的一点儿皮毛认识。是否经得起推敲,还得靠时间来检验。

对于一篇网文,Google是如何判定它的原创性的呢?或者换个思路想:Google可能采用的判断标准是什么呢?

1、文章被收录的时间早晚,这个就不必多说了,先被Google收录的文章一定会增加其原创性的权重比重。

2、按我们人类的判定标准来说,一篇文章的核心思想是判定该文章是否有创造性的标准,它所表达的新思想、新主张之前别人没有想到,那么就可以认为是原创性的。那么,对于Google这个机器来说,它有这个能力吗?我想,按照目前科学的发展水平来看,暂时还达不到这个水平。那么Google又是通过文章中的什么要素来判定文章创性的呢?我想,应该是“词!”,Google会认真的记录下文章中以前未曾被收录的新词,并以此作为文章原创性的一个重要指标。这个“新词”将来被引用的次数越多,那么带给那篇该词的出处文章的原创权重的比重就越大。大家知道,Google本身就是这类新词的疯狂创造者,Google的新产品多年来层出不穷,大量新产品的涌现,也创造了无数的新词。精明的站长们靠这些Google新词大发横财!为了争夺这些新词的首发,Google那边刚有什么风吹草动,这边大侠们的文章就出来了,诸如什么“×××Google产品即将发布”、“×××Google产品beta版公测”、“×××Google产品今日发行或抢先试用”等等。这些文章在网上每每是发布最快的,大侠级的站长深知它们的重要性,一旦有什么重要的Google产品发布,他们不惜点灯熬油连夜成文。大家可以品一品,有多少著名博客不是靠Google起家的呢?因此,本人的结论是:一篇文章的新词,而且必须是有一定意义的新词是Google判定原创性的重要参考指标。

3、接下来还可能有什么判定标准呢?我的一个猜想是:词与词之间的联系。对于一种事物的认识一定包括其与周围事物之间的相互联系(哲学混混!)。如果在一篇网文中同时出现的两个词语,在之前的网文中从未同时出现过,那么,如果这两个词在以后的文章中多次同时出现,那么就会增加初始文章的原创权重。比如“Google Earth”这个词组,把每个词单拿出来都不具有原创性,但是组合到一起就成了一个新词,这个新词在“Google Earth”产品发布之初是具有原创性的。这样的词在权重比重上应该等同于本文的第二种情况。再举一个例子:网上有一篇标题为“7款PDF转换WORD的免费工具”的文章,其中的两个词“pdf”和“word”就是很好的原创组合,如果在这篇文章被Google收录之前没有相关的文章被收录,那么这篇文章的原创权重就会很高,因为在实际应用中经常会遇到需要将pdf和word文档相互转换的问题。首先将这两个词组合到一起的文章即会获得较高的原创权重,而后来的同类文章即使再精彩,恐怕对于Google这个机器(而不是人类)来说,在原创权重判定上也会吃亏不少。

4、接下来,我想文章结构和内容的合理性,也就是说发布的文章是否具有可读性或者说文章的撰写人是否认真是判定文章价值的又一重要指标。前面不是说“Google是机器,没有人的思想,不能对文章中心思想的好坏做出合理的判定吗?”,对!这话不假,但是Google却有能力判定它所搜到的文章是否是认真撰写的。如何判定呢?最简单的办法就是文中的关键词与整篇文章的语言环境是否统一(还是猜想),举个例子:一篇带有“音乐”这个关键词的网文,要想使“音乐”这个词在Google中得到有效的优化。那么在整篇文章中就一定要有与之相关联的词语,诸如:歌手名 歌曲名 网页链接中带有“mp3 wma”等字样,甚至于“试听 下载 播放 或是 windows media player”这样的词等等,都可以为其营造一个令Google信服的语言环境。Google通过这些来判定一篇文章是否是认真被撰写的。Google在不断的收录网页的同时也在不断的与时俱进的更新着关键词与其相关词的搭配权重关系,其特点有点儿像目前的智能化的中文输入法软件,比如:谷歌拼音。

5、还有的可能因素就是网站的主题,如果Google收录的文章的主题与其所在网站的主题不一致,可能会降低谷歌对于其原创性的权重比重。

6、网站的整体权重也可能影响谷歌的判断,诸如个人博客的文章被门户网站窃取这方面的例子太多了。

7、文章被浏览的次数和被backlink引用的次数。

8、其他影响因素。

应变对策:

1、要想使自己的文章获得较高的原创权重,最疯狂的、最有效的办法就是与诸位大侠们去抢夺Google新词吧,原则只有一个字:快!

2、在词与词的搭配上做文章,善于发现两个或多个事物彼此间的联系,这需要有一定的前瞻判断力。

3、转载别人的文章,但要有一定的修改才行,比如上面的那篇文章“7款PDF转换WORD的免费工具”,可以用自己的语言再复述一遍,技巧是一定要将其中的核心关键词改一改,将“word”改为“doc”、将“工具”改为“软件”,同时,在文章中再增加些相关词,如:office 、acrobat reader等以骗取Google的信任。还有,就是在全文的第一段合理的出现关键词,使文章紧扣主题。

4、发表的文章尽量围绕全站的主题来写。

5、主动出击,到各大网摘站、书签网站去发布自己文章的外链,以增加被引用的次数。

Comments

google对原创性判断要比百度准确的多

百度当然比不了谷歌,大家对于百度普遍都是一头雾水,没有几个能说得清。

我来过,带不走一片云彩。。。。。。。。。。留个脚印吧

就是了。不错呀。

真的很不错,现在才看到这篇文章,感觉看到的太晚了!

Displaying all 5 comments

Add comment