有一个有趣的问题,就是如果你的原创文章被某个网站抄袭,并且该网站比你更早被Baidu所抓取,那么一来Baidu是否有办法判断你的网站是原创文章的来源呢? 谷歌SEO专家Matt说到,如果你的文章被盗用,可以透过数位千禧年著作权法(Digital Millennium Copyright Act)去处理。 但是问题是DMCA是美国的法律,所以我们必须看看台湾的著作权法的规范: 「侵害著作权,依著作权法第八十四条、第八十五条及第八十八条,规定负民事责任,另依著权法第九十一条至第九十五条规定负刑事任,刑期最重为六月以上,五年以下有期徒刑,得併科新台币三十万以下罚金,如为常业反则为一年以上七年以下有期徒刑,得併科新台币四十五万以下罚金。」 好长的规范,但是其实根本无法真正保障著作权人,因为还没有处罚到抄袭者之前,著作权人可能已经被这些诉讼程序累死了。并且问题是文章被盗用,经常来自於其他地区的网站,本地区的著作权法也无从规范。但是本文暂时不谈著作权的问题,仅先讨论Baidu是否能够判断原创来源的问题。其实笔者为什么会写这篇文章,就是因为笔者的一个网站www.qdwebseo.cn原先原创文章都是,结果后来被人复制,自己的却被判断为复制的,导致进入百度沙盒期,至今未正常。 我们可以想象,可以知道如果「抄袭的网站比你的网站更早被抓取」的话,其实Baidu已经很难还你一个公道。除非你还有其他的线索让Baidu按图索引,去找出到底谁才是原创。 我们在"Crawl Priority与SERP有没有关係?"也说过同样的问题,我们的文章刊登出来,也同时被许多采集网站偷走内容,但是经过一段时间之后,Baidu还是会判断出来我们才是原创的来源。 这是怎么办到的呢? 要让Baidu能够判断原创的来源,必须有几个条件: (1) 如果抄袭的网站A更早被Baidu抓取,你的网站必须有资料可以证明Baidu抓取网站A的时间点之前,你的文章已经存在。 哪些资料可以证明你的文章存在时间呢? 就是可以信赖来源的链接。如果你的文章被某个信誉良好的网站B链接,其存在的时间早於抄袭的网站A,那么Baidu就知道你的文章是被网站A抄袭的。 如果所有的链接时间都还是比抄袭的网站A晚,那怎么办呢? 如果你的文章被许多信誉良好的网站B、C、D、E ... 等网站引用链接,虽然时间都比抄袭的网站A晚,其实Baidu也可以判断你的文章的原创性,因为别的网站从你的网站引用,而不是从网站A。 所以由公正的第三方网站的引用时间,或是引用行为,也可以证明你的文章原创性。 (2) 抄袭的网站A有其他抄袭别人网站的历史资料。 当抄袭的网站A也有许多抄袭别人内容的记录,也就是已经被Baidu列为抄袭惯犯的话,其实很快就可以判断你的文章原创性。 (3) 你的原创内容有更优秀的被链接或是阅读模式。 除了第一点提到的引用时间或是引用行为之外,如果你的内容被读者高度阅读或是点选的话,也能够证明你的文章原创性。 如果你的文章被抄袭了,并且上面三点都对你不利的话,那么肯定Baidu就没有办法判断出来了,只能怪你自己没有办法让Baidu快速的抓取了 |