论文相似度检测的“论文查重”正逐渐演变为一个产业,特别是像现在的毕业季。据说,淘宝网上提供“论文查重”服务的部分商家,就算没有传说中的几十万,月营业额数以万元计那也是家常便饭。
我们要做的事情很简单,就是替大家省钱,教大家一些技巧,应对查重。
各大查重引擎介绍
目前中国大学所采用的主要查重引擎有这些:
知网:
检测对比库:
中国学术期刊网络出版总库
中国博士学位论文全文数据库/中国优秀硕士学位论文全文数据库
中国重要会议论文全文数据库
中国重要报纸全文数据库
中国专利全文数据库
个人比对库
其他比对库,部分书籍不在知网库,检测不到。
知网论文检测的条件是13字单位以上的相似或抄袭都会被红字标注,但是必须满足如下前提条件:即你所引用或抄袭的A文献文字总和在你的各个检测段落中要达到3%(3%是知网灵敏度的阈值,以段落计,低于3%的抄袭或引用是检测不出来的,这种情况常见于大段落中的小句或者小概念)。
?知网再见!现在下论文全免费了!
万方
与知网数据库绝大多数相同,价格低廉。是一些大专、三表本科、升本二表、部分在职硕士所经常采用的一种查重引擎。相对而言,万方查重是最松的。
PAPERPASS
号称“最变态、最严格”,其实它外强中干。由于其数据库相对知网万方不全,故为了追求所谓“严格性”,经常性的用旁征博引的方法,肆意拉高其抄袭率。
比如:
曾经写过一篇关于中外文学英雄人物对比的核心期刊论文,PP显示抄袭了一篇香菇预防黄曲霉菌的论文;
肖学弟写过一篇关于提高广东发展银行支付效率的MBA毕业论文,结果被PP标注抄袭了一篇肌肉运动与康复的论文;
陈学妹有一次写了一篇幼教的硕论,结果PP查重标注抄袭了南京理工大学一篇电磁炮弹道的硕论……(难道小孩子喜欢拿电磁炮的弹头当玩具?)
然而一些“特殊学校”,则为PP的宣传所信,要求学生要用PP查重,于是各种扫红、各种悲剧。
最关键的是:PP的扫红,往往与知网扫红大相径庭!因为它们数据库不同,PP是靠旁征博引硬拉抄袭率才显得“严格”,就像两个女孩减肥,一个是用健康的有氧训练法,减掉的都是脂肪;另一个是为了追求体重轻而拼命喝泻药,结果减掉的是水分和纤维、肌肉,最后变成了一个满身脂肪和骨头的“怪胎”……
其他的查重引擎,像维普、PR等,以及一些学校自己开发五花八门的查重引擎,除了PR拥有比PP还要严格的查重率要求外,并无很多学校采用,故在此不予更详细介绍了。
Turnitin
这是一种专门用于查英文论文的查重引擎,它是以单词为标准,但是并不是机械的查重,而是如果仅仅是人称时态等简单变化的句子,连续8个单词还是会被扫红。
查重规律揭秘
“我明明每句话都改动了,为什么还是被扫红?”
“我明明每句话都标注引用了,为什么还是被扫红?”
“我明明改的非常多了,为什么还是被扫红?”
……这是因为没有了解各个查重引擎的规律。
下面我分别介绍一下:
知网
早期的知网是每20个字连续相同即判定为抄袭。几次升级后,知网查重已经变得越来越变态,现在不但连续6个字符相同就算是抄袭,哪怕一些句子中的主语和名词出现相同,即使连接词和虚词不同,也一样会被扫红。唯一的好处是:一些数学公式、定理是不会被扫红的。且基本不会对参考文献扫红。
然而知网比较吝啬,证据它是根据目录进行查重,如果它发现你上传的文档里有一个目录,而后面又出现一个目录,那么就认定是“合并查重”,就只会对第一个目录下的文档查重,后面的不闻不问。
万方
比较松的一种,基本是每10个字连续相同即为抄袭,且很少出现关键字相同连词不同也被扫红的问题。但是万方有一个问题:喜欢对公式定理与参考文献扫红。因此万方适合论文写作初期、大段大段抄袭并修改时期。
PP
很变态的一种。它不但连续4个字就算抄袭,而且不管神马公式定理名人名言参考文献,一律标红;只要出现一句话2个关键词相同,或是一句话的语法句式一样,哪怕风马牛不相及的两个专业的论文也被标红。
其他
像PR、维普等,更为变态,例如它们查数字和外文时,是以字母连续出现,而不是单词连续出现为标准的……
Turnitin
关于本节之处的“全文标注引用还是被扫红”这个问题,实际上就是:除了极少数公式、定理(理工类的)之外,哪怕引用名人诗词,99%也是要被扫红的。连参考文献名字都经常被扫红,何况参考文献里的内容?
相对来说,理工科的论文可以通过变换模型、改变数字解决查重问题,但文科呢?悲催的文科学弟学妹们……
论文查重工具
1.格子论文(http://www.gezida.com/)
首先查重就是两个字“免费”,每个账号每天两次免费查重的机会。不是3000字也不是4000字,而是管你多少字!简易报告完全免费,可查看全文检测结果及40%的相似内容,可在线修改40%的内容。要是你想要详细的pdf版本之类的那就是收费,收费500、不是50,而是5块钱······要是你比较牛逼,估计这5块钱都省了。不过小编周围的小伙伴一般花个5-10块钱就差不多搞定了,通常第一次查重都是重复率稍微高一些的,下个完整的报告对照改一改,然后再检查1-2次确认无误。
检测范围:互联网,中文期刊库(涵盖中国期刊论文网络数据库、中文科技期刊数据库、中文重要学术期刊库、中国重要社科期刊库、中国重要文科期刊库、中国中文报刊报纸数据库等),学位论文库(涵盖中国学位论文数据库、中国优秀硕博论文数据库、部分高校特色论文库、重要外文期刊数据库如Emerald、HeinOnline、JSTOR等)。——已经很给力了~
结果格式举例:
总体结论
论文字数:65432个
总相似比:19.22 (%) [即复写率与引用率之和]
检测指标:自写率 80.78 (%) 复写率 9.21 (%) 引用率 10.01 (%)
相 似 比:互联网资源 3.54(%) 学术期刊 2.77(%) 学位论文 2.90(%) 自建库0.0(%)
检测结果示意图
详细报告等
2.维普通达检测系统(http://gocheck.cn)
原来注册后可以免费使用三次,现在变成了3000字的免费试用。
3.知识产权卫士-拷克网(http://www.copycheck.com.cn/index.html)
论文检测系统,比对文献资源包括:
期刊论文资源:收录自1998年以来国内出版各类期刊6千余种,其中核心期刊2500余种,论文总数量达9千余万篇,每年增加200万篇,每周两次更新。
学位论文资源:收录自1980年以来我国自然科学领域各高等院校、研究生院以及研究所的硕士、博士以及博士后论文共计136万余篇。其中211高校论文收录量占总量的70%以上,论文总量达110余万篇,每年增加约20万篇。
会议论文资源:收录了由中国科技信息研究所提供的,1985年至今世界主要学会和协会主办的会议论文,以一级以上学会和协会主办的高质量会议论文为主。每年涉及近3000个重要的学术会议,总计97万余篇,每年增加约18万篇。
法规资源
每千字符数1元计费,不足一千字符数按一千字符数计;例:5100字符数6元,可以获得详细的检测结果报告。
4. 写邦WriteHelp(www.writehelp.cn)
3000字免费试用,然后收费标准是2元/3000字,相对便宜。
5. 中国搜文章照妖镜(http://www.zhongguosou.com/zonghe/fanchaoxi.html)
每次免费检测3000个字,不过可以多次使用,就是界面大概是论文查重几个网址里面属于“洗剪吹”行列的。看在他免费的份上,请忽略他低俗的外貌。
6. 论文检测最贴近大家的实际情况的当然是知网,它唯一的缺点就是贵(100+),有钱的小伙伴请勇敢的向前冲。
江湖上还有另外几款查重软件如paperpass等。
【点击图片免费领取】
来源:网络