中国知网查重的比例是怎么计算的?

如题所述

知网学术不端论文检测查重网

> 检测资讯 > 中国知网论文查重中关于“去除引用文献复制比”和“去除本人已发表文献复制比”析疑
中国知网论文查重中关于“去除引用文献复制比”和“去除本人已发表文献复制比”析疑
检测资讯 admin 5年前 (2016-08-23) 61089次浏览
初次使用中国知网学术不端查重系统,对“去除引用文献复制比”的百分比比较重视,对“去除本人已发表文献复制比”的百分比不太了解,甚至有点儿疑惑:

cnki

“去除引用文献复制比”很好理解,就是查论文中“去掉已经标明出处的文献”之后的重复率,“去除本人已发表文献”就应该是去除引用本人文献之后的重复率,本人文献也应该包括在前面的“去除引用文献复制比”之中,列出这两者意在何处?为何后者的百分比总是比前者的高?

其实这个查重系统主要的目的是查出引用别人的文字但是却不愿意注明人家的名字,把别人的文字拿来当做自己的,将别人的据为己有,这就是抄袭,所以,所谓的查重,就是查抄没抄的问题。,既然“引用文献”和“本人文献”都是在查重“去除”之列,那就说明这些“引用文献”和“本人文献”都是注明出处的规范的行为这些是可以重复的,当然不能太多,但是标准却又难以量化。

什么样的引用不算抄?就是引用别人的文字的时候注明出处,需要人家的东西的时候不是去偷偷拿来不敢声张,而是去借来。表现在文字上,偷偷拿多少文字过来算抄袭?一般的情况下,还是比较宽松的,“去除引用文献复制比”15%以下,可以勉强过关。但是,还是要说明的,如果一篇文章中在引用别人的文字时,倒也规规矩矩的注明出处了,太多的话,也不行,因为引用人家的太多,很容易就把别人的观点抄来了。就是说,如果你家里的东西全是明目张胆的去邻居家借来的,你能说这家里的东西都是你的吗?你只有使用权没有拥有权,占据这些东西的意义是什么呢?

所以“去除引用文献复制比”,就是去除了“引用自己的文字且标明出处”和“引用他人的文字且标明出处”的,去除了这些规范的引用文字,如果还有重复比率,那就是包括了“引用自己的文章没有标明出处的”和“引用别人文字没有标明出处的”,这些都是不规范的行为,一旦比率高了,就是抄袭了。

其实,一篇原创的论文,在“去除引用文献复制比”后,重复比率应该为0的,但是因为现在天下文章一大抄的现象太严重了,所以各个科研部门在查重的时候也不得不水涨船高,这就是法难责众,在人们“违法”现象太普遍的情况下,只好一律从轻处理,重新设定标准了。

“去除本人已发表文献复制比”后的重复率就包括了“引用他人文献注明出处的”,加上“用自己的已经发表过的文字但是没有注明出处的”,加上“用他人文字没标明出处的”,(重复自己已经发表的文字但是没有注明出处的也是不规范行为),这三类都是不规范的引用行为,比“去除引用文献复制比”后的重复率多了“引用他人文字有出处的”的规范的内容,即“去除本人已发表文献复制比”后的重复率中包括了引用他人文献的规范内容。所以查重结果如果有重复现象的话,“去除本人已发表文献复制比”后的重复率总是比“去除引用文献复制比”的重复率高一些。

查“去除引用文献复制比”的重复率目的是为了查不规范的行为,“去除本人已发表文献复制比”的查重主要目的是为了看文章在引用自己的文献之外还有多少是规范引用别人的和不规范的抄袭。如果不规范的比率低,而所谓的注明出处的规范引用现象比较严重,也应该予以注意,加以改正 。

举例:如果“去除引用文献复制比”的重复率是8.8%,那按照当前的标准来看,这样的文章不算是抄袭,应该算是不规范引用,把出处加上去就可以了。“去除本人已发表文献复制比”的重复率是43%,那么43%—8.8%=34.2%。那这个34.2%就是引用他人文献有出处的重复率,就是属于规范的重复率。但是这个貌似规范的重复率也实在太高了,就是说引用太多了也有剽窃他人文字表述的嫌疑,因此如果采用这样的文章,就要要求作者不仅把不规范的引用处注明出处,还要把一些引用太多的文献进行精简和删除。

由此可见,查“去除引用文献复制比”的重复率的主要目的是为了查出引用别人文字但是却尊重别人的知识产权的不规范行为,查出是否抄袭别人的观点和文字表述。就是说,“去除引用文献复制比”后的重复率中包括的全是不规范的引用行为,“去除本人已发表文献复制比”后的重复中包括了不规范的和规范引用的行为,所以,“去除引用文献复制比”的重复率是查抄袭最关键的一个数据,查重应该是因这个数据为主,而不是后者和总数据,目前有的单位看总比率据是有失偏颇的。

还有一个单篇数字重复最高的数据统计,可以适当作为“规范引用”太多的情况的参考,不管是注明出处还是没注明出处的引用,即使是规范的引用自己的文献,重复字数太多也是不规范的,这就有可能是把自己已经发表过的大部分文字和观点拿出来再发一次,就可能造成事实上的一稿多投,重复劳动,即使再发表出新的文章但是因为重复自己的太多,也就没有创见了。
温馨提示:答案为网友推荐,仅供参考
第1个回答  2024-03-15

中国知网查重的比例计算主要基于论文中的重复字数与总字数的比例。具体地,知网查重系统会对提交的论文进行扫描和转码,以区分句子、段落、章节、引用和参考文献等部分。然后,系统以章节为单位进行查重,计算每一个章节的重复率。如果连续出现8个字相似或抄袭,这会被判定为“重复句”,而连续出现13个字相似或抄袭,则会被判定为“重复段”。这些被判定为重复的句子或段落会着重进行检测。

最后,系统会自动计算论文的总重复率,公式为:总重复率 = 重复字数 / 总字数 × 100%。同时,系统也会计算每个章节的重复率,公式为:章节重复率 = 章节重复字数 / 章节总字数 × 100%。这些重复率会在查重报告单中标注出来,供用户参考和修改。

值得注意的是,知网查重系统对重复率设置了一个阈值,通常是以段落为单位,低于这个阈值的抄袭或引用可能不会被检测出来。这个阈值的具体数值可能会根据系统的更新和规则调整而有所变化。

综上所述,中国知网查重的比例计算是一个相对复杂的过程,涉及到多个步骤和因素。用户在使用知网查重系统时,应仔细了解系统的规则和要求,以确保论文的查重结果准确可靠。

相似回答