当前位置: 首页 > 查重资讯 > 知网查重 > 学校知网查重学术不端行为检测系统、万方查重、维普查重、turnitin等知网查重系统的比较

学校知网查重学术不端行为检测系统、万方查重、维普查重、turnitin等知网查重系统的比较

时间:2019-05-08 21:43:10 编辑:毕业帮

  学术界, 特别是高校和科研机构, 一直被大家誉为“象牙塔” 。人们希望在日趋功利化的社会中, 能存留着这样一片净土。然而, 近年来在我们认为纯洁的这片净土上, 却发生了不少抄袭造假、权学交易等学术不端事件── “汪晖事件[ 1] ;浙大“论文造假”事件[ 2] ;刘兴土院士事件[ 3] 等等。学术不端事件频发, 让越来越多的人对中国科技事业的未来开始担忧。20世纪以来, 科研经费成为一种稀缺资源配置, 随着科研队伍的扩大, 不可避免地在有限资源和职位上出现竞争。一直以来, 学术界上上下下都在强调学风建, 学术不端事件却因何屡禁不止? 对于这一连串学术造假事件所暴露出的学术评估乏力问题, 复旦大学葛剑雄教授呼吁:“我们需要独立学术机构的独立调查” 。清华大学教授蔡继明建议[ 4] , 目前学术监管可以通过引入民间第三方的独立审查机构来保证监管的公开、透明、公平。

 

  为了贯彻落实好这个第三方的独立审查机构, 并且使这个机构有客观公正的态度和作风, 在计算机信息飞快发展的今天, 我们首先可以做的就是努力建设一个有着全面的系统的学术不端文献检测系统平台的第三方机构。这个平台的建设对提高我国科技发展水平、加快建设科技期刊强国, 对全面建设小康社会、加快推进社会主义现代化、实现中华民族伟大复兴具有重大而深远的意义。

 

  1 什么是学术不端行为

 

  1992 , 由美国国家科学院、国家工程院和国家医学研究院组成的22位科学家小组给出的学术不端行为的定义[ 5] :在申请课题、实施研究报告结果的过程中出现的捏造、篡改或抄袭行为。即不端行为主要被限定在“伪造、篡改、抄袭” (FFP) (Fabrication, Falsification, Plagiarism)三者中。

 

  中国科协科技工作者道德与权益工作委员会提出了我国学术不端行为的七种表现形式[ 6] :抄袭剽窃他人成果、伪造篡改实验数据、随意侵占他人科研成果、重复发表论文、学术论文质量降低和育人的不负责任、学术评审和项目申报中突出个人利益、过分追求名利和助长浮躁之风。

 

  在中国著名生命科学家邹承鲁看来:在我国学术上的不端行为还应包括伪造学历和工作经历、贬低前人成果、自我夸张宣传、一稿多投、在自己并无贡献的论文上署名、为商业广告作不符合实际的宣传等[ 7]

 

  虽然以上各种定义存在差别, 但实质内容大体相同, 即学术不端行为是指在学术研究过程中出现的违背科学共同体行为规范、弄虚作假、抄袭剽窃或其他违背公共行为准则的行为。大致都把现有主要的学术不端行为分为以下这四类:抄袭、伪造、篡改及其他。“其他”主要包括不当署名、一稿多投、一个学术成果多篇发表(不包括科研阶段性成果的发表)等不端行为。

 

  2 国内科技文献数据库的学术不端文献检测系统平台

 

  2.1 CNKI科技期刊学术不端文献检测系统(AMLC)

 

  CNKI科研诚信管理系统研究中心是同方知网出版集团旗下从事科研诚信管理产品研发的专门机构, 中心主要从事学术不端文献检测系统、科研诚信档案管理系统等软件研发。同时也承担相关机构委托的科研诚信监测、管理等事务。还为各单位的学术评价提供科研诚信方面的参考数据, 辅助进行学术评价。它旗下的中国学术期刊(光盘版)电子杂志社(CNKI)的科技期刊学术不端文献检测系统(AMLC) 2006年开始正式立项研发到目前已经达到大规模实用化的成熟程度。2008年底, AMLC管理办公室开始为CNKI提供每期数据的期刊编辑部免费提供刚开发完成的《科技期刊学术不端文献检测系统(AMLC)》。

 

  如期刊编辑部希望使用该系统, 可以邮寄、传真方式向中国学术期刊(光盘版)电子杂志社AMLC[ 8] 管理办公室提交《AMLC使用申请》, 签订授权使用协议, 就可以通过CNKI 的客服人员直接开通本编辑部的系统使用账号, 这个账号只能用于检测本刊的来稿和已发表文献。

 

  AMLC系统建设是一个系统工程, 涉及检测方法设计、比对数据库建设、规范数据库建设、大规模数据测试、系统性能测试等多个环节。系统目前的检测范围涵盖中国学术期刊网络出版总库、中国博士论文网络出版总库、中国优秀硕士论文网络出版总库、中国报纸全文数据库、中国专利全文数据库(知网版)、中国科技成果数据库(知网版)、中国年鉴网络出版总库、中国工具书数据库、中国标准数据库(知网版)。正陆续引进英文数据库、网络数据库等资源。AMLC可以进行快速文献比对。以CNKI各库为比对基础库, 2 5秒内完成一篇5000汉字的文献比对, 出示比对结果。并支持批处理。用户可上传包含多篇文献的压缩文件进行检测。其比对结果经过标红, 且有定位功能。能够快速发现文字重复的部分, 方便快捷。另外在结果中将详细显示比对源文献的篇名、作者、发表刊物、发表时间等信息, 便于用户参考。

 

  经笔者所在编辑部试用, AMLC可以检测的文献格式包括:cajdocpdftxt文本以及包括上述格式文献的压缩文件。用户也可对已提交文献进行重新检测、修改、删除操作。点击提交文献的篇名即可细览该文献的监测结果。

 

  另外, 用户还可以删除系统给出的某些抄袭来源文献, 得到新检测结果。如果用户点击抄袭来源篇名, 就可以查看文件相似内容对比情况了。

 

  2.2 万方论文相似性检测系统

 

  万方论文相似性检测系统是基于万方数据公司所收录的期刊论文、学位论文、万方数值数字化期刊全文数值库、万方数值学位论文、常识服务平台的全文数值库等海量数据, 运用先进的检测算法研制而成, 它具有检测速度快、检测准确等特点。国内第二大数据集成商万方数据, CNKI推出AMLC 一年零一个季度之后终于拿出了一个与CNKI相提并论的产品, 20103, 万方公司的网站上出现了万方论文相似性检测系统的链接http://check.wanfangdata.com.cn, 通过论文相似性检验测定体系的官网[ 9] , 万方数据将检测费用定义在10元每万字, 可以直接通过自己在万方数据的账户登录, 并进行论文的检测, 通过检测可以看到万方数据提供了简明和详细两种检测报告。

 

  2.3 维普——— 通达论文引用检测系统

 

  国内第三大数据集成商维普资讯, CNKI推出AMLC 一年零3个季度和万方数据推出论文相似性检系统半年之后终于也拿出了一个与CNKI和万方数据相提并论的产品——— 论文引用检测系统.2010 9 月起个人用户在维普——— 通达论文引用检测系统的官网http://www.gocheck. cn注册就可免费检测自己的文章。

 

  维普——— 通达论文引用检测系统经过部分高校及社会个人用户的测试, 已经面向企事业用户、个人用户全面公开免费试用, 用户仅需填写真实的邮箱快速注册即可免费享受论文引用检测服务。

 

  该论文检测系统是基于多年数据挖掘技术领域的成功经验, 应用于文本比对检测领域上的成熟产品。该系统将自主研发的大规模文本处理技术, 应用于论文内容创新性评价系统, 能够高效的与海量文本资源进行比对, 检测出重复及引用片段等, 并且能够计算出论文的复写率、引用率及自写率(对论文内容创新性评价)等指标[ 10]

 

  该系统集合了专业的数据库资源, 针对不同类型用户的需求, 可提供专业的个人自检测服务、高校学生论文检测服务、期刊稿件检测服务以及其他类型的检测服务等。

 

  该系统可以满足教育界、出版社、媒体、科研机构等行业客户及各类论文撰写者等不同用户的需求。通过该系统, 我们可以查出该文作者的自写率是多少。

 

  2.4 ROST反剽窃系统(学术论文不端行为检测系统)

 

  ROST反剽窃系统(学术论文不端行为检测系统)是由武汉大学信息管理学院出版科学系沈阳教授带领课题小组开发成功的文档相似性检测工具。可有效检测论文的抄袭相似情况, 经过6年的研发(早期版本叫做网盗克星), 推出了6.0版本。

 

  ROST反剽窃系统可以自动将文档切割为多个50 200 (可自定义)的小文本, 通过混合引擎与188 亿个网页和490万篇文献进行柔性匹配, 标示出每个文本块与文献库中的文献的最大相似度。由此软件统计出相似度≥ 95%(基本原封不动拷贝)与相似度≥ 80% (拷贝后略作修改)的字数所占总字数比例。软件把这个比例作为相似程度参考衡量指标。“ ROST反剽窃系统”与其他系统最大的不同之处在于覆盖了188亿个网页以及490万篇论文。

 

  自ROST反剽窃系统20084月推出以来<