rost反剽窃系统是一款简单好用的论文检测系统,可以帮助用户会计检测出论文的抄袭相似情况,包含聊天分析、全网分析、网站分析、浏览分析、微博分析、期刊分析等多种功能,杜绝抄袭问题,推荐有需要的朋友下载!

基本原理
反剽窃软件自动将文档切割为多个50到200字(可自定义)的小文本,通过混合引擎将其与188亿个网页和490万篇文献进行模糊匹配,标示出每个文本块与文献库中的某些文献的最大相似度。由此软件统计出相似度≥95%(基本原封不动抄袭)与相似度≥80%(略作修改后抄袭)的字数所占总字数比例。我们把这个比例作为剽窃(相似)程度衡量指标。
系统需要XP系统,word2003环境。
软件功能介绍
1.覆盖面广,通过混合引擎覆盖约188亿个网页和490万篇论文。系统采用自研的ROST WebSpider算法实现了对互联网和期刊网的广度覆盖。但需要提醒您的是,本反剽窃系统不能覆盖所有文献。
2.模糊检测,柔性匹配,不管抄袭者如何替换部分字符,删除部分标点符号,系统都能通过相似度来进行判定,让抄袭者无所遁形。系统采用自研的ROST Similar算法实现高速相似性检测和度量。系统采用自研的QingQing算法提取信息指纹,在P3、512MBPC上,分词速度为13MB/S,已在互联网提供评测版供业内评测。
3.引文及参考文献去除,使得误判的可能性降至最低。
4.分块检测机制,将文章的每一文本块与其他文档的相似度都精确的表示出来了,每一文本块约为200字至400字不等,以红色表示极度相似(相似度大于80%),一目了然,清晰醒目。
5.相似文档模块跟踪技术,可以通过简单操作直接定位相似文档模块位置,直观明了。
6.方便的结果分析功能,自动分析文档相似结果,给出评价意见。
7.支持多种文件格式的文档,包括PDF、DOC、PPT、XLS、TXT等文档。 (PDF文件需另行安装ROST文件格式识别引擎)
8.可将分析结果进行存盘为专有数据文件,不用反复查找浪费时间。
9.应用范围广泛:可用于抄袭鉴定、科技查新、专利查新、引用查询、转载查询等多个领域,也可用于追查文献的流传图,绘制文献的传播发布路线。可以为多类学术机构、文献机构以及个人服务。
软件说明
rostcm主要包括三个部分:全网检索、本地文献库对比和少量文献对比。
软件栏目有聊天分析、全网分析、网站分析、浏览分析、微博分析和期刊分析。
通过这套系统,我们能够判断论文是否是抄袭的。在分析论文是否抄袭部分,还可以进行功能性分析(字频分析、英文词频分析、中文词频分析、社会网络和语义网络分析、情感分析、流量分析、TF/IDF批量词频分析、相似分析),从而让剽窃的论文无处藏身。
rost反剽窃系统使用教程
打开软件,选择word文档,好像还支持txt,pdf文档。记住,机器上需要word环境,docx好像不支持。
出现这种情况之后。
个人认为超过80%的那段就应该好好的检查,至于什么语义检测,我认为目前还是扯淡,沈教授不要生气啊,
检测比较慢,后台对比了几百万篇论文和网页数据,不过这也正常,人间给你免费用。就要知足。
论文检测的结果,标示出了“相关文献摘要”“相关文献”“相关度”“是否为引文”
等待这些检测结果之后,就会出现下面的结果
包括总长途、相似感大于95%,所占比例
软件优缺点
优点
覆盖面广,通过混合引擎覆盖约188亿个网页和490万篇论文。系统采用自研的ROST WebSpider和ROST SEAT算法实现了对互联网和部分期刊网的广度覆盖。
模糊检测,柔性匹配,为防止抄袭者替换部分字符,删除部分标点符号,系统通过相似度来进行判定。系统采用自研的ROST Similar算法实现高速相似性检测和度量。系统采用自研的QingQing算法提取信息指纹,在P3、512MBPC上,分词速度为13MB/S,已在互联网提供评测版供业内评测。
本软件检测结果只能作为一个参考,可以使用表格右键导出详细检查结果发送给被检查本人,本软件不对是否剽窃做结论,只是告诉你与现存文献相似度高于80%的文字比例所占文章总数比例是多少。高于80%相似度的文字才是需要关注的。低于此值可以完全无视。
规范引文及参考文献去除,降低误判可能性。
自定义分块检测机制,将文章的每一文本块与其他文档的相似度都精确的表示出来了,每一文本块约为50字至200字不等(可自定义),以红色表示极度相似(相似度大于80%),一目了然,清晰醒目。当设为50个字一块时,可以在较低信息粒度上查找出可能抄袭或相似的文献。
相似文档模块跟踪技术,可以通过简单操作直接定位相似文档中哪些内容被抄袭或者拷贝,直观明了。
结果分析功能,自动分析文档相似结果,给出评价意见。
多种文件格式支持,包括PDF、DOC、PPT、XLS、TXT等文档。
专有数据文件保存,不用反复检测,浪费时间。
缺点
本反剽窃系统不能覆盖世界上所有中英文文献,关于覆盖率与查全率的相关性问题,正在研究中。
检测时间略长,本软件每检测200字需要7秒钟,一篇8000字的文档至少耗费约5分钟,需要一点点耐心。
本软件检测结果存在一个小的误差,用更小的文档块进行检测,可以减少误差,但需要的时间会相应增加,经过我们在多家编辑部的试用情况,块数大小定为200字较为合适,此时误差率也是可以接受的,文档相似率一般是比实际的要低。