sencond time
本程序的主要功能是进行文本的查重,我们手上拥有一个1000000数据量的数据系统库,根据数据量,超过连续50个字符重复即为抄袭,同时能查出各个句子与文章整体的抄袭率,算法上使用的是KMP算法。
©Copyright 2023 CCF 开源发展委员会 Powered by Trustie& IntelliDE 京ICP备13000930号