Warning: file_get_contents(/data/phpspider/zhask/data//catemap/9/java/345.json): failed to open stream: No such file or directory in /data/phpspider/zhask/libs/function.php on line 167

Warning: Invalid argument supplied for foreach() in /data/phpspider/zhask/libs/tag.function.php on line 1116

Notice: Undefined index: in /data/phpspider/zhask/libs/function.php on line 180

Warning: array_chunk() expects parameter 1 to be array, null given in /data/phpspider/zhask/libs/function.php on line 181
如何检查文件中的java代码复制_Java_Algorithm_File_Code Duplication_Plagiarism Detection - Fatal编程技术网

如何检查文件中的java代码复制

如何检查文件中的java代码复制,java,algorithm,file,code-duplication,plagiarism-detection,Java,Algorithm,File,Code Duplication,Plagiarism Detection,我正在进行一个项目,我必须检查两个文件之间的剽窃。在两个文件中有一些java代码。这意味着如果有两个名为a.java和b.java的文件,在两个文件中有一些java代码,它们是用java类编写的,我必须检查由两个文件编写的java代码之间的矛盾。 有人能告诉我如何解决这个问题吗?我是一个初学者。有几种方法可以做到这一点,但一般来说,您必须使用第三方服务 示例解决方案1: 将插件安装到IDE。例如,如果您使用的是Eclipse,则支持重复代码检查 示例解决方案2: 如果您使用的是像GitHub这样

我正在进行一个项目,我必须检查两个文件之间的剽窃。在两个文件中有一些java代码。这意味着如果有两个名为a.java和b.java的文件,在两个文件中有一些java代码,它们是用java类编写的,我必须检查由两个文件编写的java代码之间的矛盾。
有人能告诉我如何解决这个问题吗?我是一个初学者。

有几种方法可以做到这一点,但一般来说,您必须使用第三方服务

示例解决方案1: 将插件安装到IDE。例如,如果您使用的是Eclipse,则支持重复代码检查

示例解决方案2:
如果您使用的是像GitHub这样的版本控制系统,您可以向存储库添加插件,它将为您进行检查。例如,您可以使用名为的插件。它是一种在CI/CD中使用的自动测试工具,支持重复代码检查。

有几种方法可以做到这一点,但一般来说,您必须使用第三方服务

示例解决方案1: 将插件安装到IDE。例如,如果您使用的是Eclipse,则支持重复代码检查

示例解决方案2:
如果您使用的是像GitHub这样的版本控制系统,您可以向存储库添加插件,它将为您进行检查。例如,您可以使用名为的插件。这是一个在CI/CD中使用的自动测试工具,支持重复代码检查。

这里有20种算法,您可以使用。您可能会发现这个网站很有趣:据我回忆,这里有一个第三方相似性检查程序,但我认为它们还提供了一个API,允许独立使用。我确实注意到他们说“Moss不是一个完全自动检测剽窃的系统。”(完整的声明见网站)。继我之前的评论之后,有一篇文章链接到该网站:它公开了Moss服务使用的技术,这是一篇有趣的阅读(虽然有些地方非常数学化,但这些大多是证明,而不是实现细节)。这主要是关于“指纹k-grams”(文档的k长度片段)还有一个叫做“筛选”的过程,可以有效地选择指纹子集来描述文档的特征——根据我的理解!@BillNaylor我必须用我自己的java代码来解决这个问题,而不需要任何第三方检查程序。有什么算法可以帮助解决这个问题吗?如果你看一下我参考的论文,这篇文章详细介绍了一些算法(似乎您确实需要一个数字来执行所需的任务)。从我所能看出,您似乎1)对每个“k-grame”进行指纹识别,2)将每个指纹与文档中的一个位置关联,3)使用“Winnowing”算法来识别文档的特征(指纹、位置)对,4)解决相互矛盾的文件。检查一下报纸!这里有20种算法你可以使用,你可能会发现这个网站很有趣:据我回忆,这里有一个第三方相似性检查器,但我认为它们也提供了一个API,允许独立使用。我确实注意到他们说“Moss不是一个完全自动检测剽窃的系统。”(完整的声明见网站)。继我之前的评论之后,有一篇文章链接到该网站:它公开了Moss服务使用的技术,这是一篇有趣的阅读(虽然有些地方非常数学化,但这些大多是证明,而不是实现细节)。这主要是关于“指纹k-grams”(文档的k长度片段)还有一个叫做“筛选”的过程,可以有效地选择指纹子集来描述文档的特征——根据我的理解!@BillNaylor我必须用我自己的java代码来解决这个问题,而不需要任何第三方检查程序。有什么算法可以帮助解决这个问题吗?如果你看一下我参考的论文,这篇文章详细介绍了一些算法(似乎您确实需要一个数字来执行所需的任务)。从我所能看出,您似乎1)对每个“k-grame”进行指纹识别,2)将每个指纹与文档中的一个位置关联,3)使用“Winnowing”算法来识别文档的特征(指纹、位置)对,4)解决相互矛盾的文件。检查一下报纸!我正在经历一个无法使用任何第三方服务的项目。有没有什么算法可以解决java平台文件中代码的双重性?我正在经历一个无法使用任何第三方服务的项目。是否有任何算法可以解决java平台中文件中代码的双重性?