Warning: file_get_contents(/data/phpspider/zhask/data//catemap/2/csharp/258.json): failed to open stream: No such file or directory in /data/phpspider/zhask/libs/function.php on line 167

Warning: Invalid argument supplied for foreach() in /data/phpspider/zhask/libs/tag.function.php on line 1116

Notice: Undefined index: in /data/phpspider/zhask/libs/function.php on line 180

Warning: array_chunk() expects parameter 1 to be array, null given in /data/phpspider/zhask/libs/function.php on line 181
C# 比较文本时缺少/附加单词_C#_Diff_Levenshtein Distance - Fatal编程技术网

C# 比较文本时缺少/附加单词

C# 比较文本时缺少/附加单词,c#,diff,levenshtein-distance,C#,Diff,Levenshtein Distance,我想比较两个文本文件。只有拼写错误(缺少字符、错误字符或附加字符)时,我没有问题,但问题是缺少行/单词或附加字符时。 在我的研究中,我发现很多人建议用Levenshtein来比较文本,但我看不出它在这种情况下有什么帮助。 例子: 如果text1是: Montorgueil 1 Amalfi 8,20 1 Bali 3,90 而text2是: H Montorgueil bali 3,90 我必须想办法说我有一个额外的行“H”,一个缺失的行“1 Amalfi 8,20”和一个缺失的

我想比较两个文本文件。只有拼写错误(缺少字符、错误字符或附加字符)时,我没有问题,但问题是缺少行/单词或附加字符时。 在我的研究中,我发现很多人建议用Levenshtein来比较文本,但我看不出它在这种情况下有什么帮助。 例子: 如果text1是:

Montorgueil
1 Amalfi 8,20
1 Bali   3,90
而text2是:

H
Montorgueil
bali     3,90
我必须想办法说我有一个额外的行“H”,一个缺失的行“1 Amalfi 8,20”和一个缺失的字母“1”


有什么算法可以用吗?我甚至不想找代码。

你到底想得到什么?这两者应该相似吗?不同文本的示例是什么?在考虑任何算法的使用之前,您需要定义自己的基线。考虑提供3-4个样本输入/输出,它们是相似的,并试图确定你的边缘情况。你可能想在这里开始你的研究。我认为LevsHeTin距离只适合比较两个单词,看看它们是多么相似或不同。我怀疑它对你所做的事情有用。