一个很好的字符串比较算法(如Total Commander compare) < >我想在C++中创建一个字符串比较脚本。 Total Commander文件比较功能非常好:

一个很好的字符串比较算法(如Total Commander compare) < >我想在C++中创建一个字符串比较脚本。 Total Commander文件比较功能非常好: ,c++,string,algorithm,compare,string-comparison,C++,String,Algorithm,Compare,String Comparison,这个算法是如何工作的? 有人能分享这个函数的一个片段吗?我不能告诉你,total commander是做什么的。也许有人可以把它拆开,试着追踪技术 但一个常见的算法是: 字符串搜索算法。这当然也有助于进行比较 另请参阅本帖: 最好的祝愿从零开始,我会像伪代码一样处理这个问题: String[] sarr1 = string1.split(); for (int i1 =0; i1<sarr1.length; i1++) { if (!string2.contains(sarr[i1

这个算法是如何工作的?
有人能分享这个函数的一个片段吗?

我不能告诉你,total commander是做什么的。也许有人可以把它拆开,试着追踪技术

但一个常见的算法是:

字符串搜索算法。这当然也有助于进行比较

另请参阅本帖:


最好的祝愿

从零开始,我会像伪代码一样处理这个问题:

String[] sarr1 = string1.split();

for (int i1 =0; i1<sarr1.length; i1++) {
  if (!string2.contains(sarr[i1]) {
    markWordRed(string1, sarr[i1]);
  }
}

String[] sarr2 = string2.split();
for (int i2 =0; i2<sarr2.length; i2++) {
  if (!string1.contains(sarr[i2]) {
    markWordRed(string2, sarr[i2]);
  }
}
从这一点开始,你还可以:

检查单词的顺序,而不仅仅是它们是否存在

检查第二个字符串中每个未找到单词与所有未找到单词的相似性,并显示字母差异


您可以使用diff或LCS算法来进行这种比较

下面是it的简单C实现:

#include <string.h>
#include <stdlib.h>
#include <stdio.h>

int lcs(const char* s1, const char* s2)
{
  size_t l1 = strlen(s1), l2 = strlen(s2);
  size_t sz = (l1 + 1) * (l2 + 1) * sizeof(size_t);
  size_t w = l2 + 1;
  size_t* dpt;
  size_t i1, i2;

  if (sz / (l1 + 1) / (l2 + 1) != sizeof(size_t) ||
      (dpt = malloc(sz)) == NULL)
  {
    printf("Not enough memory\n");
    return EXIT_FAILURE;
  }

  for (i1 = 0; i1 <= l1; i1++)
    dpt[w * i1 + 0] = 0;
  for (i2 = 0; i2 <= l2; i2++)
    dpt[w * 0 + i2] = 0;

  for (i1 = 1; i1 <= l1; i1++)
    for (i2 = 1; i2 <= l2; i2++)
    {
      if (s1[l1 - i1] == s2[l2 - i2])
      {
        dpt[w * i1 + i2] = dpt[w * (i1 - 1) + (i2 - 1)] + 1;
      }
      else if (dpt[w * (i1 - 1) + i2] > dpt[w * i1 + (i2 - 1)])
      {
        dpt[w * i1 + i2] = dpt[w * (i1 - 1) + i2];
      }
      else
      {
        dpt[w * i1 + i2] = dpt[w * i1 + (i2 - 1)];
      }
    }

  i1 = l1; i2 = l2;
  for (;;)
  {
    if ((i1 > 0) && (i2 > 0) && (s1[l1 - i1] == s2[l2 - i2]))
    {
      printf("%c", s1[l1 - i1]);
      i1--; i2--; continue;
    }
    else
    {
      if (i1 > 0 &&
          (i2 == 0 || dpt[w * (i1 - 1) + i2] >= dpt[w * i1 + (i2 - 1)]))
      {
        printf("-%c", s1[l1 - i1]);
        i1--; continue;
      }
      else if (i2 > 0 &&
               (i1 == 0 || dpt[w * (i1 - 1) + i2] < dpt[w * i1 + (i2 - 1)]))
      {
        printf("+%c", s2[l2 - i2]);
        i2--; continue;
      }
    }

    break;
  }
  printf("\n");

  free(dpt);
  return EXIT_SUCCESS;
}

int main(int argc, char** argv)
{
  const char *s1, *s2;
  if (argc == 3)
  {
    s1 = argv[1]; s2 = argv[2];
  }
  else
  {
    printf("Usage:\n  lcs-diff.exe <string1> <string2>\n\n");
    s1 = "I ate apple on yesterday"; s2 = "I eat apple yesterday";
    printf("Sample comparison:\n\n  \"%s\" vs \"%s\":\n\n", s1, s2);
  }

  return lcs(s1, s2);
}
输出:


你听说了吗?也许可以试着用海明距离之类的方法。也请阅读这篇文章@Androidy,这完全是不相关的。为什么不@AlexeyFrunze?请解释一下汉明是用来比较单词的。您也可以将其应用于缓冲区。不像LCS那样理想。@Android这个问题是关于检查两个文件是否相同。这里的问题是不同的,OP希望看到什么发生了变化,在哪里发生了变化,而不仅仅是检测到发生了一些变化。您建议如何将KMP应用于OP的问题?KMP:String search alrgorithm=String substring matching algorithm。对其求反将生成字符串不匹配算法。对吧?我没听你的。你能举一个例子,说明如何使用KMP来发现在两个给定字符串之间,单词ate变为eat,然后单词on被删除?您好。不,我必须承认。现在不行。但是如果你能让我花点时间,我会尝试开发一种解决方案。
Usage:
  lcs-diff.exe <string1> <string2>

Sample comparison:

  "I ate apple on yesterday" vs "I eat apple yesterday":

I +eat-e apple -o-n- yesterday