String 计算翻译重复次数

String 计算翻译重复次数,string,translation,repeat,String,Translation,Repeat,我在网上查找了计算待翻译文档中重复次数的标准公式。我没有找到它。对于那些不知道重复在翻译中意味着什么的人,给出一个很好的描述 我第一次试过这样的东西 using System; using System.Collection.Generic; using System.Text.RegularExpressions; using System.Linq; <snip> Dictionary<string, int> _dict = new Dictionary<st

我在网上查找了计算待翻译文档中重复次数的标准公式。我没有找到它。对于那些不知道重复在翻译中意味着什么的人,给出一个很好的描述

我第一次试过这样的东西

using System;
using System.Collection.Generic;
using System.Text.RegularExpressions;
using System.Linq;
<snip>
Dictionary<string, int> _dict = new Dictionary<string, int>();
int CalculateRepetitions(string plainTextDoc) {
    foreach (string item in Regex.Split(plainTextDoc, "\\P{L}+"))
        if (_dict.ContainsKey(item))
            _dict[item]++;
        else
            _dict.Add(item, 0);
    return _dict.Where((key, value) => value > 0).Count();
}
使用系统;
使用System.Collection.Generic;
使用System.Text.RegularExpressions;
使用System.Linq;
字典_dict=新字典();
int CalculateRequests(字符串plainTextDoc){
foreach(Regex.Split(plainTextDoc,“\\P{L}+”)中的字符串项)
如果(_dict.ContainsKey(项目))
_dict[项目]+;
其他的
_dict.Add(第0项);
返回_dict.Where((键,值)=>value>0.Count();
}

但这与Trados对同一份文件的样本数量并不接近,而且对重复的定义也是错误的。有人有计算翻译重复次数的好例子吗?我不期待C++答案,我也很擅长java和C++答案。

< P>标准可能是你的答案,似乎有一个.< /P>说明提到重复是100%个重复的段,所以解决了这个问题。还提到了单词计数的标准,我认为您可以使用正则表达式来获取。谢谢