C# 标点问题
这是一个程序,它读取CSV文件,将值添加到字典类,然后分析文本框中的字符串,查看是否有任何单词与字典条目匹配。它将把缩略语(LOL、ROFL等)替换成它们的真实单词。它通过将输入的文本拆分为单个单词来匹配字符串C# 标点问题,c#,string,concatenation,C#,String,Concatenation,这是一个程序,它读取CSV文件,将值添加到字典类,然后分析文本框中的字符串,查看是否有任何单词与字典条目匹配。它将把缩略语(LOL、ROFL等)替换成它们的真实单词。它通过将输入的文本拆分为单个单词来匹配字符串 public void btnanalyze_Click(object sender, EventArgs e) { var abbrev = new Dictionary<string, string>(); using (StreamReader read
public void btnanalyze_Click(object sender, EventArgs e)
{
var abbrev = new Dictionary<string, string>();
using (StreamReader reader = new StreamReader("C:/Users/Jordan Moffat/Desktop/coursework/textwords0.csv"))
{
string line;
string[] row;
while ((line = reader.ReadLine()) != null)
{
row = line.Split(',');
abbrev.Add(row[0], row[1]);
Console.WriteLine(abbrev);
}
}
string twitterinput;
twitterinput = "";
// string output;
twitterinput = txtInput.Text;
char[] delimiterChars = { ' ', ',', '.', ':', '\t' };
string text = twitterinput;
string[] words = twitterinput.Split(delimiterChars);
string merge;
foreach (string s in words)
{
if (abbrev.ContainsKey(s))
{
string value = abbrev[s];
merge = string.Join(" ", value);
}
if (!abbrev.ContainsKey(s))
{
string not = s;
merge = string.Join(" ", not);
}
MessageBox.Show(merge);
}
}
public void btnanalyze\u单击(对象发送者,事件参数)
{
var abbrev=新字典();
使用(StreamReader=newstreamreader(“C:/Users/Jordan Moffat/Desktop/coursework/textwords0.csv”))
{
弦线;
字符串[]行;
而((line=reader.ReadLine())!=null)
{
行=行。拆分(',');
缩写为Add(第[0]行,第[1]行);
控制台写入线(缩写);
}
}
字符串twitter输入;
twitterinput=“”;
//字符串输出;
twitterinput=txtInput.Text;
char[]delimiterChars={',',',',':','\t'};
字符串文本=twitter输入;
string[]words=twitterinput.Split(delimiterCars);
字符串合并;
foreach(单词中的字符串s)
{
if(缩写为ContainsKey)
{
字符串值=abbrev[s];
merge=string.Join(“,值);
}
如果(!缩写为ContainsKey)
{
字符串不等于s;
merge=string.Join(“,not”);
}
MessageBox.Show(合并);
}
}
问题是如果有标点符号,程序就不会翻译这个单词。我意识到我使用的字符集意味着标点符号不是问题,但也不允许我在打印时保留它。有没有一种方法可以让我忽略最后一个字符,而不是删除它,并在输出时保留它?我试图将其写入一个新变量,但我也找不到这样做的方法…这似乎太复杂了。您可以对正则表达式和反向引用执行相同的操作
foreach(var line in yourReader)
{
var dict = new Dictionary<string,string>(); // your replacement dictionaries
foreach(var kvp in dict)
{
System.Text.RegularExpressions.Regex.Replace(line,"(\s|,|\.|:|\\t)" + kvp.Key + "(\s|,|\.|:|\\t)","\0" + kvp.Value + "\1");
}
}
foreach(读取器中的var行)
{
var dict=new Dictionary();//替换字典
foreach(dict中的var kvp)
{
System.Text.RegularExpressions.Regex.Replace(第行,“(\s|,“\.\124;:”:“\\\ t)”+kvp.Key+”(\s|,“\.\124;:\:\\\ t)”,“\0”+kvp.Value+“\1”);
}
}
我把这个正则表达式拼凑在一起,所以它可能不正确,但这是基本的想法。你能添加一个你编写failsok的例子吗,所以如果我输入
LOL,hello
它只会输出LOL,hello
,而不是大声笑出来,您好
好的,我看到您的问题了,如果您有太多的字符分隔输入,您应该使用正则表达式来改变问题的焦点