Warning: file_get_contents(/data/phpspider/zhask/data//catemap/2/csharp/296.json): failed to open stream: No such file or directory in /data/phpspider/zhask/libs/function.php on line 167

Warning: Invalid argument supplied for foreach() in /data/phpspider/zhask/libs/tag.function.php on line 1116

Notice: Undefined index: in /data/phpspider/zhask/libs/function.php on line 180

Warning: array_chunk() expects parameter 1 to be array, null given in /data/phpspider/zhask/libs/function.php on line 181
C# 增强我的正则表达式以进行校对_C#_Regex - Fatal编程技术网

C# 增强我的正则表达式以进行校对

C# 增强我的正则表达式以进行校对,c#,regex,C#,Regex,我这里有我的正则表达式,用于C (".*?"|“.*?”|“.*'|'*.") 我也在尝试这种模式 ("|'|“).*?("|'|”) 但它没有给我想要的结果 以下是示例段落 “Lorem”Ipsum只是印刷和排版行业的虚拟文本。“Lorem Ipsum”自16世纪以来一直是行业标准的虚拟文本,当时一家不知名的印刷商拿着一个铅字厨房,将其拼凑成一本铅字样本书。它不仅经历了“五个世纪”,还经历了电子排版的飞跃,基本保持不变。它在20世纪60年代随着包含Lorem Ipsum段落的Letrase

我这里有我的正则表达式,用于C

(".*?"|“.*?”|“.*'|'*.")
我也在尝试这种模式

("|'|“).*?("|'|”)
但它没有给我想要的结果

以下是示例段落
“Lorem”Ipsum只是印刷和排版行业的虚拟文本。“Lorem Ipsum”自16世纪以来一直是行业标准的虚拟文本,当时一家不知名的印刷商拿着一个铅字厨房,将其拼凑成一本铅字样本书。它不仅经历了“五个世纪”,还经历了电子排版的飞跃,基本保持不变。它在20世纪60年代随着包含Lorem Ipsum段落的Letraset表单的发布而流行,最近随着“Aldus”等“桌面出版”软件“PageMaker”包括Lorem Ipsum版本而流行

我的目标是获取这些字符中的所有单词

"", “”, “', '", ''
之所以会是这样的原因是,假设一个人写了一篇文章,他被打错了,而不是用双引号来结束双引号,而是作者用单引号来结束

现在,我得到的是这个

我的预期输出是

Lorem, Lorem Ipsum, five centuries, desktop publishing, Aldus, PageMaker
但不限于这些,因为这个正则表达式将在整篇文章和数百篇文章中运行

这一行来自上面的示例段落,可能是最棘手的部分
工业标准的虚拟文本自16世纪以来,当时一位不知名的印刷商拿着一个打印盘,将其拼凑成一本打印样本书。它不仅保存了“五个世纪”,而且还保存了

试试这个。看演示


< P> < /P>你的文章并没有明确地排除嵌套的引文-考虑编辑…或者实际上考虑嵌套引号“就像某人说的‘当你使用正则表达式,你现在有问题’”,当一个人问“正则表达式”时,通常会提到这个问题。…还可以查看图表顶部关于嵌套结构与regex匹配的问题:它工作正常,但我遇到了一些错误。将此添加为一个新段落(自16世纪以来,Lorem Ipsum一直是业界标准的虚拟文本,当时一位不知名的打印机使用了一个“打印”工具,并将其拼凑成一个“样本书”)差不多了。再加上这个作为另一个段落(它不仅经历了“五个世纪”,而且还经历了电子排版的飞跃,基本上保持不变。)轻微的更正-(?:“|”|“)(!s\b |\s)[^”]+(?:“|”|”)(!s\b)我希望能给你分数,但你应该得到“答案”
(?:"|'(?!s\b|\s)|“)[^"'“”]+(?:"|'(?!s\b)|”)