希伯来语中识别标点符号的方法?C#

希伯来语中识别标点符号的方法?C#,c#,punctuation,C#,Punctuation,最近,我突然想到是否可以用C#识别希伯来语单词的标点符号。 希伯来语中有一些标点符号,例如: יוּעָדוּ 当然,通常我们不会给单词加标点符号,所以应该是这样的: יועדו 有没有一种方法可以使用C#?识别这样一个单词的标点符号在Python中,序列解析如下: >>> a = unicode('יוּעָדוּ', 'utf-8') >>> b = unicode('יועדו', 'utf-8') >>> a u'\u05d9\u

最近,我突然想到是否可以用C#识别希伯来语单词的标点符号。 希伯来语中有一些标点符号,例如:

יוּעָדוּ
当然,通常我们不会给单词加标点符号,所以应该是这样的:

יועדו

有没有一种方法可以使用C#?

识别这样一个单词的标点符号在Python中,序列解析如下:

>>> a = unicode('יוּעָדוּ', 'utf-8')
>>> b = unicode('יועדו', 'utf-8')
>>> a
u'\u05d9\u05d5\u05bc\u05e2\u05b8\u05d3\u05d5\u05bc'
>>> b
u'\u05d9\u05d5      \u05e2      \u05d3\u05d5'
(我添加了空格以使事情更清楚。)


你可以很清楚地看到标点符号。查找这些字符的C#regex可能是您想要的方向。

您是否在寻找字符串比较和匹配所能实现的功能以外的其他功能?您可以使用regex搜索标点字符,但我相信您已经知道了这一点。你试过什么不起作用的?@ryadavilli-我要找的是一个能识别单词标点符号的单词。例如,我在帖子中写的单词,我希望C#程序能够识别标点单词和标点本身。我希望你现在能更好地理解我的问题。我读了一些关于regex的书,但这不是我需要的。我还没有尝试过任何东西,我所做的只是阅读和思考如何回答我的问题,这最终引导我来到这里。只需查找字符的Unicode类别。