如何在Java中使用正则表达式捕获希伯来语?

如何在Java中使用正则表达式捕获希伯来语?,java,regex,hebrew,Java,Regex,Hebrew,我正在尝试使用以下正则表达式捕捉希伯来文文本的一部分(源于新闻网站上的评论): [\u0590-\u05FF \\p{Graph} \\s]+ 它适用于大多数评论,但遗漏了一些评论 我试着调试这个,似乎有一个希伯来文字母与模式不匹配 当我提取这个字母并打印它的整数值时,它似乎是正确的,但正则表达式仍然没有捕捉到它 想法?使用\p{InHebrew}而不是\u0590-\u05FF 此外,您还需要匹配标点符号、数字(至少是世界通用的数字)和不同类型的空格。 我不知道什么是\p{Graph}还有希

我正在尝试使用以下正则表达式捕捉希伯来文文本的一部分(源于新闻网站上的评论):

[\u0590-\u05FF \\p{Graph} \\s]+
它适用于大多数评论,但遗漏了一些评论

我试着调试这个,似乎有一个希伯来文字母与模式不匹配

当我提取这个字母并打印它的整数值时,它似乎是正确的,但正则表达式仍然没有捕捉到它


想法?

使用
\p{InHebrew}
而不是
\u0590-\u05FF

此外,您还需要匹配标点符号、数字(至少是世界通用的数字)和不同类型的空格。
我不知道什么是
\p{Graph}
还有希伯来语特有的标点符号,但似乎你遗漏了一些部分。

你是否在
模式中使用
模式.UNICODE\u CASE
编译方法?试试它:
模式p=Pattern.compile(“你的正则表达式”,Pattern.UNICODE\u CASE)哪个希伯来文字母与模式不匹配?