Java 日语字符的正则表达式
我有一个用于检查匹配字符串的模式正则表达式:Java 日语字符的正则表达式,java,regex,Java,Regex,我有一个用于检查匹配字符串的模式正则表达式: \b(\w+)(:株式会社|会社)(?:\s*)(\w+)(:ご担当者様|様) 问题:此模式与日语字符不匹配 例如: 公司株式会社丹尼斯様 =>匹配此模式 但是 スタッフ株式会社本社様 =>与此模式不匹配 如何将正则表达式更改为匹配(日语字符、特殊字符和普通字符a-z a-z 0-9)?可以用于匹配不同类别的字符。例如,要匹配任何语言中的任何字母,可以使用\p{gc=IsL}而不是只匹配拉丁字母(加下划线和数字)的\w。或者,您可以只对日语字符使
\b(\w+)(:株式会社|会社)(?:\s*)(\w+)(:ご担当者様|様)代码>
问题:此模式与日语字符不匹配
例如:
公司株式会社丹尼斯様
=>匹配此模式
但是
スタッフ株式会社本社様
=>与此模式不匹配
如何将正则表达式更改为匹配(日语字符、特殊字符和普通字符a-z a-z 0-9)?可以用于匹配不同类别的字符。例如,要匹配任何语言中的任何字母,可以使用\p{gc=IsL}
而不是只匹配拉丁字母(加下划线和数字)的\w
。或者,您可以只对日语字符使用特定的脚本。在您的问题中,不清楚您想要的是字母还是拉丁+日语字母。另外,您希望包含哪些“特殊字符”