使用XRegExp将unicode语句拆分为单词数组_Unicode_Xregexp

使用XRegExp将unicode语句拆分为单词数组

unicode

使用XRegExp将unicode语句拆分为单词数组,unicode,xregexp,Unicode,Xregexp,我使用下面的脚本将Unicode语句拆分为单词数组 XRegExp.matchChain("læseWEB læser teksten på dit website op.", [XRegExp("[\\p{Alphabetic}\\p{Nd}\\{Pc}\\p{M}]+", "g")]) [ "læseWEB", "læser", "teksten", "på", "dit", "website", "op" ] 现在我在等你 ['læseWEB ', 'læser ', 'tekste

我使用下面的脚本将Unicode语句拆分为单词数组

XRegExp.matchChain("læseWEB læser teksten på dit website op.", [XRegExp("[\\p{Alphabetic}\\p{Nd}\\{Pc}\\p{M}]+", "g")])


[ "læseWEB", "læser", "teksten", "på", "dit", "website", "op" ]

现在我在等你

['læseWEB ', 'læser ', 'teksten ', 'på ', 'dit ', 'website ', 'op.'].

有人说我需要使用分割函数而不是匹配链

有什么建议吗？

这个问题看起来非常相似，是的，我们正在做同一个项目，我们正在努力解决这个问题。这个问题有一个公认的答案。这个解决方案对你有用吗，还是不行？事实上，我需要用分隔符把这个句子分成几个单词。@AlanHaziq你必须更清楚为什么另一个问题的答案对你不起作用。