匹配法语字符的Javascript正则表达式

匹配法语字符的Javascript正则表达式,javascript,regex,diacritics,french,Javascript,Regex,Diacritics,French,我需要将法语字符(dérange)的单词与正则表达式匹配。到目前为止,我有: var text=“一个不方便的(范围)真相”; var splitText=text.trim().match(/\w+|\s+|[^\s\w]+/g); console.log(splitText)您可以尝试使用正则表达式获取文本中的所有单词,下面是一个工作示例: var text=“一个不方便的(范围)真相”; var splitText=text.trim().split(/\s+/); console.l

我需要将法语字符(
dérange
)的单词与正则表达式匹配。到目前为止,我有:

var text=“一个不方便的(范围)真相”;
var splitText=text.trim().match(/\w+|\s+|[^\s\w]+/g);
console.log(splitText)您可以尝试使用正则表达式获取文本中的所有单词,下面是一个工作示例:

var text=“一个不方便的(范围)真相”;
var splitText=text.trim().split(/\s+/);

console.log(splitText)似乎要将空白与非空白分开。但是,对于非空白有两个表达式:
\w+
(匹配
[a-zA-Z_0-9]+
)和
[^\s\w]+
(匹配除空白之外的所有其他内容-因此这是单独匹配
的。只需将这两个表达式组合成
[^\s]+
或-simpler-
\s+

var text=“一个不方便的(范围)真相”;
var splitText=text.trim().match(/\S+\S+/g);

console.log(splitText);
\w
在MDN上:“匹配基本拉丁字母表中的任何字母数字字符,包括下划线。相当于[A-Za-z0-9]。请参阅:创建自己的字符类
text.trim()。匹配(/[A-zè232; 232; 239; 239; 235; 239;+s++];
谢谢你。你的解决方案确实有效,但我需要保留每个元素,甚至括号。欢迎你,但是如果你想保持元素的原样,那么使用
var splitText=text.trim().split(/\s+/)更好更快
看看这个benmark链接:你知道如何让正则表达式识别括号,即使括号之间有空格(比如我的例子:“(qui”)。我希望它变成:(“+”qui)。谢谢你,YouneLand,我也需要保留空格(我忘了把它添加到前面的消息中)。
text.trim().match(/\([^\s\)]+\124\)|\s+/g);
很好,谢谢你,伯吉。