Warning: file_get_contents(/data/phpspider/zhask/data//catemap/4/regex/17.json): failed to open stream: No such file or directory in /data/phpspider/zhask/libs/function.php on line 167

Warning: Invalid argument supplied for foreach() in /data/phpspider/zhask/libs/tag.function.php on line 1116

Notice: Undefined index: in /data/phpspider/zhask/libs/function.php on line 180

Warning: array_chunk() expects parameter 1 to be array, null given in /data/phpspider/zhask/libs/function.php on line 181
如何使用正则表达式从JavaScript中的字符串中去除所有标点符号?_Javascript_Regex - Fatal编程技术网

如何使用正则表达式从JavaScript中的字符串中去除所有标点符号?

如何使用正则表达式从JavaScript中的字符串中去除所有标点符号?,javascript,regex,Javascript,Regex,如果我的字符串中包含任何类型的非字母数字字符: "This., -/ is #! an $ % ^ & * example ;: {} of a = -_ string with `~)() punctuation" 如何在JavaScript中获得它的无标点版本: "This is an example of a string with punctuation" 删除除字母数字字符和空格以外的所有内容,然后将多个相邻空格折叠为单个空格 详细说明: \w是任何数字、字母或下划线 \s

如果我的字符串中包含任何类型的非字母数字字符:

"This., -/ is #! an $ % ^ & * example ;: {} of a = -_ string with `~)() punctuation"
如何在JavaScript中获得它的无标点版本:

"This is an example of a string with punctuation"
删除除字母数字字符和空格以外的所有内容,然后将多个相邻空格折叠为单个空格

详细说明:

  • \w
    是任何数字、字母或下划线
  • \s
    是任何空格
  • [^\w\s]
    是指任何不是数字、字母、空格或下划线的内容
  • [^\w\s]|
    与#3相同,只是添加了下划线
  • 对于en-US(美式英语)字符串,这应该足够了:

    "This., -/ is #! an $ % ^ & * example ;: {} of a = -_ string with `~)() punctuation".replace( /[^a-zA-Z ]/g, '').replace( /\s\s+/g, ' ' )
    

    请注意,如果您支持UTF-8和中文/俄文等字符,这也将取代它们,因此您必须指定所需内容。

    如果您只想保留字母表和空格,可以执行以下操作:

    str.replace(/[^a-zA-Z ]+/g, '').replace('/ {2,}/',' ')
    

    在支持Unicode的语言中,Unicode标点字符属性是
    \p{p}
    ——为了可读性,通常可以缩写为
    \pP
    ,有时可以扩展为
    \p{标点}


    您使用的是与Perl兼容的正则表达式库吗?

    如果您想从字符串中删除特定的标点符号,最好明确地删除您想要的内容

    replace(/[.,\/#!$%\^&\*;:{}=\-_`~()]/g,"")
    
    执行上述操作仍然不会返回指定的字符串。如果您想删除由于删除疯狂标点符号而留下的任何额外空格,那么您需要执行以下操作

    replace(/\s{2,}/g," ");
    
    我的完整示例:

    var s = "This., -/ is #! an $ % ^ & * example ;: {} of a = -_ string with `~)() punctuation";
    var punctuationless = s.replace(/[.,\/#!$%\^&\*;:{}=\-_`~()]/g,"");
    var finalString = punctuationless.replace(/\s{2,}/g," ");
    
    在firebug控制台中运行代码的结果:

    var s = "This., -/ is #! an $ % ^ & * example ;: {} of a = -_ string with `~)() punctuation";
    var punctuationless = s.replace(/[.,\/#!$%\^&\*;:{}=\-_`~()]/g,"");
    var finalString = punctuationless.replace(/\s{2,}/g," ");
    

    我把它放在这里给其他人看

    匹配所有语言的所有标点字符:

    由Unicode标点符号类别构建,并添加了一些常见的键盘符号,如
    $
    和括号以及
    \-=\ucode

    基本替换:

    ".test'da, te\"xt".replace(/[\-=_!"#%&'*{},.\/:;?\(\)\[\]@\\$\^*+<>~`\u00a1\u00a7\u00b6\u00b7\u00bf\u037e\u0387\u055a-\u055f\u0589\u05c0\u05c3\u05c6\u05f3\u05f4\u0609\u060a\u060c\u060d\u061b\u061e\u061f\u066a-\u066d\u06d4\u0700-\u070d\u07f7-\u07f9\u0830-\u083e\u085e\u0964\u0965\u0970\u0af0\u0df4\u0e4f\u0e5a\u0e5b\u0f04-\u0f12\u0f14\u0f85\u0fd0-\u0fd4\u0fd9\u0fda\u104a-\u104f\u10fb\u1360-\u1368\u166d\u166e\u16eb-\u16ed\u1735\u1736\u17d4-\u17d6\u17d8-\u17da\u1800-\u1805\u1807-\u180a\u1944\u1945\u1a1e\u1a1f\u1aa0-\u1aa6\u1aa8-\u1aad\u1b5a-\u1b60\u1bfc-\u1bff\u1c3b-\u1c3f\u1c7e\u1c7f\u1cc0-\u1cc7\u1cd3\u2016\u2017\u2020-\u2027\u2030-\u2038\u203b-\u203e\u2041-\u2043\u2047-\u2051\u2053\u2055-\u205e\u2cf9-\u2cfc\u2cfe\u2cff\u2d70\u2e00\u2e01\u2e06-\u2e08\u2e0b\u2e0e-\u2e16\u2e18\u2e19\u2e1b\u2e1e\u2e1f\u2e2a-\u2e2e\u2e30-\u2e39\u3001-\u3003\u303d\u30fb\ua4fe\ua4ff\ua60d-\ua60f\ua673\ua67e\ua6f2-\ua6f7\ua874-\ua877\ua8ce\ua8cf\ua8f8-\ua8fa\ua92e\ua92f\ua95f\ua9c1-\ua9cd\ua9de\ua9df\uaa5c-\uaa5f\uaade\uaadf\uaaf0\uaaf1\uabeb\ufe10-\ufe16\ufe19\ufe30\ufe45\ufe46\ufe49-\ufe4c\ufe50-\ufe52\ufe54-\ufe57\ufe5f-\ufe61\ufe68\ufe6a\ufe6b\uff01-\uff03\uff05-\uff07\uff0a\uff0c\uff0e\uff0f\uff1a\uff1b\uff1f\uff20\uff3c\uff61\uff64\uff65]+/g,"")
    "testda text"
    
    .test'da,te\'xt.replace(/[\-=\\\\\\%&'*{},.\/:;?\(\)\[\]@\\目前,中国的研究者们在以下几部分中的一部分:目前的研究者们在以下几部分中的一部分在以下几部分中的一部分在以下几部分中的一部分在以下几部分中的一部分在以下几几几部分在以下几部分中的一部分在以下几部分中的一部分在以下几部分中的一部分在以下几几部分在以下几几部分中的一部分在以下的一部分在以下几几几部分在以下的一部分:一部分在目前的研究中的一部分在以下的一部分在以下的一部分在以下的一部分:一部分在以下的一部分在以下的一个或者或者或者或者或者或者或者或者或者或者或者或者或者或者055 5 5 5 5 5 5 5 5 5 5 5 5 5 5 5 5甲甲甲的或者或者或者或者或者或者或者或者或者或者或者或者或者或者或者或者或者或者或者或者或者或者或者或者或者或者或者或者或者或者或者或者或者在以下以下的某某某某或者或者或者或者或者或者或者或者或者或者或者或者0E5A\u0e5b\u0f04-\u0f12\u0f14\u0f85\u0fd0-\u0fd4\u0fd9\u0fda\u104a-\u104f\u10fb\u1360-\u1368\u166d\u166e\目前,中国的一个18岁以下以下的人在一个18岁以下以下的人在一个18岁以下以下的人在一个18岁以下的人在一个1800-\u1805\u1807-\u1807-\u180a\u180a\U18在一个18岁以下的人在一个18岁以下的人在一个18岁以下的以下的人在一个18岁以下的以下的人在一一个以下的一个以下的在一个18岁以下以下的人在一一个以下的现现现现现现现现现现现现现现现现阶段的1800-\u1800-\u1800-\u1800-\u1800-\u1800-\u1805\u1805\u1805\u1800-\u1800-\u1805\u1800-\u1805\U18-\U18-\u1800-\u1800-\u1800-\u1800-\u1800-\u1800-\u1800-\U18\u2047-\u2051\u2053\u2055-\u205e\u2cf9-\u2cfc\u2cfe\u2cff\u2d70\u2e00\u2e01\u2e06-\u2e08\UUU2-U2-U2-U2-U2-U2-U2-U2-U2-U2-U2-U2-U2-U2-U2-3-U2-U2-3 3-U3-3-U3-1-UU2-U2-U2-U2-U2-U2-U2-U2-U2-U2-U2-U2-U2-U2-U2-U2-U2-U2-U2-U2-U2-U2-U2-U2-3-3-3-3-3-3-U3-3-3-3-3-U3-3-3-3-3-3-3\U3-3-3-3-3\UU3-3-3-3\U3-3-3-3-3-3-3-3-3-3\U3-3-3-3-3-3\U3-3-3--\ufe16\ufe19\ufe30\ufe45\ufe46\ufe49-\ufe4c\ufe50-\ufe52\ufe54-\ufe57\ufe5f-\ufe61\ufe68\ufe6a\ufe6b\uff01-\uff03\uff05-\uff07\uff0a\uff0c\uff0e\uff0f\uff1a\uff1b\uff1f\uff20\uff3c\uff61\uff64\uff65]+/g“”) “testda文本” 添加了\s作为空间

    ".da'fla, te\"te".split(/[\s\-=_!"#%&'*{},.\/:;?\(\)\[\]@\\$\^*+<>~`\u00a1\u00a7\u00b6\u00b7\u00bf\u037e\u0387\u055a-\u055f\u0589\u05c0\u05c3\u05c6\u05f3\u05f4\u0609\u060a\u060c\u060d\u061b\u061e\u061f\u066a-\u066d\u06d4\u0700-\u070d\u07f7-\u07f9\u0830-\u083e\u085e\u0964\u0965\u0970\u0af0\u0df4\u0e4f\u0e5a\u0e5b\u0f04-\u0f12\u0f14\u0f85\u0fd0-\u0fd4\u0fd9\u0fda\u104a-\u104f\u10fb\u1360-\u1368\u166d\u166e\u16eb-\u16ed\u1735\u1736\u17d4-\u17d6\u17d8-\u17da\u1800-\u1805\u1807-\u180a\u1944\u1945\u1a1e\u1a1f\u1aa0-\u1aa6\u1aa8-\u1aad\u1b5a-\u1b60\u1bfc-\u1bff\u1c3b-\u1c3f\u1c7e\u1c7f\u1cc0-\u1cc7\u1cd3\u2016\u2017\u2020-\u2027\u2030-\u2038\u203b-\u203e\u2041-\u2043\u2047-\u2051\u2053\u2055-\u205e\u2cf9-\u2cfc\u2cfe\u2cff\u2d70\u2e00\u2e01\u2e06-\u2e08\u2e0b\u2e0e-\u2e16\u2e18\u2e19\u2e1b\u2e1e\u2e1f\u2e2a-\u2e2e\u2e30-\u2e39\u3001-\u3003\u303d\u30fb\ua4fe\ua4ff\ua60d-\ua60f\ua673\ua67e\ua6f2-\ua6f7\ua874-\ua877\ua8ce\ua8cf\ua8f8-\ua8fa\ua92e\ua92f\ua95f\ua9c1-\ua9cd\ua9de\ua9df\uaa5c-\uaa5f\uaade\uaadf\uaaf0\uaaf1\uabeb\ufe10-\ufe16\ufe19\ufe30\ufe45\ufe46\ufe49-\ufe4c\ufe50-\ufe52\ufe54-\ufe57\ufe5f-\ufe61\ufe68\ufe6a\ufe6b\uff01-\uff03\uff05-\uff07\uff0a\uff0c\uff0e\uff0f\uff1a\uff1b\uff1f\uff20\uff3c\uff61\uff64\uff65]+/g)
    
    “.da'fla,te\'te”.split(/[\s\-=\\\\\\%&'*{},.\/:;?\(\)\[\]@\\目前,中国的研究者们在以下几部分中的一部分:目前的研究者们在以下几部分中的一部分在以下几部分中的一部分在以下几部分中的一部分在以下几部分中的一部分在以下几几几部分在以下几部分中的一部分在以下几部分中的一部分在以下几部分中的一部分在以下几几部分在以下几几部分中的一部分在以下的一部分在以下几几几部分在以下的一部分:一部分在目前的研究中的一部分在以下的一部分在以下的一部分在以下的一部分:一部分在以下的一部分在以下的一个或者或者或者或者或者或者或者或者或者或者或者或者或者或者055 5 5 5 5 5 5 5 5 5 5 5 5 5 5 5 5甲甲甲的或者或者或者或者或者或者或者或者或者或者或者或者或者或者或者或者或者或者或者或者或者或者或者或者或者或者或者或者或者或者或者或者或者在以下以下的某某某某或者或者或者或者或者或者或者或者或者或者或者或者0E5A\u0e5b\u0f04-\u0f12\u0f14\u0f85\u0fd0-\u0fd4\u0fd9\u0fda\u104a-\u104f\u10fb\u1360-\u1368\u166d\u166e\目前,中国的一个18岁以下以下的人在一个18岁以下以下的人在一个18岁以下以下的人在一个18岁以下的人在一个1800-\u1805\u1807-\u1807-\u180a\u180a\U18在一个18岁以下的人在一个18岁以下的人在一个18岁以下的以下的人在一个18岁以下的以下的人在一一个以下的一个以下的在一个18岁以下以下的人在一一个以下的现现现现现现现现现现现现现现现现阶段的1800-\u1800-\u1800-\u1800-\u1800-\u1800-\u1805\u1805\u1805\u1800-\u1800-\u1805\u1800-\u1805\U18-\U18-\u1800-\u1800-\u1800-\u1800-\u1800-\u1800-\u1800-\U18\u2047-\u2051\u2053\u2055-\u205e\u2cf9-\u2cfc\u2cfe\u2cff\u2d70\u2e00\u2e01\u2e06-\u2e08\UUU2-U2-U2-U2-U2-U2-U2-U2-U2-U2-U2-U2-U2-U2-U2-3-U2-U2-3 3-U3-3-U3-1-UU2-U2-U2-U2-U2-U2-U2-U2-U2-U2-U2-U2-U2-U2-U2-U2-U2-U2-U2-U2-U2-U2-U2-U2-3-3-3-3-3-3-U3-3-3-3-3-U3-3-3-3-3-3-3\U3-3-3-3-3\UU3-3-3-3\U3-3-3-3-3-3-3-3-3-3\U3-3-3-3-3-3\U3-3-3--\ufe16\ufe19\ufe30\ufe45\ufe46\ufe49-\ufe4c\ufe50-\ufe52\ufe54-\ufe57\ufe5f-\ufe61\ufe68\ufe6a\ufe6b\uff01-\uff03\uff05-\uff07\uff0a\uff0c\uff0e\uff0f\uff1a\uff1b\uff1f\uff20\uff3c\uff61\uff64\uff65]+/g)
    
    添加了“^”以反转模式,使其匹配的不是标点符号,而是单词本身

    ".test';the, te\"xt".match(/[^\s\-=_!"#%&'*{},.\/:;?\(\)\[\]@\\$\^*+<>~`\u00a1\u00a7\u00b6\u00b7\u00bf\u037e\u0387\u055a-\u055f\u0589\u05c0\u05c3\u05c6\u05f3\u05f4\u0609\u060a\u060c\u060d\u061b\u061e\u061f\u066a-\u066d\u06d4\u0700-\u070d\u07f7-\u07f9\u0830-\u083e\u085e\u0964\u0965\u0970\u0af0\u0df4\u0e4f\u0e5a\u0e5b\u0f04-\u0f12\u0f14\u0f85\u0fd0-\u0fd4\u0fd9\u0fda\u104a-\u104f\u10fb\u1360-\u1368\u166d\u166e\u16eb-\u16ed\u1735\u1736\u17d4-\u17d6\u17d8-\u17da\u1800-\u1805\u1807-\u180a\u1944\u1945\u1a1e\u1a1f\u1aa0-\u1aa6\u1aa8-\u1aad\u1b5a-\u1b60\u1bfc-\u1bff\u1c3b-\u1c3f\u1c7e\u1c7f\u1cc0-\u1cc7\u1cd3\u2016\u2017\u2020-\u2027\u2030-\u2038\u203b-\u203e\u2041-\u2043\u2047-\u2051\u2053\u2055-\u205e\u2cf9-\u2cfc\u2cfe\u2cff\u2d70\u2e00\u2e01\u2e06-\u2e08\u2e0b\u2e0e-\u2e16\u2e18\u2e19\u2e1b\u2e1e\u2e1f\u2e2a-\u2e2e\u2e30-\u2e39\u3001-\u3003\u303d\u30fb\ua4fe\ua4ff\ua60d-\ua60f\ua673\ua67e\ua6f2-\ua6f7\ua874-\ua877\ua8ce\ua8cf\ua8f8-\ua8fa\ua92e\ua92f\ua95f\ua9c1-\ua9cd\ua9de\ua9df\uaa5c-\uaa5f\uaade\uaadf\uaaf0\uaaf1\uabeb\ufe10-\ufe16\ufe19\ufe30\ufe45\ufe46\ufe49-\ufe4c\ufe50-\ufe52\ufe54-\ufe57\ufe5f-\ufe61\ufe68\ufe6a\ufe6b\uff01-\uff03\uff05-\uff07\uff0a\uff0c\uff0e\uff0f\uff1a\uff1b\uff1f\uff20\uff3c\uff61\uff64\uff65]+/g)
    
    .test;the,te\'xt.match(/[^\s\-=\\\\\\%&'*{},.\/:;?\(\)\[\]@\\目前,中国的研究者们在以下几部分中的一部分:目前的研究者们在以下几部分中的一部分在以下几部分中的一部分在以下几部分中的一部分在以下几部分中的一部分在以下几几几部分在以下几部分中的一部分在以下几部分中的一部分在以下几部分中的一部分在以下几几部分在以下几几部分中的一部分在以下的一部分在以下几几几部分在以下的一部分:一部分在目前的研究中的一部分在以下的一部分在以下的一部分在以下的一部分:一部分在以下的一部分在以下的一个或者或者或者或者或者或者或者或者或者或者或者或者或者或者055 5 5 5 5 5 5 5 5 5 5 5 5 5 5 5 5甲甲甲的或者或者或者或者或者或者或者或者或者或者或者或者或者或者或者或者或者或者或者或者或者或者或者或者或者或者或者或者或者或者或者或者或者在以下以下的某某某某或者或者或者或者或者或者或者或者或者或者或者或者0E5A\u0e5b\u0f04-\u0f12\u0f14\u0f85\u0fd0-\u0fd4\u0fd9\u0fda\u104a-\u104f\u10fb\u1360-\u1368\u166d\u166e\目前,中国的一个18岁以下以下的人在一个18岁以下以下的人在一个18岁以下以下的人在一个18岁以下的人在一个1800-\u1805\u1807-\u1807-\u180a\u180a\U18在一个18岁以下的人在一个18岁以下的人在一个18岁以下的以下的人在一个18岁以下的以下的人在一一个以下的一个以下的在一个18岁以下以下的人在一一个以下的现现现现现现现现现现现现现现现现阶段的1800-\u1800-\u1800-\u1800-\u1800-\u1800-\u1805\u1805\u1805\u1800-\u1800-\u1805\u1800-\u1805\U18-\U18-\u1800-\u1800-\u1800-\u1800-\u1800-\u1800-\u1800-\U18\u2047-\u2051\u2053\u2055-\u205e\u2cf9-\u2cfc\u2cfe\u2cff\u2d70\u2e00\u2e01\u2e06-\u2e08\UUU2-U2-U2-U2-U2-U2-U2-U2-U2-U2-U2-U2-U2-U2-U2-3-U2-U2-3 3-U3-3-U3-1-UU2-U2-U2-U2-U2-U2-U2-U2-U2-U2-U2-U2-U2-U2-U2-U2-U2-U2-U2-U2-U2-U2-U2-U2-3-3-3-3-3-3-U3-3-3-3-3-U3-3-3-3-3-3-3\U3-3-3-3-3\UU3-3-3-3\U3-3-3-3-3-3-3-3-3-3\U3-3-3-3-3-3\U3-3-3--\ufe16\ufe19\ufe30\ufe45\ufe46\ufe49-\ufe4c\ufe50-\ufe52\ufe54-\ufe57\ufe5f-\ufe61\ufe68\ufe6a\ufe6b\uff01-\uff03\uff05-\uff07\uff0a\uff0c\uff0e\uff0f\uff1a\uff1b\uff1f\uff20\uff3c\uff61\uff64\uff65]+/g) 对于像希伯莱语这样的语言,可能需要删除单引号和双引号。然后做
    var x=$0.value
    var z=x.replace(/U\+/g,"").split(/[\r\n]+/).map(function(a){return parseInt(a,16)})
    var ret=[];z.forEach(function(a,k){if(z[k-1]===a-1 && z[k+1]===a+1) { if(ret[ret.length-1]!="-")ret.push("-");} else {  var c=a.toString(16); var prefix=c.length<3?"\\u0000":c.length<5?"\\u0000":"\\u000000"; var uu=prefix.substring(0,prefix.length-c.length)+c; ret.push(c.length<3?String.fromCharCode(a):uu)}});ret.join("")
    
    /[\u2000-\u206F\u2E00-\u2E7F\\'!"#$%&()*+,\-.\/:;<=>?@\[\]^_`{|}~]/
    
    var punctRE = /[\u2000-\u206F\u2E00-\u2E7F\\'!"#$%&()*+,\-.\/:;<=>?@\[\]^_`{|}~]/g;
    var spaceRE = /\s+/g;
    var str = "This, -/ is #! an $ % ^ & * example ;: {} of a = -_ string with `~)() punctuation";
    str.replace(punctRE, '').replace(spaceRE, ' ');
    
    >> "This is an example of a string with punctuation"
    
    var sentence = "This., -/ is #! an $ % ^ & * example ;: {} of a = -_ string with `~)() punctuation";
    var newSen = sentence.match(/[^_\W]+/g).join(' ');
    console.log(newSen);
    
    "This is an example of a string with punctuation"
    
    /[^_\W]+/g
    
    .replace(/[^A-Za-z0-9\s]/g,"").replace(/\s{2,}/g, " ")
    
    _.words('This, is : my - test,line:').join(' ')
    
    _.words('"This., -/ is #! an $ % ^ & * example ;: {} of a = -_ string with `~)() punctuation"').join(' ')
    
    return text.match(/[a-z]/i);