JavaScript从文本中删除版权字符
我正在使用一些正则表达式从JavaScript中的一些文本中删除空格。当前的正则表达式如下所示:JavaScript从文本中删除版权字符,javascript,regex,text-processing,Javascript,Regex,Text Processing,我正在使用一些正则表达式从JavaScript中的一些文本中删除空格。当前的正则表达式如下所示: var cleaned_plaintext = website_content; cleaned_plaintext = cleaned_plaintext.toLowerCase(); cleaned_plaintext = cleaned_plaintext.replace(/(\0\r\n|\n|\r|\0)/gm," "); cleaned_plaintext = cleaned_plai
var cleaned_plaintext = website_content;
cleaned_plaintext = cleaned_plaintext.toLowerCase();
cleaned_plaintext = cleaned_plaintext.replace(/(\0\r\n|\n|\r|\0)/gm," ");
cleaned_plaintext = cleaned_plaintext.replace(/\s+/g," ");
cleaned_plaintext = cleaned_plaintext.replace(/[...\(\)]/g,"");
cleaned_plaintext = cleaned_plaintext.replace(/[…]/g,"");
cleaned_plaintext = cleaned_plaintext.replace(/[:!?.,={-}]/g," ");
cleaned_plaintext = cleaned_plaintext.replace(/\s+/g," ");
上面的正则表达式在清理大多数空白方面做得很好,但是我有这样的符号
©
如何删除带有正则表达式的那些?还有任何关于清理上述正则表达式以使其更精简、更快等的提示……直接使用符号即可:
'©'.replace('©', '');
您还可以使用\w,通过这种方式可以找到“无单词字符”,包括空格,您可以:
'test %%% © º§§§§§@@@@@ ;OK%'.replace(/[^\w]/g,'')
结果是:
"testOK"
编辑:
如果要保留空白,可以使用以下方法:
'test %%% © º§§§§§@@@@@ ;OK%'.replace(/[^a-zA-Z\d\s:]/g,' ')
结果:
"test OK "
也许可以明确说明您想要删除的内容您认为
/[…\(\)]/g
匹配什么?无论如何,您有两个基本选项:(1)列出所有要删除的字符,(2)列出所有不想删除的字符。这只会删除该字符的一个实例。