Javascript 删除行话,但保留真实字符

Javascript 删除行话,但保留真实字符,javascript,html,Javascript,Html,我被下面这样的帖子所轰炸,那么什么是最好、最有效的方法来删除这些术语呢 <texarea id="comment">ȑ̉̽ͧ̔͆ͦ̊͛̿͗҉̷̢̧̫̗̗͎͈͕e̷̪͓̼̼̣̻̻͙͔̳̘̗͙̬̱͎ͭ̃͗ͩͯͥͬ̂ͧ͐͌̑̅͢͜ͅd̴̦̺̖̣͎̲̥͕̗̺̯̤͗ͬ͌ͧ̓͒ͭ́̋ͩͥ͊̇̓̌ͫ̃́́͠</textarea> 在本代码中,从从从从本代码中采集的角度角度来看来看来看,从从本代码中汲取汲取的本本本本本本本本本本本本本本本本本本本本本本本本本本本本本本本本本本本本本本本

我被下面这样的帖子所轰炸,那么什么是最好、最有效的方法来删除这些术语呢

<texarea id="comment">ȑ̉̽ͧ̔͆ͦ̊͛̿͗҉̷̢̧̫̗̗͎͈͕e̷̪͓̼̼̣̻̻͙͔̳̘̗͙̬̱͎ͭ̃͗ͩͯͥͬ̂ͧ͐͌̑̅͢͜ͅd̴̦̺̖̣͎̲̥͕̗̺̯̤͗ͬ͌ͧ̓͒ͭ́̋ͩͥ͊̇̓̌ͫ̃́́͠</textarea>
在本代码中,从从从从本代码中采集的角度角度来看来看来看,从从本代码中汲取汲取的本本本本本本本本本本本本本本本本本本本本本本本本本本本本本本本本本本本本本本本本本本本本本本月月月月月月月月月的一方方方方方方方方方方方方方方方方方方方方本本本本本本本本本本本本本本本本本本本本本本本本本本本本本月月月月月月月月月月月月月月月月月的本本本本本本本本本本本本本本本本本本本本本本本本本本本本本本本本本本本本本本本本本本本本本本本本本本本本本本本本本本本本本本本本本本本本本月月月月月月月月月月月月月月月月月月月月第四部分:第四部分 我假设是RegEx,但是这些东西到底被调用了什么,以及如何在RegExp中引用它?问题在于
标记中,在检索值时,我希望能够从值中删除所有行话,并让它只显示真实的字符,在本例中,这些字符应该是
红色


允许其他Unicode类型的字符是必要的,但不能允许字符堆叠在一起。

删除组合变音符号会使某些语言(如越南语)的输入变得困难或不可能,因此您应该重新考虑。

Zalgo在墙后等待

您希望过滤掉组合字符,例如列出的变音符号

您应该能够进行简单的字符类模式匹配,即:

fooString.替换(/[\u0300-\u036f\u0483-\u0489\u1dc0-\u1dff\u20d0-\u20ff\ufe20-\ufe2f]/,“”);

如果您想将内容限制为每个字符一个组合(并不是说这真的减轻了所有负面影响),您可以简单地使用

fooString.replace(/([\u0300-\u036f\u0483-\u0489\u1dc0-\u1dff\u20d0-\u20ff\ufe20-\ufe2f])[\u0300-\u036f\u0483-\u0489\u1dc0-\u1dff\u20d0-\u20ff\ufe20-\ufe2f]*/,“$1”);


编辑:添加了许多其他组合字符范围。这很可能仍然不完整。

您刚刚破坏了问题页面,man:p(我也没有在…东西中看到任何红色字符)@Adrian Wow,刚刚注意到,在我发布之后。从标题中删除了行话。:3Sadly,这些组合字符是多少客户将构建他们的
u
ç
字符。等等!你说你从标题中删除了行话。请解释一下,你说的“行话”是什么意思“?这就是他们的名字。但是,必须有一种方法可以只允许一个给定的字符使用其中的一个字符?有时可能需要两个或三个字符才能组成一个字符。这里有一个字符列表这几乎可以用(我不确定
s/
应该做什么)这里是我尝试过的:啊,我的错。这只是用于替换的Perl正则表达式表示法——相当于JS
.replace
。不幸的是,这不会像挽救每个序列中的第一个变音符号那样起作用。您可能希望使用“$1”作为要替换的第二个参数。这将用
()
-即序列的第一个字符之间捕获的内容替换整个序列。更新了我的答案以使用JavaScript字符串替换而不是原始正则表达式表示法。