Ruby on rails 从字符串中删除所有非字母字符,包括&;nbsp&;amp;或任何;代码
给定一个字符串,如Ruby on rails 从字符串中删除所有非字母字符,包括&;nbsp&;amp;或任何;代码,ruby-on-rails,regex,gsub,strip-tags,Ruby On Rails,Regex,Gsub,Strip Tags,给定一个字符串,如“Whatup whatever\n”,我需要将其转换为“Whatup whatever” 我非常熟悉下面的方法,但是我找不到一个好方法来删除动态&和类型代码。我不想把每一行都写出来(就像我用逗号做的那样)——它们有数十万行和许多不同的代码……诸如此类 欢迎任何指点 def self.clean_string(st) return strip_tags(st).force_encoding("UTF-8").gsub(",","").squish if st
“Whatup whatever\n”
,我需要将其转换为“Whatup whatever”
我非常熟悉下面的方法,但是我找不到一个好方法来删除动态&代码>和
类型代码。我不想把每一行都写出来(就像我用逗号做的那样)——它们有数十万行和许多不同的代码……诸如此类
欢迎任何指点
def self.clean_string(st)
return strip_tags(st).force_encoding("UTF-8").gsub(",","").squish if st and st != ""
end
对于HTML实体,添加以下正则表达式替换:
.gsub(/&[^;]+;/, '')
它将删除任何&代码>-从文本中选择样式实体。应该可以。我可能会用叉子来找到丢失的分号。我们的数据由不编写代码的ppl使用标记进行处理