Ruby on rails 将HTML转换为适当的纯文本?
有什么方法可以将HTML转换成正确的纯文本?我尝试了从原始到消毒的所有方法,甚至邮件gem都使用了text_-part方法,该方法本来应该可以做到这一点,但对我来说不起作用 到目前为止,我的最佳拍摄是Ruby on rails 将HTML转换为适当的纯文本?,ruby-on-rails,ruby-on-rails-3,html-to-text,Ruby On Rails,Ruby On Rails 3,Html To Text,有什么方法可以将HTML转换成正确的纯文本?我尝试了从原始到消毒的所有方法,甚至邮件gem都使用了text_-part方法,该方法本来应该可以做到这一点,但对我来说不起作用 到目前为止,我的最佳拍摄是strip\u标签(strip\u链接(resource.body)),但是,等没有正确转换 这或多或少就是我在HTML中的内容: Hello This is some text. Blah blah blah. Address: John Doe 10 ABC Street Whatever
strip\u标签(strip\u链接(resource.body))
,但是,
等没有正确转换
这或多或少就是我在HTML中的内容:
Hello
This is some text. Blah blah blah.
Address:
John Doe
10 ABC Street
Whatever City
New Features
- Feature A
- Feature B
- Feature C
Check this out: http://www.google.com
Best,
Admin
转换成类似
Hello
This is some text. Blah blah blah.
Address: John Doe 10 ABC Street Whatever City
New Features Feature A Feature B Feature C
Check this out: http://www.google.com
Best, Admin
有什么想法吗?在这里找到了解决方案:
工作起来很有魅力 Rails 4.2.1具有#strip_标记
,这是一种内置方法,特别用于剥离HTML标记
一些例子:
strip_tags("Strip <i>these</i> tags!")
strip_标签(“剥离这些标签!”)
=>去掉这些标签
strip_tags("<b>Bold</b> no more! <a href='more.html'>See more here</a>...")
strip_标签(“不再加粗!”)
=>不要再大胆了!在这里看到更多
strip_tags("<div id='top-bar'>Welcome to my website!</div>")
strip_标签(“欢迎访问我的网站!”)
=>欢迎访问我的网站
请在中查看。尝试此require'rubygems'require'nokogiri'put nokogiri::HTML(my_HTML)。text
不幸的是,同样的结果,但我找到了解决方案。很快就会在这里发布!可能的副本,以便在控制台中测试上述样品,您必须通过在控制台中发出以下命令来包含帮助程序:include ActionView::Helpers::SanitizeHelper
这不会处理大多数所见即所得编辑器似乎使用的
之类的事情。您可以通过拆分来轻松删除\n
。下面是我在视图之外使用的ActionController::Base.helpers.strip_标记(response.body)分割。分割。分割。加入“”
工作相当不错,除非你有表:没有表:没有单元格内容之间的空白分离,没有细胞内容之间的空白分离,也没有它用regex解析html,以及它用regex对html进行解析,也没有用它用regex对html进行解析,也没有任何理由,也没有它用它对html进行解析,以及它用regex H(8)8月8日,8月8日,8月8日,8日,8月8日,8日,8月8日,8月8日,8日,8月8日,8日,8日,8日,8月8月8日,8日,8日,8日,8日,8月8月8月8日,8日,8日,8日,8日,8日,8日,8月8日,8月8月8日,8日,8月8日,8月8日,8日,8日,8日,8日,8日,8日,8第七节