Warning: file_get_contents(/data/phpspider/zhask/data//catemap/3/html/78.json): failed to open stream: No such file or directory in /data/phpspider/zhask/libs/function.php on line 167

Warning: Invalid argument supplied for foreach() in /data/phpspider/zhask/libs/tag.function.php on line 1116

Notice: Undefined index: in /data/phpspider/zhask/libs/function.php on line 180

Warning: array_chunk() expects parameter 1 to be array, null given in /data/phpspider/zhask/libs/function.php on line 181
将HTML转换为纯文本?_Html_Imap_Exchange Server_Exchange Server 2003 - Fatal编程技术网

将HTML转换为纯文本?

将HTML转换为纯文本?,html,imap,exchange-server,exchange-server-2003,Html,Imap,Exchange Server,Exchange Server 2003,我可以使用Lumisoft的IMAP客户端从Microsoft Exchange中读取电子邮件。我已将exchange server设置设置为将任何邮件转换为纯文本。然而,当我阅读信息时,它似乎仍然包含HTML/CSS 从电子邮件正文中删除HTML/CSS的最佳方法是什么?或者exchange服务器上是否有我似乎错过的设置?我不确定您的设置是如何工作的,如果您可以运行脚本等。显然,HTML解析器是解析HTML的最佳方式。例如,使用Hpricot(一个Ruby HTML解析库),您可以执行放置do

我可以使用Lumisoft的IMAP客户端从Microsoft Exchange中读取电子邮件。我已将exchange server设置设置为将任何邮件转换为纯文本。然而,当我阅读信息时,它似乎仍然包含HTML/CSS


从电子邮件正文中删除HTML/CSS的最佳方法是什么?或者exchange服务器上是否有我似乎错过的设置?

我不确定您的设置是如何工作的,如果您可以运行脚本等。显然,HTML解析器是解析HTML的最佳方式。例如,使用Hpricot(一个Ruby HTML解析库),您可以执行
放置doc.find_元素('body')。inner_text
,这将打印文档的文本内容。

我通常采用以下方法之一

  • 使用正则表达式。 如果你必须想出一个同样适用于各种无效标记的解决方案,那就有点困难了,但我敢打赌在你之前有人做过(提示:google或search SO)

  • 使用HTML解析器库。 你可以为任何流行的编程语言找到一个。我建议使用Html敏捷包


  • 您是否正在寻找某种代码解决方案或Exchange设置?任何解决方案都会有所帮助。作为一种解决方法,我使用正则表达式删除任何HTML标记,但是这并不能删除所有CSS。Exchange设置非常理想,但我已经尝试过这些设置,即将IMAP设置为仅提供纯文本电子邮件。但是,当我阅读电子邮件时,它似乎不起作用。我是否可以建议更新标题,以反映问题具体是关于exchange邮件服务器交互的,而不是一般性的“如何将html转换为纯文本”问题。您好,之所以是一般性的,是因为我正在寻找适合此问题的任何解决方案。我不是专门寻找exchange设置,我是在寻找从电子邮件中提取纯文本正文的任何替代方案。您好,这听起来像是我可以使用的解决方案。如何以及在何处运行这样的脚本?Hpricot的链接是。你需要Ruby编程语言来运行它。嗨,我决定不使用这种方法,因为我对Ruby没有太多经验。嗨,现在我正在使用一个我自己创建的正则表达式,它只去掉HTML(留下CSS),我觉得使用这种方法不是100%舒服。理想情况下,我希望exchange服务器设置能够将我收到的任何邮件最终转换为纯文本形式的特定邮箱。我尝试将邮箱的IMAP设置设置为纯文本…它工作了一段时间,然后突然停止!决定使用HtmlAgilityPack库。