Warning: file_get_contents(/data/phpspider/zhask/data//catemap/3/html/90.json): failed to open stream: No such file or directory in /data/phpspider/zhask/libs/function.php on line 167

Warning: Invalid argument supplied for foreach() in /data/phpspider/zhask/libs/tag.function.php on line 1116

Notice: Undefined index: in /data/phpspider/zhask/libs/function.php on line 180

Warning: array_chunk() expects parameter 1 to be array, null given in /data/phpspider/zhask/libs/function.php on line 181

Warning: file_get_contents(/data/phpspider/zhask/data//catemap/8/api/5.json): failed to open stream: No such file or directory in /data/phpspider/zhask/libs/function.php on line 167

Warning: Invalid argument supplied for foreach() in /data/phpspider/zhask/libs/tag.function.php on line 1116

Notice: Undefined index: in /data/phpspider/zhask/libs/function.php on line 180

Warning: array_chunk() expects parameter 1 to be array, null given in /data/phpspider/zhask/libs/function.php on line 181
删除MS Word“;HTML";使用PHP_Php_Html_Ms Word_Htmlcleaner - Fatal编程技术网

删除MS Word“;HTML";使用PHP

删除MS Word“;HTML";使用PHP,php,html,ms-word,htmlcleaner,Php,Html,Ms Word,Htmlcleaner,可能重复: 我允许客户端在富格文本编辑器中输入注释,并且直到最近才升级到ckEditor 3x,默认情况下(当用户粘贴到编辑器对象中时),它会剥离MS word类、样式和注释。所以向前看,我已经准备好了 我最近需要整理5年的笔记,其中一些已经嵌入了MS word生成的HTML。我需要循环浏览这段文字并将其清理干净 我不需要去掉所有的span标记,只需要那些被识别为由Microsoft编写的标记 我尝试过使用HTMLCleaner,但它并没有删除MS生成的HTML。这正是我想要的,但是开发人员

可能重复:

我允许客户端在富格文本编辑器中输入注释,并且直到最近才升级到ckEditor 3x,默认情况下(当用户粘贴到编辑器对象中时),它会剥离MS word类、样式和注释。所以向前看,我已经准备好了

我最近需要整理5年的笔记,其中一些已经嵌入了MS word生成的HTML。我需要循环浏览这段文字并将其清理干净

我不需要去掉所有的span标记,只需要那些被识别为由Microsoft编写的标记

我尝试过使用HTMLCleaner,但它并没有删除MS生成的HTML。这正是我想要的,但是开发人员目前没有提供API供公众使用(截至2012年7月9日)

在过去的几个星期里,我断断续续地寻找这样一门课,运气不太好。你们中有谁找到了一个有用的类来分享吗?


这将满足您的需要。

现在就尝试一下-谢谢。为了澄清,我需要一个服务器端类,可以将其嵌入到现有的应用程序中。mario提到的SO问题/答案中有一些很棒的工具,但是我发现它们大部分都是为一次性转换而设计的——或者使用curl发布到他们的网站上。不能用PHI.Mario这样做,你的URL到哪里去了?它们是有用的,也是我结束的部分理由。它们应该对OP使用回顾脚本进行HTML清理也很有用。我希望这个问题可以保留,因为maxhud下面的回答向T提出了我的问题。htmlpurifier是一个类,而不是用户浏览和上传到的网站。我注意到我问题顶部添加了两个新链接。第一个并不能完全回答我要找的。然而,第二个在我最初的搜索中出现了,但没有出现(道歉)。接受的答案与下面maxhud的答案相同;是的,如果一个问题是这样结束的,它应该总是可用的-我认为如果问题自动结束,因为已经达到必要的五个结束投票,这种情况总是发生的。当手动删除时,一些mod会完全删除问题,但我认为在这些普通情况下不会发生这种情况。