Php 删除HTML标记中的空白

Php 删除HTML标记中的空白,php,html,preg-replace,Php,Html,Preg Replace,我目前正在翻译一个大数据集(大约7000行)。此数据集包含英语短语,但也包含HTML标记,已使用Google Translate翻译为荷兰语 然而,在查看生成的翻译时,Google Translate还通过添加空格来扰乱HTML标记。我想删除翻译文件中HTML标记内的所有无效空格。例如: this is a test. < a href = "hello.php" >test</ a>; 这是一个测试a href=“hello.php”>测试; 应成为: this i

我目前正在翻译一个大数据集(大约7000行)。此数据集包含英语短语,但也包含HTML标记,已使用Google Translate翻译为荷兰语

然而,在查看生成的翻译时,Google Translate还通过添加空格来扰乱HTML标记。我想删除翻译文件中HTML标记内的所有无效空格。例如:

this is a test. < a href = "hello.php" >test</ a>;
这是一个测试a href=“hello.php”>测试;
应成为:

this is a test. <a href="hello.php">test</a>;
这是一个测试;
是否有一个正则表达式可以实现这一点?

$text=str_replace(“<”、“,”>”、$text);
$text = str_replace("< ", "<", $text);
$text = str_replace("> ", ">", $text);
$text = str_replace(" <", "<", $text);
$text = str_replace(" >", ">", $text);
$text = str_replace("= ", "=", $text);
$text = str_replace(" =", "=", $text);
$text = str_replace("\/ ", "\/", $text);
$text=str_replace(“,$text”); $text=str_替换(“=”、“=”、$text); $text=str_替换(“=”、“=”、$text); $text=stru替换(“\/”、“\/”、$text);
$text=str_替换(“<”、“,”>”、$text);
$text=str_replace(“,$text”);
$text=str_替换(“=”、“=”、$text);
$text=str_替换(“=”、“=”、$text);
$text=stru替换(“\/”、“\/”、$text);

您不想删除所有空白,您想删除
=
周围和
$yourString=str\u replace(“<”,“使用HTML整理”修复之前的额外空间"标记。@Bobby我想这应该行得通。。但这对系统性能来说确实是一个沉重的负担。@SanderSmolenaers:这里的建议很快就完成了。更长的一点是,你需要展示你迄今为止为解决问题所做的工作,并更具体地询问解决问题的方法。只要把你的要求放在re不是真正被接受的。这就是为什么你也会看到向下的投票。你不想删除所有的空白,你想删除
=
周围和
之前的额外空间,
$yourString=str\u replace(“<”,“使用HTML整理”修复"标记。@Bobby我想这应该行得通。。但这对系统性能来说确实是一个沉重的负担。@SanderSmolenaers:这里的建议很快就完成了。更长的一点是,你需要展示你迄今为止为解决问题所做的工作,并更具体地询问解决问题的方法。只要把你的要求放在re真的不被接受。这就是为什么你也会看到反对票。