使用PHP将HTML转换为另一种语法(LaTeX)

使用PHP将HTML转换为另一种语法(LaTeX),php,html,regex,dom,latex,Php,Html,Regex,Dom,Latex,我正在尝试做一个自定义HTML到LaTeX转换器,它使用Wordpress帖子作为源代码 基本上,它需要做一些“替换”,比如: 我应该使用哪种方法?有允许这样替换的HTMLDOM解析器吗?还是其他建议 更新:在PHP中有没有任何方法可以正确地在HTMLDOM树中行走?我试过递归多米塔尔(http://stackoverflow.com/questions/4431142/loop-through-all-elements-of-body-tags-using-dom)但是我不能得到一个成功的结果

我正在尝试做一个自定义HTML到LaTeX转换器,它使用Wordpress帖子作为源代码

基本上,它需要做一些“替换”,比如:

我应该使用哪种方法?有允许这样替换的HTMLDOM解析器吗?还是其他建议

更新:在PHP中有没有任何方法可以正确地在HTMLDOM树中行走?我试过递归多米塔尔(http://stackoverflow.com/questions/4431142/loop-through-all-elements-of-body-tags-using-dom)但是我不能得到一个成功的结果


谢谢。

你试过了吗?具体来说,中的“如何遍历DOM树?”部分可能就是您要查找的内容。

根据文章中HTML结构的复杂程度,您可以使用基于正则表达式的替换(如果标记相当简单,如示例中所示)。如果您想将复杂结构(嵌套元素)复制到LaTeX中,那么regex可能无法工作。

您是否了解:即使可以使用正则表达式解析Hazar任务所需的HTML子集,也不可取。在处理属性时,这将很快变得笨拙,并且不会提供构造LaTeX文档所需的树状数据结构。
<h2>H2 Title</h2>
<p>Text text text</p>
<img src="/image.png" alt="Image ALT tag" \>
   \begin{document}

   \section{H2 Title}

   Text text text

   \shorthandoff{=}
   \begin{figure}[H]
   \centering
   \includegraphics[scale=0.7]{./img/image.png}
   \caption{Image ALT tag}
   \end{figure}
   \shorthandon{=}

   \end{document}