我应该使用哪种技术将latex文档转换为html文档

我应该使用哪种技术将latex文档转换为html文档,html,parsing,latex,Html,Parsing,Latex,我想写一个小程序,把我的TeX文件转换成HTML。我想解析文档并将宏(内置的,当然还有我自己的)转换成HTML片段。以下是我的要求: 预定义的规则(例如开始{itemize}\item text\end{itemize}=>文本) 定义自己的CSS样式 转换公式的能力(提取公式,将其加载到imagecreator中,然后保存jpg/png) 易于维护和简洁 我知道有几种技术,但我不知道哪种最适合我。以下是我脑海中浮现的技术 Ruby(I/O很容易,通过webrat进行公式化加载) XML X

我想写一个小程序,把我的TeX文件转换成HTML。我想解析文档并将宏(内置的,当然还有我自己的)转换成HTML片段。以下是我的要求:

  • 预定义的规则(例如
    开始{itemize}\item text\end{itemize}
    =>

    文本


  • 定义自己的CSS样式
  • 转换公式的能力(提取公式,将其加载到imagecreator中,然后保存jpg/png)
  • 易于维护和简洁
我知道有几种技术,但我不知道哪种最适合我。以下是我脑海中浮现的技术

  • Ruby(I/O很容易,通过webrat进行公式化加载)
  • XML XSLT(我不认为我只需要开销)
  • perl(有很多lib,但我不太熟悉)
  • bash(我使用sed,并惊讶于使用正则表达式是多么容易)
  • 最新的HTML。。。(这些转换器对我不起作用,也不能给我解析的自由)
  • 欢迎提出任何建议、提示和意见

    谢谢你们的时间,伙计们。

    Six:TeX

    七:哈斯克尔


    (我放弃了劝说,所以从6开始给我的名单编号)。

    看看潘多克。它也可以安装在linux或os x上。尽管它不会执行自定义宏。我所看到的唯一一件能够很好地处理自定义宏的事情是tex4ht,但要真正工作良好,您需要生成.DVI文件。如果你有大量的自定义宏,编写你自己的转换器将花费大量的时间。即使你只有几个自定义宏,这仍然是一个痛苦。祝你好运

    为什么要逐项列出ul>和
  • 更具语义。对于我更喜欢MathXML的公式,它可以在HTML5中使用,尽管它还不是完全支持的。还有为什么

    东西
    <代码>
    为您添加换行符。如果你需要更多的空间,只需更改边距。@Tae和@Brendan Long这只是愚蠢的例子,你是对的,我最终会用另一种方式来设计它。tex4ht或者htlatex是解决方案。它甚至在渲染我的特殊颜色风格。我想你的暗示帮我省了好几个星期的投资:)。