Html 如何为标记编写解析器?

Html 如何为标记编写解析器?,html,parsing,markup,Html,Parsing,Markup,我想使用Python或Perl等高级语言为类似BBCode、Markdown、Wikisyntax等的标记语言编写一个解析器。它应该具有分段、代码突出显示、自动链接创建、嵌入图像等功能,但允许HTML进行更复杂的格式设置 是否有人做过类似的事情或与这些系统密切合作过,并且可以概括地描述如何有效地完成这些工作? 虽然对于这样一个小型系统来说,效率并不是真正需要考虑的问题,但总体来说是有利的。 特别是,我想了解是否有比使用正则表达式更有效的方法用于此类程序。供您进行一般性讨论 您应该从以下蓝图开始:

我想使用Python或Perl等高级语言为类似BBCode、Markdown、Wikisyntax等的标记语言编写一个解析器。它应该具有分段、代码突出显示、自动链接创建、嵌入图像等功能,但允许HTML进行更复杂的格式设置

是否有人做过类似的事情或与这些系统密切合作过,并且可以概括地描述如何有效地完成这些工作? 虽然对于这样一个小型系统来说,效率并不是真正需要考虑的问题,但总体来说是有利的。
特别是,我想了解是否有比使用正则表达式更有效的方法用于此类程序。

供您进行一般性讨论

您应该从以下蓝图开始:

  • 您需要对整个数据进行逐字符迭代
  • 您需要根据上下文来标识每个字符,因为它可能是一个标记开头('这一个→

有没有理由不使用任何现有的解析器(和语言)?很可能你会遇到很多其他人已经经历过(并克服)的问题、困境等。对不起,我的JavaScript关闭了。这个问题以前被问过,因此可以关闭。虽然我希望对Approach进行一般性讨论,但这可能不是合适的地方。您可以自由删除该问题而不受惩罚。没有答案或投票,因此不会让任何人失望。这总比浪费每个人的时间好如果你真的确信情况会是这样的话,那它就应该积累接近票数的选票。