用python解析LaTeX枚举

用python解析LaTeX枚举,python,regex,parsing,latex,Python,Regex,Parsing,Latex,我正在尝试用python为LaTeX中的枚举环境编写解析器。我的问题是,其中一些项具有枚举环境,因此解析它就成了一个问题。我最初的方法是得到\item所有位置的列表,然后是\begin{enumerate}和\end{enumerate}的每个位置,然后尝试编写一个快速算法,找出哪些枚举在哪个项目中,然后以这种方式取出每个项目 我最初的方法是使用正则表达式,但我意识到这很困难。有人知道这样做的好方法吗?你考虑过使用状态机方法吗?我还没有任何关于如何在这个例子中使用状态机的参考资料?我会逐行解析,

我正在尝试用python为LaTeX中的枚举环境编写解析器。我的问题是,其中一些项具有枚举环境,因此解析它就成了一个问题。我最初的方法是得到
\item
所有位置的列表,然后是
\begin{enumerate}
\end{enumerate}
的每个位置,然后尝试编写一个快速算法,找出哪些枚举在哪个项目中,然后以这种方式取出每个项目


我最初的方法是使用正则表达式,但我意识到这很困难。有人知道这样做的好方法吗?

你考虑过使用状态机方法吗?我还没有任何关于如何在这个例子中使用状态机的参考资料?我会逐行解析,还是逐字解析?我认为大多数关于使用状态机解析的文章都假设您需要检查字符串中的每一个标记,而实际上您只对可能出现的一些事情感兴趣。您只需跟踪您在文件中的位置以及每个步骤,搜索
\item
\begin{enumerate}
\end{enumerate}的下一个实例即可获得
并转到最近的一个,视情况而定。如果输入可能包含不“属于”枚举环境的
\item
项,则会稍微复杂一些。谢谢!今天晚些时候我会试试这个!如果它足够短和好,我会在这里发布我的代码剪贴画!