在Python2.7中,如何从降价中获取标题并将其放入数组中
我是python新手,我试图解析一个标记文件,我想把所有的标题放在一个数组中,块放在另一个数组中,等等。。 我使用了mistune,但我得到的只是html文本。 我该怎么做在Python2.7中,如何从降价中获取标题并将其放入数组中,python,arrays,python-2.7,markdown,Python,Arrays,Python 2.7,Markdown,我是python新手,我试图解析一个标记文件,我想把所有的标题放在一个数组中,块放在另一个数组中,等等。。 我使用了mistune,但我得到的只是html文本。 我该怎么做 import mistune import codecs import re path = 'exg.txt' with codecs.open(path) as markdownFile: markdownFile = open(path, "r") mdText = markdownFile.read
import mistune
import codecs
import re
path = 'exg.txt'
with codecs.open(path) as markdownFile:
markdownFile = open(path, "r")
mdText = markdownFile.read()
markdown = mistune.Markdown()
parsedText = markdown(mdText)
print parsedText
所有你得到的都是html,因为mistune就是这么做的,它是一个用于将markdown转换为html的库,所以我现在必须解析html以获得标题和段落等。啊,我明白了,所以你想要html中的标题元素?是的,还有所有其他html组件。我用了正则表达式,它成功了!因此,您不是在寻找标题,而是在一个数组中寻找类似这样的内容——“这是一个标题”,在另一个数组中包含所有其他html块