Warning: file_get_contents(/data/phpspider/zhask/data//catemap/2/python/361.json): failed to open stream: No such file or directory in /data/phpspider/zhask/libs/function.php on line 167

Warning: Invalid argument supplied for foreach() in /data/phpspider/zhask/libs/tag.function.php on line 1116

Notice: Undefined index: in /data/phpspider/zhask/libs/function.php on line 180

Warning: array_chunk() expects parameter 1 to be array, null given in /data/phpspider/zhask/libs/function.php on line 181
在Python2.7中,如何从降价中获取标题并将其放入数组中_Python_Arrays_Python 2.7_Markdown - Fatal编程技术网

在Python2.7中,如何从降价中获取标题并将其放入数组中

在Python2.7中,如何从降价中获取标题并将其放入数组中,python,arrays,python-2.7,markdown,Python,Arrays,Python 2.7,Markdown,我是python新手,我试图解析一个标记文件,我想把所有的标题放在一个数组中,块放在另一个数组中,等等。。 我使用了mistune,但我得到的只是html文本。 我该怎么做 import mistune import codecs import re path = 'exg.txt' with codecs.open(path) as markdownFile: markdownFile = open(path, "r") mdText = markdownFile.read

我是python新手,我试图解析一个标记文件,我想把所有的标题放在一个数组中,块放在另一个数组中,等等。。 我使用了mistune,但我得到的只是html文本。 我该怎么做

import mistune
import codecs
import re

path = 'exg.txt'

with codecs.open(path) as markdownFile:
    markdownFile = open(path, "r")
    mdText = markdownFile.read()


markdown = mistune.Markdown()
parsedText = markdown(mdText)
print parsedText

所有你得到的都是html,因为mistune就是这么做的,它是一个用于将markdown转换为html的库,所以我现在必须解析html以获得标题和段落等。啊,我明白了,所以你想要html中的标题元素?是的,还有所有其他html组件。我用了正则表达式,它成功了!因此,您不是在寻找标题,而是在一个数组中寻找类似这样的内容——“这是一个标题”,在另一个数组中包含所有其他html块