Python 带标记的字符串HTML到DOCX
是否可以读取html字符串,例如Python 带标记的字符串HTML到DOCX,python,html,docx,Python,Html,Docx,是否可以读取html字符串,例如HelloWorld,并在单词HelloWorld上打印一个实际为斜体和粗体的字符串? 让我更好地解释一下,我必须相信一个来自html页面的docx文件,我正在使用一个textarea编辑器,它返回用html标记格式化的字符串。我应该找到将它们转换为word可读格式的方法。 现在我使用的是python docx库,我对python docx库不太熟悉,但粗体和斜体是“run”()属性。它们可能是最容易更改的,因为它们是内联定义的。在xml文件中,您需要 <w
HelloWorld
,并在单词HelloWorld上打印一个实际为斜体和粗体的字符串?
让我更好地解释一下,我必须相信一个来自html页面的docx文件,我正在使用一个textarea编辑器,它返回用html标记格式化的字符串。我应该找到将它们转换为word可读格式的方法。
现在我使用的是python docx库,我对python docx库不太熟悉,但粗体和斜体是“run”(
)属性。它们可能是最容易更改的,因为它们是内联定义的。在xml文件中,您需要
<w:r w:rsidRPr="000E1B98">
<w:rPr>
<w:b/>
<w:i/>
</w:rPr>
<w:t>
HelloWorld
</w:t>
</w:r>
你好世界
您可以在该run元素中看到粗体
和斜体
那里应该有个转换器。没有必要从头开始,除非你正在做一些非常不寻常的事情。我不会说这是不寻常的,我有一个textarea编辑器,它会给我用html标记格式化的字符串,相反,我必须转换它,以便用粗体字和斜体字阅读。这些都是示例,我希望避免翻译我认为存在的所有示例某些库已经准备好使用