Markdown 如何将HTML转换为标记,同时保留非标记HTML标记?
我希望能够获取一个现有的HTML片段,并将其转换为降价。 为此,我尝试了潘多克:Markdown 如何将HTML转换为标记,同时保留非标记HTML标记?,markdown,pandoc,Markdown,Pandoc,我希望能够获取一个现有的HTML片段,并将其转换为降价。 为此,我尝试了潘多克: pandoc test.html -o test.md 其中test.html如下所示: Hello <!-- more --> and some more text <h2>some heading</h2> 因此,它不仅转换在markdown中具有直接含义的标记。它还删除了我希望保留为HTML的标记(例如,HTML注释、iframe标记等等) 如何将
pandoc test.html -o test.md
其中test.html如下所示:
Hello
<!-- more -->
and some more text
<h2>some heading</h2>
因此,它不仅转换在markdown中具有直接含义的标记。它还删除了我希望保留为HTML的标记(例如,HTML注释、iframe
标记等等)
- 如何将HTML转换为标记,使标记中没有等效标记的标记保留为原始HTML
- 更一般地说,我如何控制HTML到标记转换的完成方式
特别是,我对命令行程序选项感兴趣。例如,可能有一些选项可以提供给pandoc。经过一段时间的搜索,我在一篇文章中读到了
--parse raw
选项
添加--parse raw
选项似乎不会去除非标记的等效HTML标记
pandoc test.html -o test.md --parse-raw
有趣的是,我有一个完全相反的问题。它保留div,而我没有请求它
--parse raw/-R
已被删除。使用+raw_html
或+raw_tex
扩展名。@ZhuoerDong 2013,在撰写评论时,它仍然是pandoc 1.x,但在pandoc 2.x中,您必须按照建议使用+raw_html
或+raw_tex
扩展名
pandoc test.html -o test.md --parse-raw