Markdown 如何将HTML转换为标记,同时保留非标记HTML标记?

Markdown 如何将HTML转换为标记,同时保留非标记HTML标记?,markdown,pandoc,Markdown,Pandoc,我希望能够获取一个现有的HTML片段,并将其转换为降价。 为此,我尝试了潘多克: pandoc test.html -o test.md 其中test.html如下所示: Hello <!-- more --> and some more text <h2>some heading</h2> 因此,它不仅转换在markdown中具有直接含义的标记。它还删除了我希望保留为HTML的标记(例如,HTML注释、iframe标记等等) 如何将

我希望能够获取一个现有的HTML片段,并将其转换为降价。 为此,我尝试了潘多克:

pandoc test.html -o test.md
其中test.html如下所示:

Hello

<!-- more -->

and some more text

<h2>some heading</h2>       
因此,它不仅转换在markdown中具有直接含义的标记。它还删除了我希望保留为HTML的标记(例如,HTML注释、
iframe
标记等等)

  • 如何将HTML转换为标记,使标记中没有等效标记的标记保留为原始HTML
  • 更一般地说,我如何控制HTML到标记转换的完成方式

特别是,我对命令行程序选项感兴趣。例如,可能有一些选项可以提供给pandoc。

经过一段时间的搜索,我在一篇文章中读到了
--parse raw
选项

添加
--parse raw
选项似乎不会去除非标记的等效HTML标记

pandoc test.html -o test.md --parse-raw

有趣的是,我有一个完全相反的问题。它保留div,而我没有请求它
--parse raw/-R
已被删除。使用
+raw_html
+raw_tex
扩展名。@ZhuoerDong 2013,在撰写评论时,它仍然是pandoc 1.x,但在pandoc 2.x中,您必须按照建议使用
+raw_html
+raw_tex
扩展名
pandoc test.html -o test.md --parse-raw