Formatting 如何自动标记纯文本并保留格式

Formatting 如何自动标记纯文本并保留格式,formatting,markup,plaintext,Formatting,Markup,Plaintext,我正在维护一个不断增长的(250页)纯文本文档,它确实需要一个PDF技术文档。我是否可以使用一些自动标记工具来保留我现有的格式,即标题、副标题、段落、表格、列、示例等?一旦初始标记(转换为html/xml)正确,我就可以更直接地将其转换为PDF格式,但我真的希望避免整个手动重新格式化,以保持其现有格式。如何将标题转换为纯文本?它们只是空白吗?你们是如何制作表格的?标题本身是左对齐的短线,没有结束时间,缩进表示级别。列和表还有其他明显和不太明显的规则。我不是唯一一个有这个问题的人——有数百万页没有

我正在维护一个不断增长的(250页)纯文本文档,它确实需要一个PDF技术文档。我是否可以使用一些自动标记工具来保留我现有的格式,即标题、副标题、段落、表格、列、示例等?一旦初始标记(转换为html/xml)正确,我就可以更直接地将其转换为PDF格式,但我真的希望避免整个手动重新格式化,以保持其现有格式。

如何将标题转换为纯文本?它们只是空白吗?你们是如何制作表格的?标题本身是左对齐的短线,没有结束时间,缩进表示级别。列和表还有其他明显和不太明显的规则。我不是唯一一个有这个问题的人——有数百万页没有标记的纯文本。我有一个很好的软件开始做这件事,但这是计划B在这一点上。很难理解这里面没有现成的东西。问题是你的格式规则是临时的,不是标准的。PERL将解决您的模棱两可的格式问题,这就是这类问题的答案。你也可以研究latex,但html也可以解决你的问题。你的解决方案意味着手动重新格式化整个文档——在这个空间里,我有许多无趣的选择。Markdown提供了一个更好的方向,即纯文本文档需要更少的修改,并且在完成后保持可读性。我正在进一步研究这个问题。