如何将Google文档作为降价导入Python应用程序?

如何将Google文档作为降价导入Python应用程序?,python,google-drive-api,markdown,google-docs,Python,Google Drive Api,Markdown,Google Docs,我正在编写一个Python应用程序,它需要从GoogleDrive获取一个Google文档作为降价 我正在寻找设计和现有开源代码的想法 据我所知,谷歌不提供降价出口。我想这意味着我必须弄清楚,哪种可用的下载/导出格式最适合转换为降价 确保文档内容不包含markdown不支持的任何内容 编辑:为了使设置尽可能简单,我希望避免使用非python软件。您可能希望了解哪些软件支持从docx到markdown的转换。Pandoc有几个Python包装器,例如 从Google Drive获取docx格式的文

我正在编写一个Python应用程序,它需要从GoogleDrive获取一个Google文档作为降价

我正在寻找设计和现有开源代码的想法

据我所知,谷歌不提供降价出口。我想这意味着我必须弄清楚,哪种可用的下载/导出格式最适合转换为降价

确保文档内容不包含markdown不支持的任何内容


编辑:为了使设置尽可能简单,我希望避免使用非python软件。

您可能希望了解哪些软件支持从docx到markdown的转换。Pandoc有几个Python包装器,例如

从Google Drive获取docx格式的文档后,转换过程非常简单:

import pypandoc
markdown_output = pypandoc.convert_file('Document.docx', 'markdown')
GoogleDrive提供了一个“压缩HTML”导出选项

使用将HTML转换为标记

html2text是一个Python脚本,它将HTML页面转换为干净、易于阅读的纯ASCII文本。更好的是,ASCII恰好也是有效的标记(文本到HTML格式)

导入html2text >>> >>>打印(html2text.html2text(“Zed的死婴, 泽德死了。

”) **泽德死了,宝贝,泽德死了。
稍微修改了这个问题,这使得Pandoc不是一个好的选择,因为它不是纯Python。我正在考虑改用。
>>> import html2text
>>>
>>> print(html2text.html2text("<p><strong>Zed's</strong> dead baby,
<em>Zed's</em> dead.</p>"))
**Zed's** dead baby, _Zed's_ dead.