Google api 从Google文档中提取文本并获取特定页面

Google api 从Google文档中提取文本并获取特定页面,google-api,html-parsing,google-docs,python-docx,pypdf,Google Api,Html Parsing,Google Docs,Python Docx,Pypdf,现在,我通过从以下链接获取内容来导出我的Google文档: https://docs.google.com/feeds/download/documents/export/Exportid=DOCUMENT_ID&exportFormat=EXPORT_FORMAT 这很好,事实上我将文档导出为HTML格式,然后从中读取,但无法知道页面何时开始或结束 以下是我所知道的所有导出格式: HTML、PDF、ODT、TXT、RTF和DOCX 在渲染器中打开时,PDF、ODT、RTF和DOCX都表示单独的

现在,我通过从以下链接获取内容来导出我的Google文档:

https://docs.google.com/feeds/download/documents/export/Exportid=DOCUMENT_ID&exportFormat=EXPORT_FORMAT

这很好,事实上我将文档导出为HTML格式,然后从中读取,但无法知道页面何时开始或结束

以下是我所知道的所有导出格式:

HTML、PDF、ODT、TXT、RTF和DOCX

在渲染器中打开时,PDF、ODT、RTF和DOCX都表示单独的页面。然而,在为各种格式(PythonDocx、PyPDF4、PyRTF等)搜索了无数API之后,我一直无法找到一种有效的方法来逐页阅读Google文档

有什么建议吗?

你们可以用它,你们可以利用你们能得到的地方

然后,您可以将定制的内容作为服务提供