Google api 从Google文档中提取文本并获取特定页面
现在,我通过从以下链接获取内容来导出我的Google文档:Google api 从Google文档中提取文本并获取特定页面,google-api,html-parsing,google-docs,python-docx,pypdf,Google Api,Html Parsing,Google Docs,Python Docx,Pypdf,现在,我通过从以下链接获取内容来导出我的Google文档: https://docs.google.com/feeds/download/documents/export/Exportid=DOCUMENT_ID&exportFormat=EXPORT_FORMAT 这很好,事实上我将文档导出为HTML格式,然后从中读取,但无法知道页面何时开始或结束 以下是我所知道的所有导出格式: HTML、PDF、ODT、TXT、RTF和DOCX 在渲染器中打开时,PDF、ODT、RTF和DOCX都表示单独的
https://docs.google.com/feeds/download/documents/export/Exportid=DOCUMENT_ID&exportFormat=EXPORT_FORMAT
这很好,事实上我将文档导出为HTML格式,然后从中读取,但无法知道页面何时开始或结束
以下是我所知道的所有导出格式:
HTML、PDF、ODT、TXT、RTF和DOCX
在渲染器中打开时,PDF、ODT、RTF和DOCX都表示单独的页面。然而,在为各种格式(PythonDocx、PyPDF4、PyRTF等)搜索了无数API之后,我一直无法找到一种有效的方法来逐页阅读Google文档
有什么建议吗?你们可以用它,你们可以利用你们能得到的地方
然后,您可以将定制的内容作为服务提供