Javascript 如何从nodejs中从googledoc导出的docx中提取元作者和标题?
我在Google doc上创建了一个Javascript 如何从nodejs中从googledoc导出的docx中提取元作者和标题?,javascript,node.js,metadata,google-docs,docx,Javascript,Node.js,Metadata,Google Docs,Docx,我在Google doc上创建了一个.docx文档 使用脚本,我想检测以下元数据: 作者 头衔 日期 我已经尝试了以下软件包,但由于这些软件包不起作用,我已打开了一些问题: 如何从NodeJS中的googledoc.docx文档中提取元作者和标题?a.docx文件只是一个包含其他文件的zip文件。只需找到一个可以解压的包/模块,并查找包含所需数据的.xml文件即可你可以自己解开一个,看一看。我使用7-zip浏览了其中一个,在docProps子路径中找到了两个包含一些文档数据的文件:
.docx
文档
使用脚本,我想检测以下元数据:
- 作者
- 头衔
- 日期
如何从NodeJS中的googledoc
.docx
文档中提取元作者和标题?a.docx文件只是一个包含其他文件的zip文件。只需找到一个可以解压的包/模块,并查找包含所需数据的.xml
文件即可你可以自己解开一个,看一看。我使用7-zip浏览了其中一个,在docProps
子路径中找到了两个包含一些文档数据的文件:
- app.xml
- core.xml
如果您是从Google文档导出的,则可能不包括该信息。我已检查,在Google文档上生成的
.docx
中没有app.xml
norecore.xml
。此外,谷歌文档生成的任何文件中都没有任何信息。我打赌这些信息无法检索。.docx
不是Google文档,而是Microsoft Word文档文件。谷歌文档有一个.gdoc
扩展名。您可能希望查看有问题的实际文件。你也可以在文本编辑器中打开它,以防它没有被压缩(我认为旧的格式只是纯xml)。这是一个要求,我假设他们没有设置这些信息。我只是尝试了一下,从谷歌文档创建时似乎没有包含这些信息(至少不在该路径中)。我只在word/document.xml
中看到文档详细信息。尽管如此,这是答案,即使没有细节(你从来没有说过你是从谷歌导出的)不,它也不适合我(对于导出的谷歌文档)。尽管我不确定是否能正确理解你的情况,例如,在导出为.docx
文件之前,从谷歌文档中检索作者、标题和日期(在你的情况下,日期是多少?)。在这种情况下,这可以通过使用GoogleAPI中的驱动API来实现。这个怎么样?这个包应该可以用