Javascript 在nodejs中获取文件(word、excel、ppt)元数据信息
我想获得关于文件的信息,至少只是客户端(react)中nodejs的页面数信息。我能够使用PDFJs获得同样的PDF文件。有没有人能指出,对于其他类型的文件,如word、xls和ppt,如何做到这一点?如果有提供此服务的外部API,指出这一点也会很有帮助 您可以使用解析类似电子表格的文件。XLSX可以解析文件并返回它们的所有信息 但是在使用XLSX解析这些文件之前,您只能检索元信息。这意味着,无论发生什么,您都必须解析它们。如果您的文件很大,如果您在客户端幻灯片上这样做,则会对客户端浏览器造成性能问题 更新: 提示一下,您可以找到一些工具来检测文件的文件类型,并将它们传递给相应的解析器以获取元信息 目前,还没有这样的库是用JavaScript本机实现的。如果您可以使用其他非纯节点模块Javascript 在nodejs中获取文件(word、excel、ppt)元数据信息,javascript,node.js,reactjs,client,Javascript,Node.js,Reactjs,Client,我想获得关于文件的信息,至少只是客户端(react)中nodejs的页面数信息。我能够使用PDFJs获得同样的PDF文件。有没有人能指出,对于其他类型的文件,如word、xls和ppt,如何做到这一点?如果有提供此服务的外部API,指出这一点也会很有帮助 您可以使用解析类似电子表格的文件。XLSX可以解析文件并返回它们的所有信息 但是在使用XLSX解析这些文件之前,您只能检索元信息。这意味着,无论发生什么,您都必须解析它们。如果您的文件很大,如果您在客户端幻灯片上这样做,则会对客户端浏览器造成性
喜欢,看看它是如何工作的。获取您可以使用的docx和pdf文件中的页面计数
xlsx是否适用于电子表格以外的文件类型?像MS Word或Powerpoint文件吗?对不起,这仅用于电子表格。我写错了一些东西。获取文件类型不是问题。我有空的。我正在使用dropzone获取文件。dropzone仅用于接收文件。我认为它无法检测文件类型?除了页数之外,你希望得到哪种“元”呢?页数信息就足够了
const getPageCount = require('docx-pdf-pagecount');
getPageCount('E:/sample/document/aa/test.docx')
.then(pages => {
console.log(pages);
})
.catch((err) => {
console.log(err);
});
getPageCount('E:/sample/document/vb.pdf')
.then(pages => {
console.log(pages);
})
.catch((err) => {
console.log(err);
});