如何在node.js中导入现有PDF文件

如何在node.js中导入现有PDF文件,node.js,pdf,import,Node.js,Pdf,Import,我正在为节点编写导入例程,到目前为止,我可以使用pdf2json从PDF导入文本节点,这很好,但对基于图像且不包含文本的PDF不起作用 所以我下载了pdf2img,但是这个模块有很多问题,我现在遇到的一个问题是,在运行它之后,我创建了很多0字节的png文件,没有内容和错误消息: /docfire/node_modules/gm/lib/command.js:228 proc.stdin.once('error', cb); ^

我正在为节点编写导入例程,到目前为止,我可以使用pdf2json从PDF导入文本节点,这很好,但对基于图像且不包含文本的PDF不起作用

所以我下载了pdf2img,但是这个模块有很多问题,我现在遇到的一个问题是,在运行它之后,我创建了很多0字节的png文件,没有内容和错误消息:

    /docfire/node_modules/gm/lib/command.js:228
        proc.stdin.once('error', cb);
                  ^

    TypeError: Cannot read property 'once' of undefined
        at gm._spawn (/docfire/node_modules/gm/lib/command.js:228:15)
        at /docfire/node_modules/gm/lib/command.js:140:19
        at series (/docfire/node_modules/array-series/index.js:11:36)
        at gm._preprocess         
(/docfire/node_modules/gm/lib/command.js:177:5) 在gm.stream(/docfire/node_modules/gm/lib/command.js:138:10) 在转换器pdf2img(/docfire/node_modules/pdf2img/lib/pdf2img.js:93:6) at/docfire/node_modules/pdf2img/lib/pdf2img.js:67:9 at/docfire/node_modules/async/lib/async.js:246:17 at/docfire/node_modules/async/lib/async.js:122:13 每个(/docfire/node\u modules/async/lib/async.js:46:13)

我曾尝试在GIT网站上发布一个关于该模块的问题,但似乎有相当多的人遇到了完全相同的问题,而且似乎没有任何关于任何修复的活动

理想情况下,我想要的是一种从PDF中为节点提取文本和图像的方法

我在运行macOS Sierra v10.12.4的iMAC上运行
使用节点版本7.8.0、pdf2img 0.2.0、gm 1.23.0,您可以尝试使用pdf图像npm软件包

希望这有帮助