Warning: file_get_contents(/data/phpspider/zhask/data//catemap/2/linux/28.json): failed to open stream: No such file or directory in /data/phpspider/zhask/libs/function.php on line 167

Warning: Invalid argument supplied for foreach() in /data/phpspider/zhask/libs/tag.function.php on line 1116

Notice: Undefined index: in /data/phpspider/zhask/libs/function.php on line 180

Warning: array_chunk() expects parameter 1 to be array, null given in /data/phpspider/zhask/libs/function.php on line 181
Linux 使用node.js解析word文档中的表_Linux_Node.js_Powershell_Ms Word - Fatal编程技术网

Linux 使用node.js解析word文档中的表

Linux 使用node.js解析word文档中的表,linux,node.js,powershell,ms-word,Linux,Node.js,Powershell,Ms Word,我正在尝试创建一个由linux服务器托管的node.jsweb应用程序。应用程序必须读取并解析word文档中的表 我环顾四周,发现Powershell可以实现这一点。问题在于Powershell是一种MS脚本语言,其Mac端口()非常不稳定,每当我想执行这样简单的操作时: $wd = New-Object -ComObject Word.Application $wd.Visible = $true $doc = $wd.Documents.Open($filename) $doc.Tables

我正在尝试创建一个由linux服务器托管的node.jsweb应用程序。应用程序必须读取并解析word文档中的表

我环顾四周,发现Powershell可以实现这一点。问题在于Powershell是一种MS脚本语言,其Mac端口()非常不稳定,每当我想执行这样简单的操作时:

$wd = New-Object -ComObject Word.Application
$wd.Visible = $true
$doc = $wd.Documents.Open($filename)
$doc.Tables | ForEach-Object {
  $_.Cell($_.Rows.Count, $_.Columns.Count).Range.Text
}
我已经研究过其他解决方案,比如,它太通用了(即它将整个word文档转换为纯文本,不够细粒度)

有些人使用API,但它花费了很多钱!我想我自己能做到


想法?

如果您要在Linux机器上部署,最好使用Docsplit,然后解析输出文本,或者您可以尝试


另一个选择是尝试在Wine上运行MS COM API,但我不确定它是否兼容。

这里有一个可以读取/写入docx文件的python模块:


它是doc还是docx?PowerShell方法还需要安装MS Word。我认为这在Linux服务器上是不太可能的(更不用说这样做的许可问题了)。我不确定这是否可能,但您所拥有的只是word文档中的一个表。您不能将表格复制到Excel,然后将Excel文档导出为CSV文件。@BobLobLaw我也这么想。。然而,这是我的客户明确的要求,他说excel只是一个麻烦。。我不想把负担转嫁给他你know@AndyArismendi可以是。。无论哪个使我的生活更轻松,请原谅我的怀疑。。但任何一个开源项目,如果不是在github或其他现代开源回购主机上托管,都会让我产生怀疑。。它只是告诉我,人们的兴趣已经减弱和/或支持已不复存在。例如,从2008到2012一直处于休眠状态,即当决定继续…Apache不是“开源回购主机”时,它是支持和管理许多高知名度开源项目开发和管理的基础。仅仅因为项目所在地而打折是有点短视的。@alroc你说得对,我知道这一区别。我指的不仅仅是托管类型的技术性,我指的更多的是人们期望从不同的开源集群/社区获得的支持。以我的经验。。github是迄今为止最具活力的集群,我从中克隆的任何开源项目都会伴随着快速而出色的支持。。我不能对其他人说同样的话。我相信有很多优秀的。。但对我来说,这更多的是一种尝试和错误的东西,我喜欢尽量避免。我喜欢这个。。上面说表格可以组合,但我想知道它们是否可以阅读?让我试试