Web services 用于将MS Office文件格式(doc、docx、ppt等)转换为纯文本的Web服务?

Web services 用于将MS Office文件格式(doc、docx、ppt等)转换为纯文本的Web服务?,web-services,ms-office,xls,doc,Web Services,Ms Office,Xls,Doc,更大的背景:我们正在开发一个内部网门户的搜索引擎,它需要能够在所有办公室类型中进行搜索:doc、docx、xls、xlsx、ppt和pptx。搜索算法已经就位,我们已经使用办公自动化实现了索引器;然而,客户担心的是,这是1,容易出错,和2,微软不推荐(也不包括在他们的许可证中) 我已经阅读了前面关于这方面的答案,但是这需要我们集成大量不同的库来覆盖所有的边缘,我们没有资源这样做 因此,我们正在寻找一个简单的web服务,我们可以向它提交这些文档中的任何一个,并返回一个简单的纯文本(或html,甚至

更大的背景:我们正在开发一个内部网门户的搜索引擎,它需要能够在所有办公室类型中进行搜索:doc、docx、xls、xlsx、ppt和pptx。搜索算法已经就位,我们已经使用办公自动化实现了索引器;然而,客户担心的是,这是1,容易出错,和2,微软不推荐(也不包括在他们的许可证中)

我已经阅读了前面关于这方面的答案,但是这需要我们集成大量不同的库来覆盖所有的边缘,我们没有资源这样做

因此,我们正在寻找一个简单的web服务,我们可以向它提交这些文档中的任何一个,并返回一个简单的纯文本(或html,甚至PDF-我们都有解析器)输出

是否有任何此类服务(免费或付费)涵盖上述所有文件格式


非常感谢。

如果您能够管理和部署用于DOC/DOCX、XLS/XLSX和PPT/PPTX的三个.NET程序集,那么我可以肯定这项服务。然后您可以分别尝试--Aspose.Words、Aspose.Cells和Aspose.Slides。这些DLL不需要在服务器上安装MS Office,它们在任何Windows操作系统和32位/64位环境中都可以正常工作。您还可以看到。这些组件还提供了许多处理文档元素的高级功能。请查看这是否有助于您的场景


披露:我在Aspose担任开发人员宣传员

不过,如果您能够管理和部署DOC/DOCX、XLS/XLSX和PPT/PPTX的三个.NET程序集,我可以肯定这项服务。然后您可以分别尝试--Aspose.Words、Aspose.Cells和Aspose.Slides。这些DLL不需要在服务器上安装MS Office,它们在任何Windows操作系统和32位/64位环境中都可以正常工作。您还可以看到。这些组件还提供了许多处理文档元素的高级功能。请查看这是否有助于您的场景


披露:我在Aspose担任开发人员宣传员

我建议试试——它是免费的,开源的。它允许从MS Office文件格式(以及其他流行格式)提取文本内容。其中包含一个服务器应用程序,您可以在自己的服务器上运行。

我建议您试试——它是免费的、开源的。它允许从MS Office文件格式(以及其他流行格式)提取文本内容。包含一个服务器应用程序,您可以在自己的服务器上运行。

您的价格范围与它可能为我们的项目带来的好处不相称。如果您有任何我们可以用于只读访问的功能,我们可能会重新考虑。我不需要更新或创建这些文档中的任何一个—仅仅是为了将它们转换为纯文本文件—因此,一个最小化的功能子集:打开文档,另存为文本文件将涵盖我的全部使用案例。你有这样的存货吗?恐怕目前没有。你的价格范围与它可能给我们的项目带来的好处不相称。如果您有任何我们可以用于只读访问的功能,我们可能会重新考虑。我不需要更新或创建这些文档中的任何一个—仅仅是为了将它们转换为纯文本文件—因此,一个最小化的功能子集:打开文档,另存为文本文件将涵盖我的全部使用案例。你们有这样的存货吗?恐怕目前没有。