如何在C#中将PDF转换为Excel?

如何在C#中将PDF转换为Excel?,c#,excel,pdf,C#,Excel,Pdf,我想读取PDF文档中的表格,并将这些值存储在数据库中 到目前为止,我通过搜索web找到了: 使用免费软件abcpdf.net阅读PDF中的文本。但这不是正确的解决方案,因为我想阅读表格 将PDF文档转换为Excel/Word。表将按原样出现在目标文档中。可以使用EasyPDF Converter进行文字转换,这是一种第三方工具,比其他将PDF转换为Excel的工具中提供的其他解决方案便宜得多 但我正在寻找任何其他可以将PDF转换为Excel的解决方案/API类。有两种可能的解决方案 a) 从PD

我想读取PDF文档中的表格,并将这些值存储在数据库中

到目前为止,我通过搜索web找到了:

  • 使用免费软件abcpdf.net阅读PDF中的文本。但这不是正确的解决方案,因为我想阅读表格

  • 将PDF文档转换为Excel/Word。表将按原样出现在目标文档中。可以使用EasyPDF Converter进行文字转换,这是一种第三方工具,比其他将PDF转换为Excel的工具中提供的其他解决方案便宜得多


  • 但我正在寻找任何其他可以将PDF转换为Excel的解决方案/API类。

    有两种可能的解决方案

    a) 从PDF到XLS的免费在线转换非常好,并将结果文件发送给您的电子邮件。

    b) 是一个将PDF转换为XLS的共享软件。有OCR和文本版本。我没有亲自使用,但他们有很好的建议。

    您可以尝试使用Quablo,这是一个PDF表格提取器,可在此(链接已更新/更正)。

    如果您希望将数据上载到数据库,将PDF转换为CSV可能是最安全的选择。PDFTables API将允许您使用C#执行此操作,同时根据需要转换任意多个PDF

    @hatem-哪种技术/语言?C#?很久以前,我习惯用普通的纯文本打印机打印数据,以便从不方便的地方获取数据。你能用你试图提取的表格发布PDF的样本吗?使用OCR或其他技术可能有办法做到这一点。这是一个阿拉伯文pdf,包含多个表(3个表),我尝试过abcpdf.net、itextsharp和pdfbox,但它们中没有一个帮助我做了我想做的事情,因为pdf是阿拉伯文的,是rtl语言,转换后的文本无法阅读,,所有数字数据都是以正常方式从lte中写入的,例如,这是一个阿拉伯文pdf,包含多个表(3个表),我尝试了abcpdf.net、itextsharp和pdfbox,但它们都没有帮助我做我想做的事情,因为pdf是阿拉伯文的,是rtl语言,转换后的文本无法读取,,所有数字数据都是以正常方式从lte中写入的,例如200,英文的意思是工资是200,但在使用这些DLL后,阿拉伯单词是,这意味着什么都没有,在阿拉伯文中是不可读的。答案应该是编程的,或者代码链接中的帮助应该是不可用的。