C# 将数据从PDF导入SQL Server

C# 将数据从PDF导入SQL Server,c#,sql-server,pdf,C#,Sql Server,Pdf,我有一个PDF,其中有以下格式的行: Category : Demo Name : abc Occupation :xyz Address : abc ,xyz Category : Demo Name : 123 Occupation :456 Address : abcd 这些数据以两列格式重复 有没有办法将PDF数据导入SQL Server 我已将PDF转换为Excel,但它没有提供正确的列结构 如何将数据从PDF导入SQL Server?或者在C#Net中如何实现这一点

我有一个PDF,其中有以下格式的行:

Category : Demo

Name : abc

Occupation :xyz

Address : abc ,xyz

Category : Demo

Name : 123

Occupation :456

Address : abcd 
这些数据以两列格式重复

有没有办法将PDF数据导入SQL Server

我已将PDF转换为Excel,但它没有提供正确的列结构


如何将数据从PDF导入SQL Server?或者在C#Net中如何实现这一点?

没有合适的方法来实现这一点。您必须为pdf文件及其布局/格式开发自己的解决方案。有几个API可以读取PDF内容,但我建议您使用,因为它可以从PDF中提取表布局。如果提取的表不符合您的需要,您可以在使用基于坐标的提取时自己进行提取。

最好的方法是将pdf文件导出到excel,然后使用许多不同的应用程序将excel文件导入sql。
因为我使用的是mac RAZOR SQL,所以它是一个很好的应用程序。

您尝试了什么?有很多在线资源解释可以通过pdf读取然后存储在数据库中的数据。这里有两个不同的任务a)从pdf读取数据b)将数据写入SQL Server。分别搜索每个文档。您可以检查此PDF是一种优化的格式,用于可复制地显示文档内容,而不是从该文档中提取信息。PDF也提供了使信息提取更容易的机制,但这些机制的使用是可选的。因此,geenral中可靠的信息提取只能使用手头PDF类型的自定义程序。如果有的话,就是这样。