Warning: file_get_contents(/data/phpspider/zhask/data//catemap/2/csharp/304.json): failed to open stream: No such file or directory in /data/phpspider/zhask/libs/function.php on line 167

Warning: Invalid argument supplied for foreach() in /data/phpspider/zhask/libs/tag.function.php on line 1116

Notice: Undefined index: in /data/phpspider/zhask/libs/function.php on line 180

Warning: array_chunk() expects parameter 1 to be array, null given in /data/phpspider/zhask/libs/function.php on line 181
C# 导入并读取PDF的一部分_C#_Pdf - Fatal编程技术网

C# 导入并读取PDF的一部分

C# 导入并读取PDF的一部分,c#,pdf,C#,Pdf,因此,我一直在寻找一种最新的解决方案,了解如何读取/导入C#格式的PDF,以便从中提取一些数据并以另一种格式存储 我还没有找到任何最近或能够做到这一点的答案/资源 简而言之,我会有一个PDF,里面有很多无用的文本,但其中的一些部分会像表格一样显示(类似EXCEL),在这些表格中,我需要获取1个单元格的数据,以便创建这些值的列表/字典 遗憾的是,我不能发布数据,因为它是保密的 如果您正在寻找一种资源来从C#中的PDF文档中读取数据,那么任何一个好的库都会以类似于C#的XML文档的方式工作。,我会使

因此,我一直在寻找一种最新的解决方案,了解如何读取/导入C#格式的PDF,以便从中提取一些数据并以另一种格式存储

我还没有找到任何最近或能够做到这一点的答案/资源

简而言之,我会有一个PDF,里面有很多无用的文本,但其中的一些部分会像表格一样显示(类似EXCEL),在这些表格中,我需要获取1个单元格的数据,以便创建这些值的列表/字典

遗憾的是,我不能发布数据,因为它是保密的


如果您正在寻找一种资源来从C#中的PDF文档中读取数据,那么任何一个好的库都会以类似于C#的XML文档的方式工作。

,我会使用它

这就是说,尽管PDF中的数据看起来像“excel”,但根据我的经验,数据和“表”结构存储在PDF文档中两个不同的、基本上不相连的部分。因此,我不希望您能够找到一个现成的解决方案,只提取“表格”数据

在这种情况下,您必须解析出所有文本并以其他方式进行处理,或者尝试匹配由所有单独线段创建的框,然后仅提取这些边界内的文本

需要获取1个单元格的数据-如何识别该单元格?你知道精确的坐标吗?大概是第三行,第一列?在第一种情况下,任何像样的库都可以,在后一种情况下,它在很大程度上取决于所讨论的PDF。