如何使用aws textract服务和.net从文档中导出CSV格式的表（PDF/Image）_.net_Amazon Web Services_Amazon Textract

如何使用aws textract服务和.net从文档中导出CSV格式的表（PDF/Image）

.net amazon-web-services

如何使用aws textract服务和.net从文档中导出CSV格式的表（PDF/Image）,.net,amazon-web-services,amazon-textract,.net,Amazon Web Services,Amazon Textract,我试图使用C#/.NET从AWS textract服务中使用DetectDocument（异步）从PDF文件中提取表和数据我在数据提取方面取得了成功，但无法理解如何使用AnalyzeDocument提取PDF格式的表并导出CSV文件阅读AWS文档，发现CSV提取使用Python而不是.NET。参考链接：- 尝试查看Python代码并复制.NET，但没有成功。我们可以使用这段代码，在由textract的GetDocumentTextAnalysis（）返回的块中循环关系，并获取链接到它的所有

我试图使用C#/.NET从AWS textract服务中使用DetectDocument（异步）从PDF文件中提取表和数据

我在数据提取方面取得了成功，但无法理解如何使用AnalyzeDocument提取PDF格式的表并导出CSV文件

阅读AWS文档，发现CSV提取使用Python而不是.NET。参考链接：-

尝试查看Python代码并复制.NET，但没有成功。

我们可以使用这段代码，在由textract的GetDocumentTextAnalysis（）返回的块中循环关系，并获取链接到它的所有子节点

var relationships = block.Relationships;
    if(relationships != null && relationships.Count > 0) {
        relationships.ForEach(r => {
            if(r.Type == "CHILD") {
                r.Ids.ForEach(id => {
                    var cell = new Cell(blocks.Find(b => b.Id == id), blocks);
                    if(cell.RowIndex > ri) {
                        this.Rows.Add(row);
                        row = new Row();
                        ri = cell.RowIndex;
                    }
                    row.Cells.Add(cell);
                });
                if(row != null && row.Cells.Count > 0)
                    this.Rows.Add(row);
            }
        });
    }

参考-请参考底部的链接了解代码：-

我们可以使用这段代码，在从textract返回的GetDocumentTextAnalysis（）返回的块中循环关系，并获取链接到它的所有子节点

var relationships = block.Relationships;
    if(relationships != null && relationships.Count > 0) {
        relationships.ForEach(r => {
            if(r.Type == "CHILD") {
                r.Ids.ForEach(id => {
                    var cell = new Cell(blocks.Find(b => b.Id == id), blocks);
                    if(cell.RowIndex > ri) {
                        this.Rows.Add(row);
                        row = new Row();
                        ri = cell.RowIndex;
                    }
                    row.Cells.Add(cell);
                });
                if(row != null && row.Cells.Count > 0)
                    this.Rows.Add(row);
            }
        });
    }

参考-请参考底部的链接了解代码：-

您可以在.net中找到textract集成代码的地方共享参考URL吗。我在谷歌上找不到。有什么解决办法吗？我正在尝试从python到节点做同样的事情。@Varinder-我阅读了文档并进行了集成，但您可以查看此链接，它会使您的工作变得更简单-@ChiKaLiO-我可以在这里获得python示例代码-@ChiKaLiO，您还可以参考Python和Java中的所有代码示例。您可以共享在.net中找到textract集成代码的参考URL吗。我在谷歌上找不到。有什么解决办法吗？我正在尝试从python到节点做同样的事情。@Varinder-我阅读了文档并进行了集成，但是您可以查看此链接，它会使您的工作变得更简单-@ChiKaLiO-我可以在这里获得python示例代码-@ChiKaLiO，您还可以参考python和Java中的所有代码示例。