C# 如何读取表格格式的PDF文件数据?
我有一个包含表格数据的PDF文件。我必须读取表格格式的PDF文件,并将结果插入数据库表中 读取字符串格式PDF文件的代码:C# 如何读取表格格式的PDF文件数据?,c#,asp.net-mvc,itext,C#,Asp.net Mvc,Itext,我有一个包含表格数据的PDF文件。我必须读取表格格式的PDF文件,并将结果插入数据库表中 读取字符串格式PDF文件的代码: string strText = string.Empty; try { PdfReader reader = new PdfReader((string)Filename); for (int page = 1; page <= reader.NumberOfPages; page++) { ITextExtractionS
string strText = string.Empty;
try
{
PdfReader reader = new PdfReader((string)Filename);
for (int page = 1; page <= reader.NumberOfPages; page++)
{
ITextExtractionStrategy its = new iTextSharp.text.pdf.parser.SimpleTextExtractionStrategy();
String s = PdfTextExtractor.GetTextFromPage(reader, page, its);
s = Encoding.UTF8.GetString(ASCIIEncoding.Convert(Encoding.Default, Encoding.UTF8, Encoding.Default.GetBytes(s)));
strText = strText + s;
}
reader.Close();
string strText=string.Empty;
尝试
{
PdfReader reader=新的PdfReader((字符串)文件名);
对于(int page=1;page您正在使用ITextSharp。据我所知,ITextSharp不支持该操作。有关详细信息,请查看此链接
嗨,朋友,还有其他方法可以将pdf文件转换成表格格式吗?pdf是带标签的pdf还是普通的pdf?如果是带标签的pdf,使用iText的TaggedPdfReaderTool
:如果你的pdf没有带标签,你就不知道你在问什么。我不知道他在问什么;短语“包含表格数据”有太多可能的含义。请详细说明并提供示例。