使用itextsharp转换时不显示PDF文本
我已使用以下代码成功地使用iTextSharp将PDF转换为文本:使用itextsharp转换时不显示PDF文本,pdf,itextsharp,Pdf,Itextsharp,我已使用以下代码成功地使用iTextSharp将PDF转换为文本: var reader = new PdfReader(filePath); for (int page = 1; page <= reader.NumberOfPages; page++) { ITextExtractionStrategy its = new iTextSharp.text.pdf.parser.LocationTextExtractio
var reader = new PdfReader(filePath);
for (int page = 1; page <= reader.NumberOfPages; page++)
{
ITextExtractionStrategy its = new
iTextSharp.text.pdf.parser.LocationTextExtractionStrategy();
String s = PdfTextExtractor.GetTextFromPage(reader, page, its);
s =Encoding.UTF8.GetString(Encoding.Convert(Encoding.Default, Encoding.UTF8, Encoding.Default.GetBytes(s)));
strText = strText + s + Environment.NewLine;
pdfTextBox.Text = strText;
}
reader.Close();
var reader=newpdfreader(filePath);
对于(int page=1;page),此类PDF的示例可能有助于确定问题所在。Encoding.UTF8.GetString(Encoding.Convert(Encoding.Default,Encoding.UTF8,Encoding.Default.GetBytes-您使用此选项的目的是什么?@mkl的问题对于处理ASCII 127以上的任何内容非常重要。请查看此处的答案以解决此问题。