使用iTextSharp从PDF中提取盲文文本(图像)
盲文是盲人的一种特殊字体。我正在尝试解码PDF文件中以盲文字体书写的文本,并输出正常文本。但是 iTextSharp中的PDFTextractor无法处理此字体。还有其他可能吗 我想知道如何从pdf文件中解码 我试着用使用iTextSharp从PDF中提取盲文文本(图像),pdf,itextsharp,extract,itext,braille,Pdf,Itextsharp,Extract,Itext,Braille,盲文是盲人的一种特殊字体。我正在尝试解码PDF文件中以盲文字体书写的文本,并输出正常文本。但是 iTextSharp中的PDFTextractor无法处理此字体。还有其他可能吗 我想知道如何从pdf文件中解码 我试着用 PdfReader pdf = new PdfReader("C:\\pdfs\\file.pdf"); string text = PdfTextExtractor.GetTextFromPage(pdf, 1); this.brailleTextBox.Text = tex
PdfReader pdf = new PdfReader("C:\\pdfs\\file.pdf");
string text = PdfTextExtractor.GetTextFromPage(pdf, 1);
this.brailleTextBox.Text = text.ToString();
this.normalTextBox.Text = text.ToString();
在pdf文件中,文本为常规字体,例如Arial和盲文字体,但它不会返回盲文文本,而是只返回页面上的正常文本
如何使用iTextSharp获得盲文字体文本。还没有答案
好吧,也许我理解不对。我刚刚尝试在您提供的PDF上使用PDFTextractor,它工作正常。具体而言,第1页的以下文本被删除:
B r a i l l e C o d e s
B r a i l l e C o d e s
Embossed dot positions as,
A B C D E F G H I J K
A B C D E F G H I J K
L M N O P Q R S T U V
L M N O P Q R S T U V
W X Y Z
W X Y Z
1 2 3 4 5 6 7 8 9 0
1 2 3 4 5 6 7 8 9 0
如果我误解了您的意思,我很抱歉,但是您是否正在尝试以布莱叶盲文的形式获取文本?您可以发布一个示例文件供我们查看吗?另外,您可以在Adobe Acrobat中选择文本吗?如果你复制它,它会显示为文本吗?我找到了免费的盲文字体,它被正确地选择了。但是这些字体对于不同的母语来说是不同的,这让我有2次的麻烦。现在,盲文字符必须通过图像处理解密。盲文pdf示例这些“{',“[”的盲文字符相同,同样适用于“]',“}',“,]”的盲文字符。因此,如果我或你安装的字体不是所有可能的表达方式中最好的字体,那么就不可能完美地翻译它。我真的很抱歉,但我仍然不确定你现在的实际问题是什么。文本是文本-始终。字体接收文本并以草书、盲文、符号等称为字形的特定方式显示。据我所知,标准的盲文系统本身并没有区分花括号和方括号,并为它们绘制了相同的字形。在这些标志符号后面,真实文本仍然存在。如果有人将字形转换为静态图像,则文本将丢失,否则它将始终存在。