使用iTextSharp从PDF中提取盲文文本(图像)

使用iTextSharp从PDF中提取盲文文本(图像),pdf,itextsharp,extract,itext,braille,Pdf,Itextsharp,Extract,Itext,Braille,盲文是盲人的一种特殊字体。我正在尝试解码PDF文件中以盲文字体书写的文本,并输出正常文本。但是 iTextSharp中的PDFTextractor无法处理此字体。还有其他可能吗 我想知道如何从pdf文件中解码 我试着用 PdfReader pdf = new PdfReader("C:\\pdfs\\file.pdf"); string text = PdfTextExtractor.GetTextFromPage(pdf, 1); this.brailleTextBox.Text = tex

盲文是盲人的一种特殊字体。我正在尝试解码PDF文件中以盲文字体书写的文本,并输出正常文本。但是 iTextSharp中的PDFTextractor无法处理此字体。还有其他可能吗

我想知道如何从pdf文件中解码

我试着用

PdfReader pdf = new PdfReader("C:\\pdfs\\file.pdf");
string text = PdfTextExtractor.GetTextFromPage(pdf, 1);

this.brailleTextBox.Text = text.ToString();
this.normalTextBox.Text = text.ToString();
在pdf文件中,文本为常规字体,例如Arial和盲文字体,但它不会返回盲文文本,而是只返回页面上的正常文本

如何使用iTextSharp获得盲文字体文本。

还没有答案

好吧,也许我理解不对。我刚刚尝试在您提供的PDF上使用PDFTextractor,它工作正常。具体而言,第1页的以下文本被删除:

B   r    a   i     l    l    e   C   o   d    e   s 
B r a i l l e C o d e s 

Embossed dot positions as,   


A  B   C   D   E   F   G  H   I    J   K  
A B C D E F G H I J K 
L    M  N  O   P  Q   R  S   T   U   V  
L M N O P Q R S T U V 
W  X   Y   Z 
W X Y Z 


1   2   3    4   5   6    7   8   9   0 
1 2 3 4 5 6 7 8 9 0

如果我误解了您的意思,我很抱歉,但是您是否正在尝试以布莱叶盲文的形式获取文本?

您可以发布一个示例文件供我们查看吗?另外,您可以在Adobe Acrobat中选择文本吗?如果你复制它,它会显示为文本吗?我找到了免费的盲文字体,它被正确地选择了。但是这些字体对于不同的母语来说是不同的,这让我有2次的麻烦。现在,盲文字符必须通过图像处理解密。盲文pdf示例这些“{',“[”的盲文字符相同,同样适用于“]',“}',“,]”的盲文字符。因此,如果我或你安装的字体不是所有可能的表达方式中最好的字体,那么就不可能完美地翻译它。我真的很抱歉,但我仍然不确定你现在的实际问题是什么。文本是文本-始终。字体接收文本并以草书、盲文、符号等称为字形的特定方式显示。据我所知,标准的盲文系统本身并没有区分花括号和方括号,并为它们绘制了相同的字形。在这些标志符号后面,真实文本仍然存在。如果有人将字形转换为静态图像,则文本将丢失,否则它将始终存在。