使用iTextSharp从PDF中提取盲文文本（图像）_Pdf_Itextsharp_Extract_Itext_Braille

使用iTextSharp从PDF中提取盲文文本（图像）

pdf itext

使用iTextSharp从PDF中提取盲文文本（图像）,pdf,itextsharp,extract,itext,braille,Pdf,Itextsharp,Extract,Itext,Braille,盲文是盲人的一种特殊字体。我正在尝试解码PDF文件中以盲文字体书写的文本，并输出正常文本。但是 iTextSharp中的PDFTextractor无法处理此字体。还有其他可能吗我想知道如何从pdf文件中解码我试着用 PdfReader pdf = new PdfReader("C:\\pdfs\\file.pdf"); string text = PdfTextExtractor.GetTextFromPage(pdf, 1); this.brailleTextBox.Text = tex

盲文是盲人的一种特殊字体。我正在尝试解码PDF文件中以盲文字体书写的文本，并输出正常文本。但是 iTextSharp中的PDFTextractor无法处理此字体。还有其他可能吗

我想知道如何从pdf文件中解码

我试着用

PdfReader pdf = new PdfReader("C:\\pdfs\\file.pdf");
string text = PdfTextExtractor.GetTextFromPage(pdf, 1);

this.brailleTextBox.Text = text.ToString();
this.normalTextBox.Text = text.ToString();

在pdf文件中，文本为常规字体，例如Arial和盲文字体，但它不会返回盲文文本，而是只返回页面上的正常文本

如何使用iTextSharp获得盲文字体文本。

还没有答案

好吧，也许我理解不对。我刚刚尝试在您提供的PDF上使用PDFTextractor，它工作正常。具体而言，第1页的以下文本被删除：

B   r    a   i     l    l    e   C   o   d    e   s 
B r a i l l e C o d e s 

Embossed dot positions as,   


A  B   C   D   E   F   G  H   I    J   K  
A B C D E F G H I J K 
L    M  N  O   P  Q   R  S   T   U   V  
L M N O P Q R S T U V 
W  X   Y   Z 
W X Y Z 


1   2   3    4   5   6    7   8   9   0 
1 2 3 4 5 6 7 8 9 0

如果我误解了您的意思，我很抱歉，但是您是否正在尝试以布莱叶盲文的形式获取文本？

您可以发布一个示例文件供我们查看吗？另外，您可以在Adobe Acrobat中选择文本吗？如果你复制它，它会显示为文本吗？我找到了免费的盲文字体，它被正确地选择了。但是这些字体对于不同的母语来说是不同的，这让我有2次的麻烦。现在，盲文字符必须通过图像处理解密。盲文pdf示例这些“{'，“[”的盲文字符相同，同样适用于“]'，“}'，“，]”的盲文字符。因此，如果我或你安装的字体不是所有可能的表达方式中最好的字体，那么就不可能完美地翻译它。我真的很抱歉，但我仍然不确定你现在的实际问题是什么。文本是文本-始终。字体接收文本并以草书、盲文、符号等称为字形的特定方式显示。据我所知，标准的盲文系统本身并没有区分花括号和方括号，并为它们绘制了相同的字形。在这些标志符号后面，真实文本仍然存在。如果有人将字形转换为静态图像，则文本将丢失，否则它将始终存在。