从Python中的PDF中提取文本及其字体详细信息(样式、大小、颜色、斜体等)
我希望从Python中的PDF中提取包含字体细节(样式、大小、颜色、斜体等)的文本从Python中的PDF中提取文本及其字体详细信息(样式、大小、颜色、斜体等),python,pdf,fonts,font-size,text-extraction,Python,Pdf,Fonts,Font Size,Text Extraction,我希望从Python中的PDF中提取包含字体细节(样式、大小、颜色、斜体等)的文本 我需要提取文本及其元数据以进行翻译。有人可以建议使用任何库进行翻译。有一个python库用于此目的。请看一下PDFMiner pdftext.py提供从pdf中提取的文本,还提供字体和字体大小等其他信息 你可以试试 注意:不支持Python 3可以共享任何特定链接。我无法找出相应的api选项。PDFMiner.six下支持Python3。目前PDFMiner不允许提取有关字体颜色的信息。不使用库是否可以这样做?
我需要提取文本及其元数据以进行翻译。有人可以建议使用任何库进行翻译。有一个python库用于此目的。请看一下PDFMiner pdftext.py提供从pdf中提取的文本,还提供字体和字体大小等其他信息 你可以试试
注意:不支持Python 3可以共享任何特定链接。我无法找出相应的api选项。
PDFMiner.six下支持Python3
。目前PDFMiner不允许提取有关字体颜色的信息。不使用库是否可以这样做?