从Python中的PDF中提取文本及其字体详细信息（样式、大小、颜色、斜体等）_Python_Pdf_Fonts_Font Size_Text Extraction

从Python中的PDF中提取文本及其字体详细信息（样式、大小、颜色、斜体等）

python pdf fonts

从Python中的PDF中提取文本及其字体详细信息（样式、大小、颜色、斜体等）,python,pdf,fonts,font-size,text-extraction,Python,Pdf,Fonts,Font Size,Text Extraction,我希望从Python中的PDF中提取包含字体细节（样式、大小、颜色、斜体等）的文本我需要提取文本及其元数据以进行翻译。有人可以建议使用任何库进行翻译。有一个python库用于此目的。请看一下PDFMiner pdftext.py提供从pdf中提取的文本，还提供字体和字体大小等其他信息你可以试试注意：不支持Python 3可以共享任何特定链接。我无法找出相应的api选项。PDFMiner.six下支持Python3。目前PDFMiner不允许提取有关字体颜色的信息。不使用库是否可以这样做？

我希望从Python中的PDF中提取包含字体细节（样式、大小、颜色、斜体等）的文本

我需要提取文本及其元数据以进行翻译。有人可以建议使用任何库进行翻译。

有一个python库用于此目的。请看一下PDFMiner

pdftext.py提供从pdf中提取的文本，还提供字体和字体大小等其他信息

你可以试试

注意：不支持Python 3

可以共享任何特定链接。我无法找出相应的api选项。

PDFMiner.six下支持Python3
。目前PDFMiner不允许提取有关字体颜色的信息。不使用库是否可以这样做？