Warning: file_get_contents(/data/phpspider/zhask/data//catemap/2/python/360.json): failed to open stream: No such file or directory in /data/phpspider/zhask/libs/function.php on line 167

Warning: Invalid argument supplied for foreach() in /data/phpspider/zhask/libs/tag.function.php on line 1116

Notice: Undefined index: in /data/phpspider/zhask/libs/function.php on line 180

Warning: array_chunk() expects parameter 1 to be array, null given in /data/phpspider/zhask/libs/function.php on line 181
从Python中的PDF中提取文本及其字体详细信息(样式、大小、颜色、斜体等)_Python_Pdf_Fonts_Font Size_Text Extraction - Fatal编程技术网

从Python中的PDF中提取文本及其字体详细信息(样式、大小、颜色、斜体等)

从Python中的PDF中提取文本及其字体详细信息(样式、大小、颜色、斜体等),python,pdf,fonts,font-size,text-extraction,Python,Pdf,Fonts,Font Size,Text Extraction,我希望从Python中的PDF中提取包含字体细节(样式、大小、颜色、斜体等)的文本 我需要提取文本及其元数据以进行翻译。有人可以建议使用任何库进行翻译。有一个python库用于此目的。请看一下PDFMiner pdftext.py提供从pdf中提取的文本,还提供字体和字体大小等其他信息 你可以试试 注意:不支持Python 3可以共享任何特定链接。我无法找出相应的api选项。PDFMiner.six下支持Python3。目前PDFMiner不允许提取有关字体颜色的信息。不使用库是否可以这样做?

我希望从Python中的PDF中提取包含字体细节(样式、大小、颜色、斜体等)的文本


我需要提取文本及其元数据以进行翻译。有人可以建议使用任何库进行翻译。

有一个python库用于此目的。请看一下PDFMiner

pdftext.py提供从pdf中提取的文本,还提供字体和字体大小等其他信息

你可以试试


注意:不支持Python 3

可以共享任何特定链接。我无法找出相应的api选项。
PDFMiner.six下支持
Python3
。目前PDFMiner不允许提取有关字体颜色的信息。不使用库是否可以这样做?