如何仅使用Python解压PDF？_Python_Pdf

如何仅使用Python解压PDF？

python pdf

如何仅使用Python解压PDF？,python,pdf,Python,Pdf,我目前想处理PDF中的字符串。由于普通Python库似乎不支持这一点，我使用pdftk解压了PDF，并直接使用Python编辑了该文件有没有可能直接用Python解压PDF文件？在git hub中有一个新的压缩/解压请求。但这不是发布的一部分您可能希望复制-->将的内容粘贴到本地库的pypdftk.py文件中。然后尝试使用以下函数 import pypdftk def test_compress(): input_file = "/Out/test1.unc.pdf" py

我目前想处理PDF中的字符串。由于普通Python库似乎不支持这一点，我使用

pdftk

解压了PDF，并直接使用Python编辑了该文件

有没有可能直接用Python解压PDF文件？

在git hub中有一个新的压缩/解压请求。但这不是发布的一部分

您可能希望复制-->将的内容粘贴到本地库的

pypdftk.py

文件中。然后尝试使用以下函数

import pypdftk

def test_compress():
    input_file = "/Out/test1.unc.pdf"
    pypdftk.compress(input_file, "./Out/test1.c.pdf")

def test_uncompress():
    input_file = "./Out/test1.pdf"
    pypdftk.uncompress(input_file, "./Out/test1.unc.pdf")

def main():
    test_num_pages()
    test_uncompress()
    test_compress()

if __name__ == '__main__':
    main()

只是试了一下。不确定您是否正在寻找相同类型的解决方案。：）希望这能对您有所帮助。

在

pdftk

中，取消压缩选项是什么。我快速查看了

pdftk

没有找到任何与压缩/取消压缩相关的内容。我可以发现它只是分裂，合并，旋转，水印，印章。。。等等。命令是

pdftk doc.pdf output doc.unc.pdf uncompress

。描述为“在文本编辑器（如vim、emacs）中编辑PDF的解压PDF页面流”是指，在编辑文件之前，输入的PDF文件是

tar.gz

或

.zip

文件的一部分？请分享信息。嘿！你试过使用lib吗？@Haranadh没有。我有一个PDF文件。但是许多（大多数？全部？）PDF的内容是压缩的。这使用了

pdftk

。它几乎和我目前正在做的一样（但更糟糕的是，因为它是第三方模块）。是的。完全一样。但是你可以在你的帖子中提到你不想要pdftk解决方案，我在标题中说了“仅Python”。