如何仅使用Python解压PDF?

如何仅使用Python解压PDF?,python,pdf,Python,Pdf,我目前想处理PDF中的字符串。由于普通Python库似乎不支持这一点,我使用pdftk解压了PDF,并直接使用Python编辑了该文件 有没有可能直接用Python解压PDF文件?在git hub中有一个新的压缩/解压请求。但这不是发布的一部分 您可能希望复制-->将的内容粘贴到本地库的pypdftk.py文件中。然后尝试使用以下函数 import pypdftk def test_compress(): input_file = "/Out/test1.unc.pdf" py

我目前想处理PDF中的字符串。由于普通Python库似乎不支持这一点,我使用
pdftk
解压了PDF,并直接使用Python编辑了该文件


有没有可能直接用Python解压PDF文件?

在git hub中有一个新的压缩/解压请求。但这不是发布的一部分

您可能希望复制-->将的内容粘贴到本地库的
pypdftk.py
文件中。然后尝试使用以下函数

import pypdftk

def test_compress():
    input_file = "/Out/test1.unc.pdf"
    pypdftk.compress(input_file, "./Out/test1.c.pdf")

def test_uncompress():
    input_file = "./Out/test1.pdf"
    pypdftk.uncompress(input_file, "./Out/test1.unc.pdf")

def main():
    test_num_pages()
    test_uncompress()
    test_compress()

if __name__ == '__main__':
    main()

只是试了一下。不确定您是否正在寻找相同类型的解决方案。:)希望这能对您有所帮助。

pdftk
中,取消压缩选项是什么。我快速查看了
pdftk
没有找到任何与压缩/取消压缩相关的内容。我可以发现它只是分裂,合并,旋转,水印,印章。。。等等。命令是
pdftk doc.pdf output doc.unc.pdf uncompress
。描述为“在文本编辑器(如vim、emacs)中编辑PDF的解压PDF页面流”是指,在编辑文件之前,输入的PDF文件是
tar.gz
.zip
文件的一部分?请分享信息。嘿!你试过使用lib吗?@Haranadh没有。我有一个PDF文件。但是许多(大多数?全部?)PDF的内容是压缩的。这使用了
pdftk
。它几乎和我目前正在做的一样(但更糟糕的是,因为它是第三方模块)。是的。完全一样。但是你可以在你的帖子中提到你不想要pdftk解决方案,我在标题中说了“仅Python”。