Python 2.7 在AmazonS3上使用PDFLib/TET和boto解析pdf 从AmazonS3读取pdf文件(使用boto) 本地保存为123.pdf 使用PDFLib/TET打开并解析本地保存的pdf
我目前能够执行上述所有3个步骤,但 我想跳过步骤2来保存磁盘I/O 看起来可以使用tet_open_document_mem使tet打开内存中的文档,但是Python 2.7 在AmazonS3上使用PDFLib/TET和boto解析pdf 从AmazonS3读取pdf文件(使用boto) 本地保存为123.pdf 使用PDFLib/TET打开并解析本地保存的pdf,python-2.7,pdf,amazon-s3,pdflib,Python 2.7,Pdf,Amazon S3,Pdflib,我目前能够执行上述所有3个步骤,但 我想跳过步骤2来保存磁盘I/O 看起来可以使用tet_open_document_mem使tet打开内存中的文档,但是 没有关于如何使用虚拟文件系统的文档。TET提供了所谓的PDFlib虚拟文件系统(PVF)来处理这种情况 您可以使用create_pvf()从内存中提供的数据创建命名的虚拟只读文件 API如下所示(C): 所以可以这样使用: TET_create_pvf(tet, pvfname, 0, data, length, ""); doc = TET
没有关于如何使用虚拟文件系统的文档。TET提供了所谓的PDFlib虚拟文件系统(PVF)来处理这种情况 您可以使用create_pvf()从内存中提供的数据创建命名的虚拟只读文件 API如下所示(C): 所以可以这样使用:
TET_create_pvf(tet, pvfname, 0, data, length, "");
doc = TET_open_document(tet, pvfname, 0, docoptlist);
更多详细信息可在TET手册中找到
TET_open_document_mem是一个不再受支持的旧API
TET_create_pvf(tet, pvfname, 0, data, length, "");
doc = TET_open_document(tet, pvfname, 0, docoptlist);