Python 3.x 流模式还是晶格模式,在tabla py模块中,哪种模式设置为默认模式?

Python 3.x 流模式还是晶格模式,在tabla py模块中,哪种模式设置为默认模式?,python-3.x,tabula-py,Python 3.x,Tabula Py,我想知道熟悉Python的tabla-py模块的人是否能帮我解决这个问题。如果没有lattice或stream参数传递给函数,则在任何tabla py文档中都不清楚tabla.read_pdf()函数是否使用lattice或stream模式提取作为其默认设置。代码是否根据pdf文本中遇到的“表格”猜测两种模式中的哪一种更可取?如果不是,请澄清两种提取模式中的哪一种被用作默认模式(因此,这两个参数中的一个是多余的,因为事实上,如果您将lattice设置为False,那么根据定义,您必须将strea

我想知道熟悉Python的tabla-py模块的人是否能帮我解决这个问题。如果没有latticestream参数传递给函数,则在任何tabla py文档中都不清楚
tabla.read_pdf()
函数是否使用latticestream模式提取作为其默认设置。代码是否根据pdf文本中遇到的“表格”猜测两种模式中的哪一种更可取?如果不是,请澄清两种提取模式中的哪一种被用作默认模式(因此,这两个参数中的一个是多余的,因为事实上,如果您将lattice设置为
False
,那么根据定义,您必须将stream设置为
True
,反之亦然)?提前感谢


设置
tabla.read\u pdf()很容易
模式转换为lattice或stream模式提取,所以这不是我的问题。如果我没有指定要使用哪种提取模式,我只想知道这两种模式中的哪一种将用作默认提取模式。

如果我理解正确,Table java使用Decise方法,逐页动态应用电子表格和lattice。


请注意,在Table java 1.0.2之前,默认情况下,使用guess选项将强制使用lattice模式。Table py 1.4.0使用Table java 1.0.3,因此您可以分别使用guess和stream/lattice。

对不起,请在此问题中添加另一部分,lattice和stream是否可以同时设置为True?换句话说,下面的表达式关于是否有效:tabla.read\u pdf('test.pdf',stream=True,lattice=True)?如果是,tabla代码如何“选择”在遇到pdf中识别为“表”的文本时应使用的两种提取模式中的哪一种?我提出这个问题的一个原因是,我还使用了较新的camelot模块,该模块至少在纸面上具有与Table py类似的功能,但声称能够从pdf文件中提供出色的表格数据提取。然而,对于camelot,需要进行更多的修补以获得最佳结果;例如,该模块也使用类似的lattice和stream extraction模式,其camelot.read_pdf()函数默认设置为lattice,因此为了在输出质量和易用性方面对两者进行适当的比较,我需要知道tabla py的默认提取模式是什么。