Python 3.x 如何使用camelot从PDF文件中提取表后获得列名?I';我是新来的
简单地说,我就是这样做的Python 3.x 如何使用camelot从PDF文件中提取表后获得列名?I';我是新来的,python-3.x,python-camelot,Python 3.x,Python Camelot,简单地说,我就是这样做的 tables = camelot.read_pdf(doc_file) tables[0].df 我正在使用表[0].df.columns从提取的表中获取列名 但是它没有给出列名。Camelot提取的表没有字母列名 表[0]。df.columns返回,例如,对于三列表: RangeIndex(start=0, stop=3, step=1) 相反,您可以尝试读取第一行并从中获取列表:tables[0].df.iloc[0].tolist()。 输出可以是: ['co
tables = camelot.read_pdf(doc_file)
tables[0].df
我正在使用表[0].df.columns
从提取的表中获取列名
但是它没有给出列名。Camelot提取的表没有字母列名
表[0]。df.columns
返回,例如,对于三列表:
RangeIndex(start=0, stop=3, step=1)
相反,您可以尝试读取第一行并从中获取列表:tables[0].df.iloc[0].tolist()
。
输出可以是:
['column1', 'column2', 'column3']
基本上,从我收集的数据中,camelot从pdf中提取数据并创建一个数据框。因此,tables是一个数据框架,您可以使用
tables.columns
来获取这些名称的列表,您可以使用tables.columns.to_list()
或``list(tables.columns)``您能简单地解释一下iloc[0]会发生什么情况吗?我怎样才能把包含所有记录的一个完整列放入一个列表中呢?谢谢。正如您在Pandas docs()中所看到的,使用iloc[0]
可以获得第一行,这是一个系列。使用tolist()
方法(请参阅),可以将序列转换为列表。如果我的回答对你有用,请接受。