Pandas 使用跳过合并单元格读取Excel
我正在尝试使用pandas库读取xlsx文件。我想跳过第11行,然后开始阅读,我尝试了pandas的skiprows选项,但似乎不起作用,并返回错误Pandas 使用跳过合并单元格读取Excel,pandas,Pandas,我正在尝试使用pandas库读取xlsx文件。我想跳过第11行,然后开始阅读,我尝试了pandas的skiprows选项,但似乎不起作用,并返回错误xlrd.biffh.XLRDError:ZIP文件内容不是已知类型的工作簿 我搞不懂这里写的是什么。这是我尝试的代码。从B1:E1、B2:E2等到B10:E10的行是合并行 read_conversion_raw_file = pd.read_excel("test.xlsx", skiprows=10) 我尝试使用test.xlsx和test
xlrd.biffh.XLRDError:ZIP文件内容不是已知类型的工作簿
我搞不懂这里写的是什么。这是我尝试的代码。从B1:E1、B2:E2等到B10:E10的行是合并行
read_conversion_raw_file = pd.read_excel("test.xlsx", skiprows=10)
我尝试使用
test.xlsx
和test.csv
读取此文件,但在这两种情况下都会出现错误。
因此,一种可能的解决方案是将这个test.xlsx
转换成一个文本文件test.txt
,然后像这样跳过前10行来读取它
df = pd.read_csv('test.txt', sep=",", skiprows = range(10))
输出:
Campaign Site (DCM) Placement Date Activity Advertiser Advertiser ID Total Conversions
0 002|2018|Q1|Accounting|Accounting|LON|UK_ACGRC_ affectv.co.uk PKMG3Y_Sage|Payroll|Sage One |UK|Display|Looka... 2018-11-28 Non-Conversion FL Sage|UK 8205616 1
1 002|2018|Q2|Accounting|LON|UK_ACGRC_ facebook UK SAGE|Accounting|Sage_One|UK|Social|Intrests|Fa... 2018-11-28 Accounting|FY17|Q4|LP|brochure Sage|UK 8205616 2
2 002|2018|Q2|Accounting|LON|UK_ACGRC_ facebook UK SAGE|Accounting|Sage_One|UK|Social|Intrests|Fa... 2018-11-28 HR&Payroll|FY18|Q4|LP|BOFURetargeting Sage|UK 8205616 1
3 002|2018|Q2|Accounting|LON|UK_ACGRC_ facebook UK Sage|Accounting|SageOne|UK|Social|WebsiteRTG|F... 2018-11-12 Non-Conversion FL Sage|UK 8205616 2
4 002|2018|Q2|CoreFinancials|LON|UK_CRFG_ facebook UK SAGE|Core Financials|Sage Live|UK|Social|Looka... 2018-11-14 Non-Conversion FL Sage|UK 8205616 2
输出格式由于空间原因有点混乱,但希望它能满足您的问题要求。@meW仍然会遇到同样的错误。
skiprows=range(10)
应该work@meW我在问这个问题之前做了研究,这适用于列中相关的错误,但我的担心与此无关,该错误与您所指的堆栈问题中的错误相同。您是否可以将文件上载到共享路径(例如google drive)上,我可以从该路径对其进行测试。这是文件。它不起作用,因为我说的是B:E的单元格从第1行合并到第10行。你可以上传你的数据集文件,这样我就可以查看了。这是你的电话号码file@MonikaRai我已经更新了回复。请看一下。谢谢你的耐心。我相信这不是我一直在寻找的解决办法。