Python 数据帧的句柄形状不匹配

Python 数据帧的句柄形状不匹配,python,web-scraping,Python,Web Scraping,我正试图用selenium的点击按钮刮取一个网站,所以我刮取了许多页面的表格: *几乎每个表格的表格模式都是相同的 假设我们有一个列表:这是我的表的标题,它包含5列,我把它作为一个静态类型 header = ["a", "b", "c", "d", "e"] 还有一个语料库作为列表,有5列,如: ["abc", "edf", "dfk", "kkk""...", "...", "...", "...", "...", "...", "...", "...", "..."] 我的问题是,有

我正试图用selenium的点击按钮刮取一个网站,所以我刮取了许多页面的表格: *几乎每个表格的表格模式都是相同的 假设我们有一个列表:这是我的表的标题,它包含5列,我把它作为一个静态类型

header = ["a", "b", "c", "d", "e"]
还有一个语料库作为列表,有5列,如:

["abc", "edf", "dfk", "kkk""...", 
 "...", "...", "...", "...",
"...", "...", "...", "..."]
我的问题是,有时与标题“b”对应的列会丢失。 因此,当我构建数据帧时,比如pd.dataFrame(line,columns=header),有时len(line)==line(header),所以有时是可以的,有时不是 这是我不工作时的代码

def function(parameters) : 
    ....
    web scraping 
    ....
    try : 
        df = pd.DataFrame(table, columns = header)
        return df
    except ValueError :
        print("table and header columns shape mismatch") 
    else : 
        for line in table : # table is corpus list
            line.insert(1, "None") # i know that every missing columns is the 2nd one so i add None to add that missing columns
            # in theory shape must match so i build df
        df = pd.DataFrame(table, columns = header)
        return df
但我仍然有错误的列不匹配,所以我想知道我的错误在哪里,或者另一种方法。
我希望这是清楚的。谢谢。

在创建表格的dfshape之前,表格的形状是什么?我说标题和表格有5列,但有时table=4为什么只在第一个位置插入?
行。插入(1,“无”)
,因为如果len 4!=5不匹配i Get value Error我很困惑,如果缺少整个第二列,请删除相应的标题。如果缺少一些,则添加条件如果缺少,则仅以这种方式添加“无”。如果该值存在,则内部列表的长度将为6,这也是不可取的