Warning: file_get_contents(/data/phpspider/zhask/data//catemap/2/python/353.json): failed to open stream: No such file or directory in /data/phpspider/zhask/libs/function.php on line 167

Warning: Invalid argument supplied for foreach() in /data/phpspider/zhask/libs/tag.function.php on line 1116

Notice: Undefined index: in /data/phpspider/zhask/libs/function.php on line 180

Warning: array_chunk() expects parameter 1 to be array, null given in /data/phpspider/zhask/libs/function.php on line 181
Python 循环遍历文件夹中的文件以合并为一个数据帧_Python_Pandas_Dataframe_Loops - Fatal编程技术网

Python 循环遍历文件夹中的文件以合并为一个数据帧

Python 循环遍历文件夹中的文件以合并为一个数据帧,python,pandas,dataframe,loops,Python,Pandas,Dataframe,Loops,我有一个满是HTML.txt文件的文件夹,我编写了一个脚本,根据一个示例文件解析和清理我需要的数据。现在我需要它来使用文件夹中的所有文件,执行解析任务并将数据放入一个数据帧中。通常这是可行的,但它似乎只是在做文件夹中的最后一个文件,即WY.txt 我相信这是一个循环的问题。。。任何编码方面的帮助都将不胜感激 os.chdir('C:/Users/SamRusso/Desktop/Locations Tables') FileList = glob.glob('*.txt') combined_

我有一个满是HTML.txt文件的文件夹,我编写了一个脚本,根据一个示例文件解析和清理我需要的数据。现在我需要它来使用文件夹中的所有文件,执行解析任务并将数据放入一个数据帧中。通常这是可行的,但它似乎只是在做文件夹中的最后一个文件,即WY.txt

我相信这是一个循环的问题。。。任何编码方面的帮助都将不胜感激

os.chdir('C:/Users/SamRusso/Desktop/Locations Tables')
FileList = glob.glob('*.txt')

combined_df = []

for fname in FileList:
    files= open(fname)
    file = files.read()    
    soup = BeautifulSoup(file, 'html.parser')

    output = {}
    for tag in soup.select('h2 a'):
        output.setdefault(tag.get_text(), []).append(tag.find_next('p').get_text(strip=True, separator =' | '))
        
    df = pd.DataFrame.from_dict(output, orient='index', columns=['Location'])
    combined_df.append(df)