Python 循环遍历文件夹中的文件以合并为一个数据帧
我有一个满是HTML.txt文件的文件夹,我编写了一个脚本,根据一个示例文件解析和清理我需要的数据。现在我需要它来使用文件夹中的所有文件,执行解析任务并将数据放入一个数据帧中。通常这是可行的,但它似乎只是在做文件夹中的最后一个文件,即WY.txt 我相信这是一个循环的问题。。。任何编码方面的帮助都将不胜感激Python 循环遍历文件夹中的文件以合并为一个数据帧,python,pandas,dataframe,loops,Python,Pandas,Dataframe,Loops,我有一个满是HTML.txt文件的文件夹,我编写了一个脚本,根据一个示例文件解析和清理我需要的数据。现在我需要它来使用文件夹中的所有文件,执行解析任务并将数据放入一个数据帧中。通常这是可行的,但它似乎只是在做文件夹中的最后一个文件,即WY.txt 我相信这是一个循环的问题。。。任何编码方面的帮助都将不胜感激 os.chdir('C:/Users/SamRusso/Desktop/Locations Tables') FileList = glob.glob('*.txt') combined_
os.chdir('C:/Users/SamRusso/Desktop/Locations Tables')
FileList = glob.glob('*.txt')
combined_df = []
for fname in FileList:
files= open(fname)
file = files.read()
soup = BeautifulSoup(file, 'html.parser')
output = {}
for tag in soup.select('h2 a'):
output.setdefault(tag.get_text(), []).append(tag.find_next('p').get_text(strip=True, separator =' | '))
df = pd.DataFrame.from_dict(output, orient='index', columns=['Location'])
combined_df.append(df)