Python 正在尝试向excel工作簿中添加从网站导出的临时数据_Python_Selenium_Screen Scraping

Python 正在尝试向excel工作簿中添加从网站导出的临时数据

python selenium

Python 正在尝试向excel工作簿中添加从网站导出的临时数据,python,selenium,screen-scraping,Python,Selenium,Screen Scraping,我正在尝试将一些数据添加到Excel文件中，我正在使用Python和Selenium从站点导出这些文件。我想将这些数据添加到Excel文件中的一列中，但我不确定该如何操作。下面是我必须循环并下载所有文件的代码。我将使用Pandas并将它们全部合并，但我需要弄清楚如何将这些额外信息添加到我下载的每个Excel文件中。我在考虑用BeautifulSoup删除额外的数据，但我不知道如何将这些数据添加到每个文件中。谁能帮帮我吗 import pandas as pd import glob impor

我正在尝试将一些数据添加到Excel文件中，我正在使用Python和Selenium从站点导出这些文件。我想将这些数据添加到Excel文件中的一列中，但我不确定该如何操作。下面是我必须循环并下载所有文件的代码。我将使用Pandas并将它们全部合并，但我需要弄清楚如何将这些额外信息添加到我下载的每个Excel文件中。我在考虑用BeautifulSoup删除额外的数据，但我不知道如何将这些数据添加到每个文件中。谁能帮帮我吗

import pandas as pd
import glob 
import requests
from selenium import webdriver
from selenium.webdriver.common.keys import Keys
import os
from selenium.webdriver.support.ui import WebDriverWait
from selenium.webdriver.common.by import By
from selenium.webdriver.support import expected_conditions as EC
from selenium.webdriver.support.ui import Select
import time
driver = webdriver.Chrome()

# SET URL
driver.get(r'http://url')

#CLICK on SET
wait = WebDriverWait(driver, 40)
SET= wait.until(EC.presence_of_element_located((By.XPATH, "//*[@id='ctl00_ctl00_body_tabs']/div[2]/ul[1]/li[2]/a/span/span/span")))
SET.click()

#SWITCH TO IFRAME
wait = WebDriverWait(driver, 40)
frm1= wait.until(EC.presence_of_element_located((By.XPATH, "//*[@id='body_pnl']/div/iframe")))

driver.switch_to.frame(frm1)

region=2

while region<38:
    #CHOOSE REGION
    wait = WebDriverWait(driver, 40)
    newreg= wait.until(EC.presence_of_element_located((By.XPATH, "//*[@id='ctl00_areaSelector']")))
    newreg.click()
    time.sleep(2)

    wait = WebDriverWait(driver, 40)
    xpath="//*[@id='ctl00_areaSelector']/option[{}]".format(region)
    newreg= wait.until(EC.presence_of_element_located((By.XPATH,xpath )))
    newreg.click()
    time.sleep(2)
    
    #Click event admin list
    wait = WebDriverWait(driver, 40)
    eventadmin= wait.until(EC.presence_of_element_located((By.XPATH, "//*[@id='ctl00_contentPlaceHolder_gridView']/tbody/tr[2]/td[2]/a")))
    eventadmin.click()
    
    Rates=driver.find_elements_by_xpath("//a[contains(text(),'Rates')]")
    numrates=len(Rates)
    counter=0
    
    
    while counter<numrates:
        time.sleep(2)
        Rates=driver.find_elements_by_xpath("//a[contains(text(),'Rates')]")
        Rates[counter].click()
        
        #Export Rates
        time.sleep(3)
        wait = WebDriverWait(driver, 40)
        exp= wait.until(EC.presence_of_element_located((By.XPATH, "//*[@id='ctl00_contentPlaceHolder_exportToExcel']")))
        exp.click()
        time.sleep(5)
        
        #click back button
        wait = WebDriverWait(driver, 40)
        back= wait.until(EC.presence_of_element_located((By.XPATH, "//*[@id='ctl00_link1']")))
        back.click()
        
        counter+=1
        time.sleep(3)
       
    #Back to main screen
    wait = WebDriverWait(driver, 40)
    back= wait.until(EC.presence_of_element_located((By.XPATH, "//*[@id='ctl00_link1']")))
    back.click()
    
    region+=1

将熊猫作为pd导入
导入glob
导入请求
从selenium导入webdriver
从selenium.webdriver.common.keys导入密钥
导入操作系统
从selenium.webdriver.support.ui导入WebDriverWait
从selenium.webdriver.common.by导入
从selenium.webdriver.support将预期的_条件导入为EC
从selenium.webdriver.support.ui导入选择
导入时间
driver=webdriver.Chrome（）
#设置URL
司机，快（右）开http://url')
#点击集合
wait=WebDriverWait（驱动程序，40）
SET=wait.until（EC.presence_of_element_located（（By.XPATH，“/*[@id='ctl00_ctl00_body_tabs']]/div[2]/ul[1]/li[2]/a/span/span/span/span”））
设置。单击（）
#切换到IFRAME
wait=WebDriverWait（驱动程序，40）
frm1=等待.until（位于（（By.XPATH，“/*[@id='body\u pnl']]/div/iframe'））的元素的存在）
驱动器切换到帧（frm1）
区域=2
当您可以刮取数据时，为什么要下载excel文件？我建议删除数据，创建一个数据框，然后将数据写入excel文件，这是不可能的，因为将有200多个文件被合并，每个文件都需要添加唯一的数据。