Python在Excel中打开html文件
我有一大堆.html格式的采购订单,需要提取数据并放在一张简单的excel表格中。虽然我可以使用beutifulsoup来做这件事,但我宁愿使用excel的内置转换器,它已经做得更好了。然后直接使用excel文件。是否有一种方法可以使用python打开html文档,然后再次将其保存在.xlsx中。我尝试使用openpyxl,但它不接受html文件。您可以使用Python自动生成Excel应用程序的实例,打开每个文件,并另存为Python在Excel中打开html文件,python,excel,openpyxl,Python,Excel,Openpyxl,我有一大堆.html格式的采购订单,需要提取数据并放在一张简单的excel表格中。虽然我可以使用beutifulsoup来做这件事,但我宁愿使用excel的内置转换器,它已经做得更好了。然后直接使用excel文件。是否有一种方法可以使用python打开html文档,然后再次将其保存在.xlsx中。我尝试使用openpyxl,但它不接受html文件。您可以使用Python自动生成Excel应用程序的实例,打开每个文件,并另存为。xlsx: import win32com.client excelA
。xlsx
:
import win32com.client
excelApp = win32com.client.Dispatch('Excel.Application')
book = excelApp.Open(path_to_html_file)
book.SaveAs(path_to_html_file + '.xlsx', 51)
如果所需数据位于html中的表中,则可以使用将html读入excel