从命令行将表格从html提取到excel

从命令行将表格从html提取到excel,html,excel,macos,command-line,Html,Excel,Macos,Command Line,将HTML文档中的表转换为excel可读文件的最佳方法是什么?我希望这是一个命令行工具,我可以在我的mac上调用bash,因为我想批量处理一堆HTML文件 我知道我可以很容易地编写一个脚本来实现这一点,但我正在寻找可以从命令行调用的通用、现有的工具。我希望尽可能保留格式,但如果没有其他易于安装和设置的内容符合要求,我愿意使用CSV。html2text应该可以工作,至少,它应该能够生成一些可以作为逗号分隔的列表(或者相当容易地破解成一个列表)的内容。这里有很多链接: 它有很多标志来控制输出的格式

将HTML文档中的表转换为excel可读文件的最佳方法是什么?我希望这是一个命令行工具,我可以在我的mac上调用bash,因为我想批量处理一堆HTML文件


我知道我可以很容易地编写一个脚本来实现这一点,但我正在寻找可以从命令行调用的通用、现有的工具。我希望尽可能保留格式,但如果没有其他易于安装和设置的内容符合要求,我愿意使用CSV。

html2text应该可以工作,至少,它应该能够生成一些可以作为逗号分隔的列表(或者相当容易地破解成一个列表)的内容。这里有很多链接:

它有很多标志来控制输出的格式。试试看


--jeff

Excel可以读取/打开带有表格的HTML文档,无需转换。它将自动将表格单元格映射到工作表单元格

试试这个:

  • 将下面的数据保存在扩展名为.html的文件中
  • 用Excel打开文件

标题1
标题2
R1,C1
R1,C2
R2,C1
R2,C2
<table>
<tr>
<th>Heading1</th>
<th>Heading2</th>
</tr>
<tr>
<td>R1, C1</td>
<td>R1, C2</td>
</tr>
<tr>
<td>R2, C1</td>
<td>R2, C2</td>
</tr>
</table>