html表到数组ruby

html表到数组ruby,ruby,watir,Ruby,Watir,我正在使用watir截屏,我下载了一个xls文件。当我在记事本中打开这个文件时,我发现它只是一堆html表格。是否有任何函数或gem可以将此页面转换为一组数组。 欢迎提出任何意见 一般来说,只要不使用colspan或rowspan属性,就可以通过一个带有表的HTML文件来提取行和列,这是一个简单的练习。这些会打乱逻辑流,需要对它们造成的间隙进行一些感知,并且需要使用*跨度中的重复值填充间隙。也许会有帮助 从桌面上的XLS文件来看,我认为它们不是XML或HTML。我不确定你下载了什么。我进行了快速

我正在使用watir截屏,我下载了一个xls文件。当我在记事本中打开这个文件时,我发现它只是一堆html表格。是否有任何函数或gem可以将此页面转换为一组数组。
欢迎提出任何意见

一般来说,只要不使用colspan或rowspan属性,就可以通过一个带有表的HTML文件来提取行和列,这是一个简单的练习。这些会打乱逻辑流,需要对它们造成的间隙进行一些感知,并且需要使用*跨度中的重复值填充间隙。也许会有帮助

从桌面上的XLS文件来看,我认为它们不是XML或HTML。我不确定你下载了什么。我进行了快速搜索,roo()似乎是一个很好的起点

  • 把范围缩小到
  • 清除空白
  • 选项卡替换为
  • 将标签替换为“”,
  • &&标记替换为空
  • 标记替换为|
  • 使用|
  • 使用

  • 您可以将它简化一点,但这就是它的要点。

    XLS是一种二进制格式。如果您在文件内容中看到HTML表,则表示您可能没有正确下载文件


    如何通过Watir下载XLS文件?您是必须自动打开文件下载窗口,还是只是按照XLS文件的链接将内容写入文件?

    显示代码。你有什么,你想从中得到什么。