使用bash从html表的特定列中提取值
我有一个html表格,其中第一行是标题,下一行代表表格的主体。我想从每行的第3列中提取值。如何继续?尝试下面的awk命令使用bash从html表的特定列中提取值,html,bash,awk,sed,Html,Bash,Awk,Sed,我有一个html表格,其中第一行是标题,下一行代表表格的主体。我想从每行的第3列中提取值。如何继续?尝试下面的awk命令 awk 'NR>1{print $3}' file 这将打印除标题中的第三列之外的第三列的值 更新: awk -v RS='</tr>' -v F='<td>' '{$3=gsub(/<[^<>]*>/,"",$3);print $3}' file awk-vrs='''-vf=''{$3=gsub(/,'',$3);
awk 'NR>1{print $3}' file
这将打印除标题中的第三列之外的第三列的值
更新:
awk -v RS='</tr>' -v F='<td>' '{$3=gsub(/<[^<>]*>/,"",$3);print $3}' file
awk-vrs='''-vf=''{$3=gsub(/,'',$3);打印$3}'文件
不,它不工作。我认为在这种情况下应该使用分隔符()。您能提供一个示例以及预期的输出吗?awk-vrs='''-vf=''{print$3}'-这将打印值。如何从这里提取值?awk-vrs=''-vf=''{$3=gsub(//,'',$3);打印$3}'文件