如何从HTML表中获取禁用了R单选按钮的行数?
我正在用R刮一个网页。我使用“RSelenium”和“XML”包。下表的某些行中有一个单选按钮。我需要知道哪些行(例如第一行和第三行)禁用了单选按钮,以便在刮削过程中跳过该行。哪种方法最好?我不知道如何轻松地获得禁用输入的行数如何从HTML表中获取禁用了R单选按钮的行数?,r,web-scraping,rselenium,R,Web Scraping,Rselenium,我正在用R刮一个网页。我使用“RSelenium”和“XML”包。下表的某些行中有一个单选按钮。我需要知道哪些行(例如第一行和第三行)禁用了单选按钮,以便在刮削过程中跳过该行。哪种方法最好?我不知道如何轻松地获得禁用输入的行数 <table cellspacing="1" cellpadding="0" border="0" width="100%" id="table1"> <tbody><tr> <td width="36">&
<table cellspacing="1" cellpadding="0" border="0" width="100%" id="table1">
<tbody><tr>
<td width="36"> </td>
<td width="100"><b>Matricola Inps</b></td>
<td width="150"><b>Denominazione</b></td>
<td width="100"><b>Stato Adesione</b></td>
<td width="120"><b>Note</b></td>
</tr>
<tr>
<td align="center" width="36">
<input type="radio" disabled="" id="sistema" name="unitaId" value="XXX">
</td>
<td><font color="#C0C0C0">
N/D
</font>
</td>
<td>
<font color="#C0C0C0">
blablabla
</font>
</td>
<td>
<font color="#C0C0C0">
</font>
</td>
<td>
</td>
</tr>
<tr>
<td align="center" width="36">
<input type="radio" id="sistema" name="unitaId" value="XXX">
</td>
<td>
N/D
</td>
<td>
blablabla
</td>
<td>
</td>
<td>
</td>
</tr>
<tr>
<td align="center" width="36">
<input type="radio" id="registra" name="unitaId" value="XXXX">
</td>
<td>
XXXXX
</td>
<td>
blabla
</td>
<td>
Aderente
</td>
<td>
Sede Principale
Sede Legale
</td>
</tr>
</tbody></table>
Matricola Inps
脱氨锡
斯塔托·阿德西翁酒店
注
不适用
喋喋不休
不适用
喋喋不休
XXXXX
布拉布拉
阿德伦特
塞德普林西比酒店
Sede Legale
非常感谢。我找到了以下解决方案
nodesToString <- xpathSApply(doc, "//tr", saveXML)
disabledIndexes <- which(grepl('disabled', nodesToString))
nodesToString如果每一行都有一个输入字段,那么您可以通过使用类似的东西(unname(!is.na(sappy)(xpathsaply(doc,//table/tbody/tr/td/input[@type='radio']”,xmlAttrs),“[”,“disabled”))来获取行号
。谢谢。但它不起作用,因为我意识到并非每一行都有输入……我也根据这一点编辑了问题。