C# ASP.NET:如何从表格html源中提取特定值?
我想提取IMDb票房表中每一行的电影名称 html表格行示例:C# ASP.NET:如何从表格html源中提取特定值?,c#,asp.net,C#,Asp.net,我想提取IMDb票房表中每一行的电影名称 html表格行示例: <tr class="chart_even_row"> <td style="text-align: right;"> <b>1</b> </td> <td> <img border="0" src="http://ia.media-imdb.com/images/M/MV5BMjA4NDg3NzYxMF5BM
<tr class="chart_even_row">
<td style="text-align: right;">
<b>1</b>
</td>
<td>
<img border="0" src="http://ia.media-imdb.com/images/M/MV5BMjA4NDg3NzYxMF5BMl5BanBnXkFtZTcwNTgyNzkyNw@@._V1._SY30_SX23_.jpg" width="20" height="30">
</td>
<td>
<a href="/title/tt1392170/" >The Hunger Games</a> (2012)
</td>
<td style="text-align: right; padding-right: 20px;">$155M
</td>
<td style="text-align: right;">
$155M
</td>
<td style="text-align: center;">
1
</td>
</tr>
1.
(2012)
1.55亿美元
1.55亿美元
1.
我想提取的价值是“饥饿游戏”
我需要一个C代码来实现这一点
注意:我想通过正则表达式来实现这一点
提前感谢,,
Rashad.屏幕刮除IMDB是复杂、脆弱且禁止的。IMDB提供纯文本数据文件,您可以在 更新 请允许我重申:屏幕抓取和数据挖掘IMDB.com违反了它们的使用条款 关于正则表达式:
因此,如果您执意违反IMDB的使用条款,那么HTML Agility Pack可能是最好的方法。尝试将代码复制粘贴到单个HTML文件中。如果要获取的页面太多,请尝试编写代码,通过html agility pack读取这些页面
您可以在这里找到html agility pack谢谢,但是我可以使用正则表达式提取值吗?好的,您可以找到如何使用它们html agility pack使用与XPath支持相同的东西好的,但是我可以通过正则表达式来做吗,因为我看到一个IMDB API解决方案使用正则表达式从html源代码提取值?我不确定,上次需要使用XPath时,我会使用XPath。我会下载票房前十名的来源。。它在那里不可用