Warning: file_get_contents(/data/phpspider/zhask/data//catemap/2/csharp/271.json): failed to open stream: No such file or directory in /data/phpspider/zhask/libs/function.php on line 167

Warning: Invalid argument supplied for foreach() in /data/phpspider/zhask/libs/tag.function.php on line 1116

Notice: Undefined index: in /data/phpspider/zhask/libs/function.php on line 180

Warning: array_chunk() expects parameter 1 to be array, null given in /data/phpspider/zhask/libs/function.php on line 181
C# ASP.NET:如何从表格html源中提取特定值?_C#_Asp.net - Fatal编程技术网

C# ASP.NET:如何从表格html源中提取特定值?

C# ASP.NET:如何从表格html源中提取特定值?,c#,asp.net,C#,Asp.net,我想提取IMDb票房表中每一行的电影名称 html表格行示例: <tr class="chart_even_row"> <td style="text-align: right;"> <b>1</b> </td> <td> <img border="0" src="http://ia.media-imdb.com/images/M/MV5BMjA4NDg3NzYxMF5BM

我想提取IMDb票房表中每一行的电影名称

html表格行示例:

    <tr class="chart_even_row">

  <td style="text-align: right;">
      <b>1</b>
  </td>
  <td>
      <img border="0" src="http://ia.media-imdb.com/images/M/MV5BMjA4NDg3NzYxMF5BMl5BanBnXkFtZTcwNTgyNzkyNw@@._V1._SY30_SX23_.jpg" width="20" height="30">
  </td>
  <td>

<a  href="/title/tt1392170/" >The Hunger Games</a> (2012)
  </td>
  <td style="text-align: right; padding-right: 20px;">$155M
  </td>
  <td style="text-align: right;">
$155M
  </td>
  <td style="text-align: center;">
1
  </td>

</tr>

1.
(2012)
1.55亿美元
1.55亿美元
1.
我想提取的价值是“饥饿游戏”

我需要一个C代码来实现这一点

注意:我想通过正则表达式来实现这一点

提前感谢,,
Rashad.

屏幕刮除IMDB是复杂、脆弱且禁止的。IMDB提供纯文本数据文件,您可以在

更新 请允许我重申:屏幕抓取和数据挖掘IMDB.com违反了它们的使用条款

关于正则表达式:


因此,如果您执意违反IMDB的使用条款,那么HTML Agility Pack可能是最好的方法。

尝试将代码复制粘贴到单个HTML文件中。如果要获取的页面太多,请尝试编写代码,通过html agility pack读取这些页面


您可以在这里找到html agility pack

谢谢,但是我可以使用正则表达式提取值吗?好的,您可以找到如何使用它们html agility pack使用与XPath支持相同的东西好的,但是我可以通过正则表达式来做吗,因为我看到一个IMDB API解决方案使用正则表达式从html源代码提取值?我不确定,上次需要使用XPath时,我会使用XPath。我会下载票房前十名的来源。。它在那里不可用