C#如何从HTML文件中过滤出一些数据

C#如何从HTML文件中过滤出一些数据,c#,.net,C#,.net,我现在正在写一个刮刀。我在.html文件中有一些数据,我需要将其过滤成txt文件。 例如:它看起来像 <div class="random_item anonshint_show" title="" data-dz="" data-wiek="48" data-zwer="0" data-pracuje="1" data-cena="13" data-

我现在正在写一个刮刀。我在.html文件中有一些数据,我需要将其过滤成txt文件。 例如:它看起来像

<div class="random_item anonshint_show" title="" data-dz="" data-wiek="48" data-zwer="0" data-pracuje="1" data-cena="13" data-keyword="Name,123123123">

我对“数据关键字”感兴趣。有人能帮我把它过滤到内存或.txt文件吗?

看看它是为解析HTML而设计的