C# 使用C/vb.net从网站获取数据

C# 使用C/vb.net从网站获取数据,c#,asp.net,xml,vb.net,screen-scraping,C#,Asp.net,Xml,Vb.net,Screen Scraping,我有一个具有以下结构的XML: <table name="tblsiccodes"> <row> <sSICCode>0888</sSICCode> </row> <row> <sSICCode>0900</sSICCode> </row> <row> <sSICCode>100

我有一个具有以下结构的XML:

<table name="tblsiccodes">
    <row>
        <sSICCode>0888</sSICCode>
    </row>
    <row>
        <sSICCode>0900</sSICCode>
    </row>
    <row>
        <sSICCode>1000</sSICCode>
    </row>
    <row>
        <sSICCode>1040</sSICCode>
    </row>
    <row>
        <sSICCode>1044</sSICCode>
    </row>
    <row>
        <sSICCode>1090</sSICCode>
    </row>
    <row>
        <sSICCode>1220</sSICCode>
    </row>
    <row>
        <sSICCode>1221</sSICCode>
    </row>
</table>
我需要从这个网站上选择每个SIC代码的描述

还是这个网站

使用vb.net从网站上获取每个SIC描述的最简单方法是什么?我无法修改此XML文件。我是否需要创建一个包含手动复制到其中的SIC代码和描述的集合,然后通过将SIC代码与集合匹配来获取XMl中的SIC代码描述?最终集合将用于使用具有SIC代码和行业名称的每个项目/行填充中继器

我需要做屏幕报废吗?我不认为这些网站有一些API/服务,我可以使用这些API/服务获得行业名称

除了Jquery,我不能使用HTMl agility pack或任何其他第三方库


请建议。

查看第一页的来源,它包含以下选择:

<select>
   <option value=''> NO SIC CODE SELECTED </option>
   <option value='3291'> ABRASIVE PRODUCTS (SIC Code: 3291) </option>
   (...)
</select>
就这样继续下去。 您可以将select的所有选项保存为另一个xml文件,然后使用XDocument或.net的任何其他xml加载功能(即c或vb.net)遍历您的文档,并通过包含所有OPTOIN的xml中value属性的值查找每个SIC代码。
当然,这可能不是最快的方法,但最容易实现。

SIC代码是否经常更改?如果没有,我建议您手动复制文本文件CSV代码中的站点描述;将html表复制到excel时,desc非常容易创建。当然,如果只有10000个sic代码,这是可能的,因为我认为读取你的links.jquery是一个javascript库。你在使用javascript吗?