尝试使用AngleSharp解析wiki页面
我试图解析: 该页面有一个简单的表格:尝试使用AngleSharp解析wiki页面,anglesharp,Anglesharp,我试图解析: 该页面有一个简单的表格: <table class="wikitable sortable"> <caption>Airline codes</caption> <tr> <th>IATA</th> <th>ICAO</th> <th>Airline</th> <th>Ca
<table class="wikitable sortable">
<caption>Airline codes</caption>
<tr>
<th>IATA</th>
<th>ICAO</th>
<th>Airline</th>
<th>Call sign</th>
<th>Country</th>
<th>Comments</th>
</tr>
etc...
页面已正确加载,但我的任何查询都没有返回任何内容。我缺少什么?默认的
配置不支持文档加载,因此您会得到一个空文档。使用WithDefaultLoader
加载一个配置
所以改变
var config = new Configuration();
到
这解释了很多:)我添加了加载器(无法找到此btw的任何文档),但我仍然没有从该文档中获得任何信息。document.QuerySelectorAll(“wikitable”).Select(=>true)应选择整个表,否?@Thomas您要查找的wikitable
是一个css类,而不是标记。所以它应该是.wikitable
,前面有点表示类。比如document.QuerySelectorAll(“.wikitable”)
所以如果我理解了,我就抓取“.wikitable”来拥有这个类,然后我需要找到属于这个类的所有“tr”?如何搜索类型('tr')。还有,有没有什么地方有完整的文档?维基上的例子非常简单terse@Thomas没错。您可以在一个查询中完成它(“.wikitable tr”)
。这将在.wikitable
中找到所有tr
。查询选择器的语法基本上是相同的!有没有一种方法可以通过选择来获取所有列作为列表?类似select(=new{C1=u.(获取第1列的内容),C2=u.(…)的内容)?
var config = new Configuration();
var config = Configuration.Default.WithDefaultLoader();