C# 一个C正则表达式问题:检索谷歌搜索结果
我想将谷歌搜索结果的标题和链接存储到数据库中。搜索结果的HTML代码如下所示:C# 一个C正则表达式问题:检索谷歌搜索结果,c#,regex,C#,Regex,我想将谷歌搜索结果的标题和链接存储到数据库中。搜索结果的HTML代码如下所示: <br/> 标题 每一页有10个结果。有人能告诉我如何检索URL和标题吗 非常感谢你 你应该试一试。HTML解析器是读取HTML内容的正确方法 但是,如果你想冒自己的风险: <h3 class=r><a .*? href="(?<url>[^"]*)".*?>(?<title>.*?)</a></h3> 您将遇到以下问题: 换行符
<br/>
标题
每一页有10个结果。有人能告诉我如何检索URL和标题吗
非常感谢你 你应该试一试。HTML解析器是读取HTML内容的正确方法
但是,如果你想冒自己的风险:
<h3 class=r><a .*? href="(?<url>[^"]*)".*?>(?<title>.*?)</a></h3>
您将遇到以下问题:
换行符
不匹配的标签
微小的HTML更改
所以,祝你好运 你应该试一试。HTML解析器是读取HTML内容的正确方法
但是,如果你想冒自己的风险:
<h3 class=r><a .*? href="(?<url>[^"]*)".*?>(?<title>.*?)</a></h3>
您将遇到以下问题:
换行符
不匹配的标签
微小的HTML更改
所以,祝你好运 对于初学者,我不建议为此使用正则表达式,而是使用来解析HTML文档 希望这有帮助, 顺致敬意,
Tom。对于初学者,我不建议为此使用正则表达式,而是使用来解析HTML文档 希望这有帮助, 顺致敬意,
Tom。考虑改用Google AJAX搜索API。在你和谷歌的服务器上都会更容易。这里有一些使用说明。他们没有给出一个C示例,但是使用一个C的JSONAPI来适应您的需要应该不难 如果您坚持使用HTML,我还建议您使用HTML Agility Pack
您还应该考虑缓存,以尽量减少过时数据和不必要的请求。考虑改用Google AJAX搜索API。在你和谷歌的服务器上都会更容易。这里有一些使用说明。他们没有给出一个C示例,但是使用一个C的JSONAPI来适应您的需要应该不难 如果您坚持使用HTML,我还建议您使用HTML Agility Pack 您还应该考虑缓存,以便最大限度地减少过时数据和不必要的请求