C# 如何将网页上的所有可见文本作为一个大的未解析字符串返回?
我正在寻找一个简单的脚本,它基本上相当于用户在网页上按Ctrl+a全选,然后将文本复制到剪贴板,这样我就可以从那里将其拉入字符串 我想模拟用户选择all然后复制和粘贴的原因是,有些页面是用Javascript生成的,HTML中没有可见文本 无论如何,我只是在寻找未经分析的原始文本。我不在乎间距/换行符是否混乱,等等。我只想快速、不干净地将页面上所有可选文本快照成一个字符串 我试着做以下的例子:C# 如何将网页上的所有可见文本作为一个大的未解析字符串返回?,c#,C#,我正在寻找一个简单的脚本,它基本上相当于用户在网页上按Ctrl+a全选,然后将文本复制到剪贴板,这样我就可以从那里将其拉入字符串 我想模拟用户选择all然后复制和粘贴的原因是,有些页面是用Javascript生成的,HTML中没有可见文本 无论如何,我只是在寻找未经分析的原始文本。我不在乎间距/换行符是否混乱,等等。我只想快速、不干净地将页面上所有可选文本快照成一个字符串 我试着做以下的例子: private void button3_Click(object sender, EventArgs
private void button3_Click(object sender, EventArgs e)
{
HAP.HtmlWeb web = new HAP.HtmlWeb();
HtmlAgilityPack.HtmlDocument doc = web.
Load(@"https://mywebsite");
string str = doc.DocumentNode.InnerText;
MessageBox.Show(str);
}
但是如果页面有javascript,它不会返回它所显示的文本。使用jQuery:$document.text或$'body.text,而不是
doc.DocumentNode.InnerText;
用这个
doc.DocumentNode.InnerHtml;
它将为您提供整个HTML,包括JS和CSS。希望能有所帮助。分享您的代码以及迄今为止所实现的功能。我刚才就这么做了