C# 如何将网页上的所有可见文本作为一个大的未解析字符串返回?

C# 如何将网页上的所有可见文本作为一个大的未解析字符串返回?,c#,C#,我正在寻找一个简单的脚本,它基本上相当于用户在网页上按Ctrl+a全选,然后将文本复制到剪贴板,这样我就可以从那里将其拉入字符串 我想模拟用户选择all然后复制和粘贴的原因是,有些页面是用Javascript生成的,HTML中没有可见文本 无论如何,我只是在寻找未经分析的原始文本。我不在乎间距/换行符是否混乱,等等。我只想快速、不干净地将页面上所有可选文本快照成一个字符串 我试着做以下的例子: private void button3_Click(object sender, EventArgs

我正在寻找一个简单的脚本,它基本上相当于用户在网页上按Ctrl+a全选,然后将文本复制到剪贴板,这样我就可以从那里将其拉入字符串

我想模拟用户选择all然后复制和粘贴的原因是,有些页面是用Javascript生成的,HTML中没有可见文本

无论如何,我只是在寻找未经分析的原始文本。我不在乎间距/换行符是否混乱,等等。我只想快速、不干净地将页面上所有可选文本快照成一个字符串

我试着做以下的例子:

private void button3_Click(object sender, EventArgs e)
        {
            HAP.HtmlWeb web = new HAP.HtmlWeb();
            HtmlAgilityPack.HtmlDocument doc = web.
               Load(@"https://mywebsite");
            string str = doc.DocumentNode.InnerText;
            MessageBox.Show(str);
        }
但是如果页面有javascript,它不会返回它所显示的文本。

使用jQuery:$document.text或$'body.text,而不是

doc.DocumentNode.InnerText;
用这个

doc.DocumentNode.InnerHtml;

它将为您提供整个HTML,包括JS和CSS。希望能有所帮助。

分享您的代码以及迄今为止所实现的功能。我刚才就这么做了