C# 从网站下载数据后出现断开的文本
所以我需要从网站下载内容并将其放在richTextBox上。问题是,当我下载内容并使用regex进行过滤时,会出现断开的文本。我怎么能修好它呢。下面是我的代码:C# 从网站下载数据后出现断开的文本,c#,C#,所以我需要从网站下载内容并将其放在richTextBox上。问题是,当我下载内容并使用regex进行过滤时,会出现断开的文本。我怎么能修好它呢。下面是我的代码: String website = "https://www.basketnews.lt/news-102294-nba-klubu-vadovai-finalas-nesikeis-mvp-iskovos-jamesas.html"; MyWebClient webClientObj = new MyWebClient(); webC
String website = "https://www.basketnews.lt/news-102294-nba-klubu-vadovai-finalas-nesikeis-mvp-iskovos-jamesas.html";
MyWebClient webClientObj = new MyWebClient();
webClientObj.Encoding = System.Text.Encoding.UTF8;
String data = webClientObj.DownloadString(website);
HtmlAgilityPack.HtmlDocument doc = new HtmlAgilityPack.HtmlDocument();
doc.LoadHtml(data);
foreach (HtmlAgilityPack.HtmlNode node2 in doc.DocumentNode.SelectNodes("//div[@class= 'text']//p"))
{
string content = node2.InnerText;
this.richTextBox1.AppendText('\t' + content + '\n');
}
我希望它看起来像什么:
现在看起来是这样的:
文本包含html编码的部分。通过
HtmlDecode
运行它:
var content = System.Web.HttpUtility.HtmlDecode(node2.innerText);
请给出一个输出示例,并与预期输出进行比较。你是说换行符意义上的“断开”吗?将richtextbox的wordwrap属性设置为false。我明白了,这是我将使用的html实体method@user7038346我认为有趣的角色其实很好(是什么,立陶宛人?)