C# 从URL提取文本_C#_Url - Fatal编程技术网

C# 从URL提取文本

c# url

C# 从URL提取文本,c#,url,C#,Url,问题是我需要只提取给定URL的文本内容。我应该坚持我只需要文本内容。互联网上有许多方法可以返回网页的所有内容而不进行任何文本分离我需要c语言的代码感谢您对HTML的任何回答。没有文本这样的东西。您在网页上看到的文本将根据标记的定义方式呈现您可以手动剥离标记之间的所有HTML标记，然后页面上就会出现类似于所有文本的内容。然而，这很容易出错大多数在线解决方案都会选择正则表达式，比如Regex.Replacestr、string.Empty；，但是如果你使用它，你很可能有一天会自食其果。你需

问题是我需要只提取给定URL的文本内容。我应该坚持我只需要文本内容。互联网上有许多方法可以返回网页的所有内容而不进行任何文本分离

我需要c语言的代码

感谢您对HTML的任何回答。没有文本这样的东西。您在网页上看到的文本将根据标记的定义方式呈现

您可以手动剥离标记之间的所有HTML标记，然后页面上就会出现类似于所有文本的内容。然而，这很容易出错

大多数在线解决方案都会选择正则表达式，比如Regex.Replacestr、string.Empty；，但是如果你使用它，你很可能有一天会自食其果。

你需要使用一些解析技术来获取文本，比如，你可以使用Xpath，或者正则表达式从Url的Html中获取文本。

你能试着更清楚地解释一下吗？我需要c语言的代码。你有PayPal吗？问题是如何通过生成超文本的文本来从html标记、图像和其他内容（而不是文本）中清除超文本？哇，这是一个从随机网页中正确剥离html的正则表达式？您愿意分享这个吗？而且，HTML不是XML，所以XPath几乎肯定不会帮助您。以或为例，它没有相应的结束标记。是的，当你点击一个带有（比如）嵌入式JavaScript的页面时，该正则表达式看起来会在你的脸上爆炸，其中一个条件是。。。更不用说ALT文本和类似的文本了。顺便说一句，您可能不是有意@the string。例如，您只需要一个来关闭HTML标记，之后正则表达式将消耗其间的所有内容，您将无法获得所需的结果。