Python 从同一网站的sperate链接获取数据
谢谢你抽出时间来阅读这篇文章Python 从同一网站的sperate链接获取数据,python,vb.net,Python,Vb.net,谢谢你抽出时间来阅读这篇文章 我想知道是否有任何方法可以从不同的链接中获取特定的代码,但它们都属于同一个域。我的意思是,如果我将许多facebook页面链接放在一个文本文件中,它们的所有名称都会显示在不同的行中,我想如果我理解,您需要从链接中获取用户名 facebook.com/zuck acebook.com/moskov 您可以跟踪并提取页面标题,这可能并不总是准确的 > <title id="pageTitle">Mark Zuckerberg</title&g
我想知道是否有任何方法可以从不同的链接中获取特定的代码,但它们都属于同一个域。我的意思是,如果我将许多facebook页面链接放在一个文本文件中,它们的所有名称都会显示在不同的行中,我想如果我理解,您需要从链接中获取用户名 facebook.com/zuck acebook.com/moskov 您可以跟踪并提取页面标题,这可能并不总是准确的
> <title id="pageTitle">Mark Zuckerberg</title>
> <title id="pageTitle">Dustin Moskovitz</title>
>马克·扎克伯格
>达斯汀·莫斯科维茨
html2text是一个Python脚本,它将HTML页面转换为干净、易于阅读的纯ASCII文本。更好的是,ASCII恰好也是有效的标记(文本到HTML格式)。
如果您想阅读url,请查看以下说明
你能提供一些例子吗,你似乎想要一个域的子域。好的,这里是这个链接中的例子,如果你打开它,你会看到马克·扎克伯格的名字,如果你打开它,你会看到达斯汀·莫斯科维茨的名字。我想做的就是对它进行编程,从这样的链接列表中获取名字考虑使用Facebook API,如果你想从用户链接中获得真实姓名。不,不,域名不是facebook,这只是一个例子,我只想从不同的链接中获取特定的HTML行,并将每个行放在一行上