如何使用python根据合成字符串找到正确的网站链接
我有一个名字和姓氏的列表,应该用来组成网站链接。但有时一些用户并不总是遵循命名规则,最终,他们的网站名称与预期名称不匹配 这里有一个例子:我们假设名字是如何使用python根据合成字符串找到正确的网站链接,python,Python,我有一个名字和姓氏的列表,应该用来组成网站链接。但有时一些用户并不总是遵循命名规则,最终,他们的网站名称与预期名称不匹配 这里有一个例子:我们假设名字是John,姓是Paul。在这种情况下,网站URL应该是johnpaul.com。但有时,使用putjohnpaul.com或pauljohn.com,或johnpaul.com 我想自动化这些网站上的一些进程。其中绝大多数是正确的,但有些是错误的。当它不正确时,我只是在谷歌上搜索预期的URL,它通常是我在谷歌上得到的第一个或第二个结果 我在问自己
John
,姓是Paul
。在这种情况下,网站URL应该是johnpaul.com
。但有时,使用putjohnpaul.com
或pauljohn.com
,或johnpaul.com
我想自动化这些网站上的一些进程。其中绝大多数是正确的,但有些是错误的。当它不正确时,我只是在谷歌上搜索预期的URL,它通常是我在谷歌上得到的第一个或第二个结果
我在问自己,是否有可能发出一个Google请求,并用python检查2或3个第一个链接以获得实际的URL。你知道怎么做这样的东西吗
我的代码现在如下所示:
for value in arr:
try:
print requests.get(url).status_code, url
except Exception as e:
print url, " is not available"
我会选择
endswith()
这样可以过滤掉.com.net等错误 可能重复的
string = "bla.com"
strfilter = ('.com', '.de') # Tuple
if string.endswith(strfilter):
raise "400 Bad Request"