Python 如何检查数据帧是否为URL格式?
我有一个数据框,如:Python 如何检查数据帧是否为URL格式?,python,python-3.x,pandas,dataframe,numpy,Python,Python 3.x,Pandas,Dataframe,Numpy,我有一个数据框,如: df['website'] 我想要一个条件,df['website']应该只包含URL表单中的网站名称。如果数据框中有其他语句而不是URL,则应显示警告消息。可以使用validators包。 如果你想了解更多,请遵循以下步骤 获取返回url是否有效的函数后,可以使用df.apply()并将该函数应用于数据帧中的所有url。您可以返回True/false以确定其是否有效。此外,在函数中,如果发现警告无效,可以打印警告 import validators def isUrl
df['website']
我想要一个条件,df['website']应该只包含URL表单中的网站名称。如果数据框中有其他语句而不是URL,则应显示警告消息。可以使用validators包。 如果你想了解更多,请遵循以下步骤 获取返回url是否有效的函数后,可以使用df.apply()并将该函数应用于数据帧中的所有url。您可以返回True/false以确定其是否有效。此外,在函数中,如果发现警告无效,可以打印警告
import validators
def isUrlValid(url):
return True if validators.url(url) else False
df['isURLValid'] = df['website'].apply(isUrlValid)
输出:
website isURLValid
0 https://stackoverflow.com/ True
1 no False
最后,如果不想将结果作为列添加到数据帧中,可以循环使用
df['website'].tolist()中的所有值,并为每个值调用函数,并在函数中打印警告
但是要检查“url格式”,您可以编写一个函数来检查常见的url元素,如:“http”或“.com”。或者即使数据中有“.”
这实际上取决于您的数据…请在预期输出的同时包含一些示例输入。