Python 将url转换为唯一哈希代码以保存html文件
嗨,我想保存URL的html。在理想的情况下,我会使用url作为文件名-但是给定的url通常包含特殊字符,这是不可能的 我想要的是一种将url转换为“代码”的方法,然后将其用作文件名。我还需要一种能够返回的方式(即从文件名返回到原始url) 我假设最好的方法是以某种方式进行散列,但不确定从哪里开始。我将在Python中工作,因此理想情况下,我希望采用以下形式:Python 将url转换为唯一哈希代码以保存html文件,python,hash,Python,Hash,嗨,我想保存URL的html。在理想的情况下,我会使用url作为文件名-但是给定的url通常包含特殊字符,这是不可能的 我想要的是一种将url转换为“代码”的方法,然后将其用作文件名。我还需要一种能够返回的方式(即从文件名返回到原始url) 我假设最好的方法是以某种方式进行散列,但不确定从哪里开始。我将在Python中工作,因此理想情况下,我希望采用以下形式: def url_to_file_name (): ... return (file_name) def fi
def url_to_file_name ():
...
return (file_name)
def file_name_to_url ():
...
return (url)
您可以使用url编码方法,它将大多数(据我所知)转换为“%”字符+字母数字和点 例如: 您可以使用:
urllib.quote_plus("stackoverflow.com?it!@#$%^&*()cool")
哈希可能不是一个好的解决方案,因为您将无法转换回。哈希是一种单向操作。从您的文件名中完全转义(例如转换为unicode值)这些字符是否可以接受?@sobolevn理想情况下是的-但考虑到您的评论,总的来说,我可能会因此散列,并接受我将无法从文件名返回原始url。然后