Python 确保没有页面部分的URL列表始终以斜杠和圆点结尾

Python 确保没有页面部分的URL列表始终以斜杠和圆点结尾,python,Python,我有一个非常大的URL列表,我想在所有没有页面部分的URL中添加一个斜线和点(/。)。以下是我想要实现的一些示例: http://www.example.com应该是http://www.example.com/. http://www.example.com/index.htm没问题 http://www.example.com/.没问题 http://www.example.com/#应该是http://www.example.com/. http://www.example.com/so

我有一个非常大的URL列表,我想在所有没有页面部分的URL中添加一个斜线和点(
/。
)。以下是我想要实现的一些示例:

  • http://www.example.com
    应该是
    http://www.example.com/.
  • http://www.example.com/index.htm
    没问题
  • http://www.example.com/.
    没问题
  • http://www.example.com/#
    应该是
    http://www.example.com/.
  • http://www.example.com/something
    应该是
    http://www.example.com/something/.
一个例外是散列(
#
)也应该替换为点

我可以使用regexs来实现这一点,因为这是我唯一想到的事情,但由于这是一个非常大的10000多个URL列表,我正在寻找最快的方法

谢谢你所说的“页面部分”,你似乎是指结尾带有“.htm”的内容(给出了你的第2个和第5个示例),因此:


10000不是一个大数字。这是一个重复的任务吗?你怎么知道
something
是一个目录名?如果URL看起来不像文件名,很可能会盲目地添加斜杠,从而弄乱URL。嗨,Erisco。这是一项重复的任务。我将经常以JSON的形式在不同的URL集上提供这些数据。
.html
.php
.asp
,等等。这个列表可能会很长。除非您想在url.split(“/”)[-1]中使用类似于“if.”的内容。
url = url.rstrip('/#.')
if not url.endswith('.htm'):
    url += '/.'