python-无法使用os.walk检测其他语言的链接

python-无法使用os.walk检测其他语言的链接,python,url-encoding,os.walk,Python,Url Encoding,Os.walk,我正在尝试获取指定URL中存在的文件和目录列表。我使用的URL是在线词典的URL:。我的代码如下: html_files = [] for root, dirs, files in os.walk("www.shabdkosh.com/kn/browse"): for file in files: #Files in shabdkosh have a digit as name to represent page number if file.isdig

我正在尝试获取指定URL中存在的文件和目录列表。我使用的URL是在线词典的URL:。我的代码如下:

html_files = []

for root, dirs, files in os.walk("www.shabdkosh.com/kn/browse"):
    for file in files:
        #Files in shabdkosh have a digit as name to represent page number
        if file.isdigit():
            html_files.append(os.path.join(root, file))
当我打印文件内容时,我得到:

www.shabdkosh.com/kn/browse/3/1
www.shabdkosh.com/kn/browse/a/1
www.shabdkosh.com/kn/browse/a/10
www.shabdkosh.com/kn/browse/a/2
...
这很酷。但其他URL也应该被检索到。包含卡纳达字母的URL不显示卡纳达是一种印度语言,即使它们存在

比如说,

www.shabdkosh.com/kn/browse/ಅ/
即使它们位于指定为os.walk参数的路径www.shabdkosh.com/kn/browse中,也不会显示。那么,如何让os.walk获得带有卡纳达字母的URL列表呢

我甚至尝试在python文件的顶部包含以下代码:

#!/usr/bin/env python
# -*- coding: ascii -*-
但是没有运气。感谢您的帮助

如果我使用的是旧的Python2.7,请原谅

两件事可以尝试:

如果您使用的是任何编码,那么它应该是utf-8,而不是ascii。显然,这些不是ascii字符。 确保路径为unicode,例如os.walkuwww.shabdkosh.com/kn/browse。见西罗对此事的评论
如果file.isdigitfile不就是您想要的吗?移除条件,你会得到更多。运气不好。我甚至在条件之外打印了文件。我只收到纯英语的网址