解析本地html文件中的阿拉伯语文本

解析本地html文件中的阿拉伯语文本,html,python-3.x,beautifulsoup,Html,Python 3.x,Beautifulsoup,我试图使用python和BeautifulSoup从本地html文件中提取一些数据,该文件包含一些阿拉伯文文本数据,如标题。我的问题是,当我试图打印出这个阿拉伯文本时,我得到一个奇怪的字符串。文件的开头部分提供了一个代码及其输出的示例,有人能帮我吗?使用utf-8编码打开文件 打开(“body.htm”,encoding=“utf-8”) 或针对要使用的文件utf-8 #!/usr/bin/env python # -*- coding: utf-8 -*- 你能提供你试图解析的HTML文件吗

我试图使用python和BeautifulSoup从本地html文件中提取一些数据,该文件包含一些阿拉伯文文本数据,如标题。我的问题是,当我试图打印出这个阿拉伯文本时,我得到一个奇怪的字符串。文件的开头部分提供了一个代码及其输出的示例,有人能帮我吗?

使用
utf-8
编码打开文件

打开(“body.htm”,encoding=“utf-8”)

或针对要使用的文件
utf-8

#!/usr/bin/env python
# -*- coding: utf-8 -*-

你能提供你试图解析的HTML文件吗?这可能与您在部分中设置的编码有关。@Mulletfingers999我编辑了问题,并为标题部分添加了一个屏幕截图。我希望它是文本格式,以便复制您正在使用的阿拉伯语文本。似乎我无法用在网上发现的一些通用阿拉伯语文本来重现这一错误,我似乎无法用我在网上发现的一些在线发现的一些通用阿拉伯语文本来重现这一错误。我似乎无法用我在网上发现的一些在网上发现的一些通用阿拉伯文本来重现这一错误。我似乎无法用我在网上发现的一些在网上发现的一些通用阿拉伯文本来重现这一错误。我在网上发现的一些在线在线在线发现的一些网上发现的一些普通阿拉伯阿拉伯文本似乎似乎似乎似乎似乎似乎似乎也无法重现这一错误。我似乎我似乎似乎似乎似乎似乎似乎似乎似乎无法用我在我在我在我在我在我在我在网上发现的一些网上发现的一些在线发现的一些在线发现的一些在线发现的一些通用阿拉伯阿拉伯阿拉伯阿拉伯文本中发现的一些普通阿拉伯文本来重现这个错误。我在似乎似乎似乎似乎似乎似乎似乎似乎似乎似乎似乎似乎似乎似乎似乎似乎似乎似乎似乎似乎似乎似乎不会不会不会不会重现这这一个这一个错误。我在我在我在我在我在我在我在我ل