Python可以';找不到个性

Python可以';找不到个性,python,string,Python,String,我写了一个简单的语句,当我从某个html源中获取字符串时,它会做一些事情,但是当我写: if 'p\xd1\x83\xd0\xb1.' in item: #other code if中的代码未运行 这就是我对来源的看法: source=urlopen(link).read().decode('utf-8') 顺便说一下,我将源代码拆分为一个字符串列表,然后循环遍历它。。项是整个html源代码的一部分 编辑:在我的例子中,项目类似于: <p> руб.230 </p>

我写了一个简单的语句,当我从某个html源中获取字符串时,它会做一些事情,但是当我写:

if 'p\xd1\x83\xd0\xb1.' in item:
#other code
if中的代码未运行

这就是我对来源的看法:

source=urlopen(link).read().decode('utf-8')
顺便说一下,我将源代码拆分为一个字符串列表,然后循环遍历它。。项是整个html源代码的一部分

编辑:在我的例子中,项目类似于:

<p> руб.230 </p>


p\xd1\x83\xd0\xb1。是一个字节字符串。通过将其解码为UTF-8,可以将字节字符串转换为unicode字符字符串:

>>> 'p\xd1\x83\xd0\xb1.'.decode('utf-8')
u'p\u0443\u0431.'
>>> print u'p\u0443\u0431.'
pуб.
他们不一样。如果要检查列表中是否存在子字符串,请将HTML视为字节,不要对其进行解码,或者对其进行解码并检查Unicode字符是否为子字符串:

if u'p\u0443\u0431.' in text:
    ...
或者更容易理解:

if u'руб.' in text:
   ...
如果源代码中包含unicode字符,则可能需要在Python脚本顶部声明字符编码:

# -*- coding: utf-8 -*-

同样,拉丁语
p
应该是西里尔语
crmk_
。这两个看起来一样,但它们是完全不同的字符。

那么
项是什么?向我们显示一个
项目
,您希望对其执行
if
语句。我想我知道你的问题是什么,但在我确定之前我不会回答。编辑。。。很抱歉,您是否可以提供一个示例
项目的打印输出,您希望它在哪里工作,但它不工作?或者提供一个明确的示例链接,以及如何从
项目
的代码。