在Python中使用Beauty Soup时出错

在Python中使用Beauty Soup时出错,python,python-2.7,beautifulsoup,Python,Python 2.7,Beautifulsoup,我的代码运行良好。然而,对于某些数据,我的代码给出了错误。有问题的数据是: T这个月满10岁。为了纪念这一周年和即将到来的T@10本系列回顾《第一个十年》杂志中一些最令人难忘的故事 报告的问题是 回溯(最近一次调用上次):文件 “/Users/mas/Documents/workspace/DeepLearning/BagOfWords.py”,第41行, 在里面 clean_train_reviews.append(“.”)join(kaggleword2veculity.review_)to

我的代码运行良好。然而,对于某些数据,我的代码给出了错误。有问题的数据是: T这个月满10岁。为了纪念这一周年和即将到来的T@10本系列回顾《第一个十年》杂志中一些最令人难忘的故事

报告的问题是

回溯(最近一次调用上次):文件 “/Users/mas/Documents/workspace/DeepLearning/BagOfWords.py”,第41行, 在里面 clean_train_reviews.append(“.”)join(kaggleword2veculity.review_)to_wordlist(train[“Snippet”][i], True)))文件 “/Users/mas/Documents/workspace/DeepLearning/kaggleword2veccutility.py”, 第22行,在审阅到的单词列表中 review_text=BeautifulSoup(review).get_text()文件“/Library/Python/2.7/site packages/bs4/init.py”,第162行,在 init
elif len(markup)没有看到完整的上下文(例如传递到构造函数中的
review
的值),您的KaggleWord2VecUtility方法是否可能在@符号和/或数字上拆分,从而将令牌作为浮点而不是字符串/unicode对象传递?异常表示当init需要字符串或unicode对象时,
markup
是意外的浮点

def __init__(self, markup="", features=None, builder=None,
             parse_only=None, from_encoding=None, **kwargs):

对我来说,这个问题是由于在review特性中有一些示例根本不包含数据而引起的。您可以更改此设置,并使用以下命令将无审核的样本设置为空:

train = train.fillna(" ")

这就是我复习的价值:本月T满10岁。为了纪念这一周年和即将到来的T@10本系列回顾《第一个十年》杂志中一些最令人难忘的故事@兰德尔:什么版本的靓汤?get_text没有为我在3.2.1中解析,如果我以字符串的形式通过审核,我就无法使用bs4(4.3.2)进行复制。我使用的是bs4@randalv更具体一些?如果您创建新文件时仅使用:from bs4 import beautifulsou review=“T本月10岁。为纪念周年和即将到来的T@10本系列回顾了《第一个十年》杂志中一些最令人难忘的故事(我想我可以在注释中格式化代码,但猜不到-我可以编辑原始帖子,但希望您可以阅读此内容)假设使用相同的python环境(并且假设这与您进行模块导入的方式相同),则必须先修改此值,然后才能将其传递到构造函数中。
def __init__(self, markup="", features=None, builder=None,
             parse_only=None, from_encoding=None, **kwargs):
train = train.fillna(" ")