Python 视觉化文字袋时的海生错误

Python 视觉化文字袋时的海生错误,python,pandas,seaborn,bag,Python,Pandas,Seaborn,Bag,我得到了这个提示,所以我问: 现在有了矩阵表示法(行是乘积, 列是每个唯一单词的计数),您可以筛选 将矩阵分解为最常用的单词。我鼓励你采取行动 看看字数的分布情况。我们将使用seaborn 为此,请按如下方式导入: 作为sns导入seaborn 假设调用了保存字数矩阵的pd.DataFrame df,sns.distplot(df.sum())应该可以做到这一点。选择一些截止点 这似乎保留了大量的计数,但并没有 包括许多低计数的单词。它可以是任意的,但事实并非如此 现在真的很重要。字数矩阵是您的

我得到了这个提示,所以我问:

现在有了矩阵表示法(行是乘积, 列是每个唯一单词的计数),您可以筛选 将矩阵分解为最常用的单词。我鼓励你采取行动 看看字数的分布情况。我们将使用seaborn 为此,请按如下方式导入:

作为sns导入seaborn

假设调用了保存字数矩阵的pd.DataFrame df,
sns.distplot(df.sum())
应该可以做到这一点。选择一些截止点 这似乎保留了大量的计数,但并没有 包括许多低计数的单词。它可以是任意的,但事实并非如此 现在真的很重要。字数矩阵是您的输入数据,或 也称为预测变量。在机器学习中,这是经常发生的 调用输入矩阵或向量
X

我设法为每一个专栏写了一袋字(BOG)。代码如下:

df['BOW'] = df.Review2.str.split().apply(Counter)
但是当我尝试按照建议可视化(
sns.distplot(df['BOW'].sum())
)时,我得到了以下错误:

/:“Counter”和“int”的操作数类型不受支持


感谢您阅读本文并祝您愉快:)

df.Review2包含哪些内容。您能提供一个例子吗?请参阅。@ImportanceOfBeingErnest我添加了一个编辑