Python 视觉化文字袋时的海生错误_Python_Pandas_Seaborn_Bag

Python 视觉化文字袋时的海生错误

python pandas

Python 视觉化文字袋时的海生错误,python,pandas,seaborn,bag,Python,Pandas,Seaborn,Bag,我得到了这个提示，所以我问：现在有了矩阵表示法（行是乘积，列是每个唯一单词的计数），您可以筛选将矩阵分解为最常用的单词。我鼓励你采取行动看看字数的分布情况。我们将使用seaborn 为此，请按如下方式导入：作为sns导入seaborn 假设调用了保存字数矩阵的pd.DataFrame df，sns.distplot（df.sum（））应该可以做到这一点。选择一些截止点这似乎保留了大量的计数，但并没有包括许多低计数的单词。它可以是任意的，但事实并非如此现在真的很重要。字数矩阵是您的

我得到了这个提示，所以我问：

现在有了矩阵表示法（行是乘积，列是每个唯一单词的计数），您可以筛选将矩阵分解为最常用的单词。我鼓励你采取行动看看字数的分布情况。我们将使用seaborn 为此，请按如下方式导入：

作为sns导入seaborn

假设调用了保存字数矩阵的pd.DataFrame df，

sns.distplot（df.sum（））

应该可以做到这一点。选择一些截止点这似乎保留了大量的计数，但并没有包括许多低计数的单词。它可以是任意的，但事实并非如此现在真的很重要。字数矩阵是您的输入数据，或也称为预测变量。在机器学习中，这是经常发生的调用输入矩阵或向量

我设法为每一个专栏写了一袋字（BOG）。代码如下：

df['BOW'] = df.Review2.str.split().apply(Counter)

但是当我尝试按照建议可视化（

sns.distplot（df['BOW'].sum（））

）时，我得到了以下错误：

/：“Counter”和“int”的操作数类型不受支持

感谢您阅读本文并祝您愉快：）

df.Review2包含哪些内容。您能提供一个例子吗？请参阅。@ImportanceOfBeingErnest我添加了一个编辑