Python 将数据帧的一列转换为spacy文档_Python_Nlp_Spacy

Python 将数据帧的一列转换为spacy文档

python nlp

Python 将数据帧的一列转换为spacy文档,python,nlp,spacy,Python,Nlp,Spacy,如何将数据帧的一列转换为SPACY文档，以便分析词性等我试过： df['new_col'] = df['Old_col'].apply(lambda x: nlp(x)) 如何获取新列的POC计数？我试过了但我得到的错误是： AttributeError:“Series”对象没有“count\u by”属性谢谢你的第一句话 df['new_col'] = df['Old_col'].apply(lambda x: nlp(x)) 应该有用（至少对我用过的每一次都有用）看起来你在第

如何将数据帧的一列转换为SPACY文档，以便分析词性等

我试过：

df['new_col'] = df['Old_col'].apply(lambda x: nlp(x))

如何获取新列的POC计数？我试过了

但我得到的错误是：

AttributeError:“Series”对象没有“count\u by”属性

谢谢

你的第一句话

df['new_col'] = df['Old_col'].apply(lambda x: nlp(x))

应该有用（至少对我用过的每一次都有用）

看起来你在第二节要做的是计算文档中所有标记的词性

如果是这样的话，类似这样的方法应该有效：

def pos_count(spacy_doc):
    num_pos = [t.pos_ for t in doc if t.pos_ != None]
    return len(num_pos)

df_msg['new_col'].apply(lambda c: pos_count(spacy_doc = c))

从你第二次的窃笑中确实不清楚你想要什么

def pos_count(spacy_doc):
    num_pos = [t.pos_ for t in doc if t.pos_ != None]
    return len(num_pos)

df_msg['new_col'].apply(lambda c: pos_count(spacy_doc = c))