Python 将数据帧的一列转换为spacy文档

Python 将数据帧的一列转换为spacy文档,python,nlp,spacy,Python,Nlp,Spacy,如何将数据帧的一列转换为SPACY文档,以便分析词性等 我试过: df['new_col'] = df['Old_col'].apply(lambda x: nlp(x)) 如何获取新列的POC计数? 我试过了 但我得到的错误是: AttributeError:“Series”对象没有“count\u by”属性 谢谢 你的第一句话 df['new_col'] = df['Old_col'].apply(lambda x: nlp(x)) 应该有用(至少对我用过的每一次都有用) 看起来你在第

如何将数据帧的一列转换为SPACY文档,以便分析词性等

我试过:

df['new_col'] = df['Old_col'].apply(lambda x: nlp(x))
如何获取新列的POC计数? 我试过了

但我得到的错误是:

AttributeError:“Series”对象没有“count\u by”属性

谢谢

你的第一句话

df['new_col'] = df['Old_col'].apply(lambda x: nlp(x))
应该有用(至少对我用过的每一次都有用)

看起来你在第二节要做的是计算文档中所有标记的词性

如果是这样的话,类似这样的方法应该有效:

def pos_count(spacy_doc):
    num_pos = [t.pos_ for t in doc if t.pos_ != None]
    return len(num_pos)

df_msg['new_col'].apply(lambda c: pos_count(spacy_doc = c))
从你第二次的窃笑中确实不清楚你想要什么

def pos_count(spacy_doc):
    num_pos = [t.pos_ for t in doc if t.pos_ != None]
    return len(num_pos)

df_msg['new_col'].apply(lambda c: pos_count(spacy_doc = c))