tidytext错误（is_corpus_df（corpus）中的错误：ncol（corpus）>=2不正确）_R_Tidytext

tidytext错误（is_corpus_df（corpus）中的错误：ncol（corpus）>=2不正确）

tidytext错误（is_corpus_df（corpus）中的错误：ncol（corpus）>=2不正确）,r,tidytext,R,Tidytext,我试图做一些基本的文本分析。安装“tidytext”软件包后，我试图取消对数据帧的测试，但一直出现错误。我假设我丢失了一些软件包，但我不确定如何找出哪一个。如有任何建议，我们将不胜感激您的列文本实际上是dataframe text_df中的一个dataframe，因此您试图将非最新标记应用于dataframe，但只有将其应用于原子向量字符、整数、双精度、逻辑等时，它才会起作用要解决此问题，您可以执行以下操作： library(dplyr) library(tidytext) text_df

我试图做一些基本的文本分析。安装“tidytext”软件包后，我试图取消对数据帧的测试，但一直出现错误。我假设我丢失了一些软件包，但我不确定如何找出哪一个。如有任何建议，我们将不胜感激

您的列文本实际上是dataframe text_df中的一个dataframe，因此您试图将非最新标记应用于dataframe，但只有将其应用于原子向量字符、整数、双精度、逻辑等时，它才会起作用

要解决此问题，您可以执行以下操作：

library(dplyr)
library(tidytext)

text_df <- text_df %>% 
  mutate_all(as.character) %>% 
  unnest_tokens(word, text)

这给了你：

# A tibble: 186 x 2
   line  word     
   <chr> <chr>    
 1 1     c        
 2 1     furloughs
 3 1     students 
 4 1     do       
 5 1     not      
 6 1     have     
 7 1     their    
 8 1     books    
 9 1     or       
10 1     needed   
# ... with 176 more rows

你能用dputheadtext\u df提供一个text\u df样本吗？>dputheadtext\u df structurelistline=1:6，text=structurelisttext=cfurlough，学生没有书或所需材料，工作多而报酬少，没有，照顾免疫功能受损的配偶，做母亲、学校老师、研究人员和教授，class=data.frame，row.names=cNA，-6L，row.names=cNA，-6L，class=ctbl_-df，tbl，data.frame

library(dplyr)
library(tidytext)

text_df <- text_df %>% 
  mutate_all(as.character) %>% 
  unnest_tokens(word, text)

# A tibble: 186 x 2
   line  word     
   <chr> <chr>    
 1 1     c        
 2 1     furloughs
 3 1     students 
 4 1     do       
 5 1     not      
 6 1     have     
 7 1     their    
 8 1     books    
 9 1     or       
10 1     needed   
# ... with 176 more rows