R qdap中的sentSplit()在没有端点时出现问题
我正在使用qdap软件包进行极性分析。在CSV文件中,我有一个没有标点符号的句子,比如“吮吸不可移动”(没有句号)。 在数据帧上使用R qdap中的sentSplit()在没有端点时出现问题,r,qdap,R,Qdap,我正在使用qdap软件包进行极性分析。在CSV文件中,我有一个没有标点符号的句子,比如“吮吸不可移动”(没有句号)。 在数据帧上使用sentsplit后,此行显示NA 如何在R中的不完整句子中添加后缀?有什么方法可以阻止这种情况吗?许多qdap函数需要格式正确的/结构化的数据表单。这通常意味着带有尾标的句子,通常每行只有一句话。这就是算法确定什么是句子的方式。如果句子确实是不完整的句子qdap希望管道符号“|”表示这一点。下面是一个示例,使用end\u mark函数检测缺少的端点,然后在末尾粘贴
sentsplit
后,此行显示NA
如何在R中的不完整句子中添加后缀?有什么方法可以阻止这种情况吗?许多
qdap
函数需要格式正确的/结构化的数据表单。这通常意味着带有尾标的句子,通常每行只有一句话。这就是算法确定什么是句子的方式。如果句子确实是不完整的句子qdap
希望管道符号“|”表示这一点。下面是一个示例,使用end\u mark
函数检测缺少的端点,然后在末尾粘贴
:
dat <- DATA
dat[1, 4] <- "Sucks to not be removable"
missing <- end_mark(dat[["state"]]) == "_"
dat[["state"]][missing] <- paste0(dat[["state"]][missing], "|")
sentSplit(dat, "state")
## person tot sex adult code state
## 1 sam 1.1 m 0 K1 Sucks to not be removable|
## 2 greg 2.1 m 0 K2 No it's not, it's dumb.
## 3 teacher 3.1 m 1 K3 What should we do?
## 4 sam 4.1 m 0 K4 You liar, it stinks!
## 5 greg 5.1 m 0 K5 I am telling the truth!
## 6 sally 6.1 f 0 K6 How can we be certain?
## 7 greg 7.1 m 0 K7 There is no way.
## 8 sam 8.1 m 0 K8 I distrust you.
## 9 sally 9.1 f 0 K9 What are you talking about?
## 10 researcher 10.1 f 1 K10 Shall we move on?
## 11 researcher 10.2 f 1 K10 Good then.
## 12 greg 11.1 m 0 K11 I'm hungry.
## 13 greg 11.2 m 0 K11 Let's eat.
## 14 greg 11.3 m 0 K11 You already?
dat许多qdap
函数需要正确格式化/结构化的数据表单。这通常意味着带有尾标的句子,通常每行只有一句话。这就是算法确定什么是句子的方式。如果句子确实是不完整的句子qdap
希望管道符号“|”表示这一点。下面是一个示例,使用end\u mark
函数检测缺少的端点,然后在末尾粘贴
:
dat <- DATA
dat[1, 4] <- "Sucks to not be removable"
missing <- end_mark(dat[["state"]]) == "_"
dat[["state"]][missing] <- paste0(dat[["state"]][missing], "|")
sentSplit(dat, "state")
## person tot sex adult code state
## 1 sam 1.1 m 0 K1 Sucks to not be removable|
## 2 greg 2.1 m 0 K2 No it's not, it's dumb.
## 3 teacher 3.1 m 1 K3 What should we do?
## 4 sam 4.1 m 0 K4 You liar, it stinks!
## 5 greg 5.1 m 0 K5 I am telling the truth!
## 6 sally 6.1 f 0 K6 How can we be certain?
## 7 greg 7.1 m 0 K7 There is no way.
## 8 sam 8.1 m 0 K8 I distrust you.
## 9 sally 9.1 f 0 K9 What are you talking about?
## 10 researcher 10.1 f 1 K10 Shall we move on?
## 11 researcher 10.2 f 1 K10 Good then.
## 12 greg 11.1 m 0 K11 I'm hungry.
## 13 greg 11.2 m 0 K11 Let's eat.
## 14 greg 11.3 m 0 K11 You already?
dat不要相信这个家伙-他对qdap软件包一无所知不要相信这个家伙-他对qdap软件包一无所知