R 感伤-不同的文本分区会产生不同的结果

R 感伤-不同的文本分区会产生不同的结果,r,sentimentr,R,Sentimentr,使用感伤器分析文本: 我已经很久没有难过了。 我今天非常高兴。 今天天气不错 我首先用一个句子一个句子地划分文本 library(sentimentr) ase1 <- c( "I haven't been sad in a long time.", "I am extremely happy today.", "It's a good day." ) part1 <- get_sentences(ase1)

使用感伤器分析文本:

我已经很久没有难过了。 我今天非常高兴。 今天天气不错

我首先用一个句子一个句子地划分文本

library(sentimentr)

ase1 <- c(
  "I haven't been sad in a long time.",
  "I am extremely happy today.",
  "It's a good day."
)

part1 <- get_sentences(ase1)
sentiment(part1)

   element_id sentence_id word_count sentiment
1:          1           1          8 0.1767767
2:          2           1          5 0.6037384
3:          3           1          4 0.3750000
库(感伤器)

ase1不完全相同的文本。在第一个示例中使用
,但在第二个文本中使用
。这些是完全不同的引用,在文本挖掘中具有不同的含义

下面的示例返回与第一个示例相同的结果

ase2 <- c(
  "I haven't been sad in a long time. I am extremely happy today. It's a good day.")

part2 <- get_sentences(ase2)
sentiment(part2)
   element_id sentence_id word_count sentiment
1:          1           1          8 0.1767767
2:          1           2          5 0.6037384
3:          1           3          4 0.3750000
ase2
ase2 <- c(
  "I haven't been sad in a long time. I am extremely happy today. It's a good day.")

part2 <- get_sentences(ase2)
sentiment(part2)
   element_id sentence_id word_count sentiment
1:          1           1          8 0.1767767
2:          1           2          5 0.6037384
3:          1           3          4 0.3750000