R 基于变量中的字数创建变量

R 基于变量中的字数创建变量,r,R,我有一个包含国家及其宪法的数据集。我想知道是否有办法创建一个变量来显示“上帝”这个词在宪法变量中出现了多少次 数据集如下所示: Country Year Preamble Afghanistan 2004 In the name of Allah... Albania 1998 We, the people of Albania... ... .... ....... 等等等等。我特别感兴趣的是知道是否有一个函数可以计算一个特定单词在一个分类变量中被使用的次数,或者是否有更好的方法来完成我试图

我有一个包含国家及其宪法的数据集。我想知道是否有办法创建一个变量来显示“上帝”这个词在宪法变量中出现了多少次

数据集如下所示:

Country Year Preamble
Afghanistan 2004 In the name of Allah...
Albania 1998 We, the people of Albania...
... .... .......

等等等等。我特别感兴趣的是知道是否有一个函数可以计算一个特定单词在一个分类变量中被使用的次数,或者是否有更好的方法来完成我试图做的事情

如果您想计算“Al”在上述数据集中出现的次数,您可以像这样使用grep:

仅针对一列:

 grep("Al", data$Preamble)
对于所有列:

 lapply(data, function(x) grep("Al", x))
  $`Country`
  [1] 2

  $Year
  integer(0)

  $Preamble
  [1] 1 2

这将告诉您在哪些行和列中找到匹配项,即一个在“国家”列中,两个在“序言”列中

欢迎使用SO。点击问题下方的“r”。转到“信息”选项卡,阅读关于如何指定问题(包括样本数据)的一些期望。那会帮助你帮助别人帮助你。此外,这是一个相当广泛的问题,你在一个问题上问了2个问题,所以你可能想考虑一下把它分解一下,并把所说的样本数据(或者链接到一个有信誉的文件共享站点或GITHUB/GITLAB上的样本)。对不起,我真的试图弄清楚。我对编码非常陌生,很难描述我试图实现的目标。你有什么建议可以让我说得更具体一些吗?你需要做的是提出你的问题。特别是,使用
dput(您的_-df)
共享您的数据示例。请用此信息编辑问题(不要在评论中发布数据)@IanChamberlin我会让它更直接。我要求您遵循的流程将转到此处:。其中一个链接是Conor提供的。请做一些基础阅读,学习如何让人们更容易帮助你。