R 计算关键字列表在字符串列中出现的总次数_R - Fatal编程技术网

R 计算关键字列表在字符串列中出现的总次数

r

R 计算关键字列表在字符串列中出现的总次数,r,R,我有一个数据框df，其中包含一个名为strings的列。本栏中的值是一些句子例如： id strings 1 "I like you" 2 "I like you, too." 3 "I like you so much 4 "I like you very much" 5 "I don't like you" 现在，我有一个关键字列表 ["I", "don't", "like", "you"] 如何制作另一个数据框，该数据框存储上一个数据框列

我有一个数据框

df

，其中包含一个名为

strings

的列。本栏中的值是一些句子

例如：

id    strings
1     "I like you"
2     "I like you, too."
3     "I like you so much
4     "I like you very much"
5     "I don't like you"

现在，我有一个关键字列表

["I", "don't", "like", "you"]

如何制作另一个数据框，该数据框存储上一个数据框列中每个关键字的出现总数

keyword      frequency
  I               5
  don't           1
  like            5
  you             5

我正在考虑使用for循环来迭代字符串列表，并为原始数据帧中的每个关键字创建一列。然后计算每行中出现的次数，最后将列相加。但是，由于关键字列表非常大，这样做的效率非常低。

我们可以在

关键字列表上使用sapply
，并使用grepl
计算出现关键字的行数
keywords <- c("I", "don't", "like", "you")
stack(sapply(keywords, function(x) sum(grepl(paste0("\\b", x, "\\b"), df$strings))))

#  values   ind
#1      5     I
#2      1 don't
#3      5  like
#4      5   you


上述方法将给出包含该关键字的行数。如果您想查找特定关键字在所有语句中出现的总次数，我们可以使用stru count
fromstringr

sapply(keywords, function(x) sum(stringr::str_count(df$strings, x)))

或者将字符串拆分为单词并计算出现的次数
sapply(keywords, function(x) sum(grepl(x, unlist(strsplit(df$strings, "\\s+")))))

sapply(keywords, function(x) sum(grepl(x, unlist(strsplit(df$strings, "\\s+")))))




[gatsby]相关文章推荐



                                                        
Gatsby 如何强制盖茨比在开发模式下更新源代码后完全重新加载页面？
gatsby 
Gatsby contentful的输出html标题包括一个带有链接的隐藏svg
gatsby 
Gatsby 盖茨比网站未在IE 11中呈现
gatsby 
Gatsby 当使用盖茨比谷歌字体插件时，仍然会看到未格式化的文本
gatsby 
                                       





随机文章推荐



                                                        
如何通过代码安装IIS
iisinstallation 
如何使用Powershell脚本执行IISRESET
iispowershell 
上载文件时，IIS在何处保存文件？
iisfile 
为什么IIS在涉及<；时会忽略web.config；身份验证模式="；“窗口”/>；？
iisauthentication 
Iis 如何在WiX权限元素中指定AppPool标识？
iiswixwindows-installer 
使用WOW64运行IIS并加载64位DLL
iis 
Iis ISAPI重写——”；将非www版本重定向到www；使用SSL规则
iisurl-rewriting 
Iis Microsoft Web平台安装程序4.0失败
iisdownloadinstallation 
Iis 使用MSBuild将Web部署到服务器
iismsbuildvisual-studio-2012 
IIS 7权限
iistfs 
URL重写到外部网站不适用于IIS 8.5，但适用于IIS 7.5
iisurl-rewriting 
Iis 104错误对蝗虫的意义
iis 
Iis 在Asp.net核心应用程序中与SignalR 2.2.1协商404
iisasp.net-coresignalr 
Iis Aurelia与虚拟目录绑定问题
更新
iisasp.net-coreaurelia 
iis应用程序池停止
iis 
Iis WMI中不提供ApplicationPool类对象属性
iisvbscriptasp-classic 
无法获取IIS webAPI
iiscors 
Iis 获取ANCM时发现本机依赖项失败错误（.Net Core 3.0）
iis 
IIS Windows身份验证在服务器上保持提示
iis 
Iis 特定于应用程序的权限设置不授予本地激活权限
iis


                                        

                                        
                                        


                                                
                                                        [r]相关推荐
                                                        
R 从闭包生成值向量
									R
							 
带R的Bucketing数据
									R
							 									Dataframe
							 
R 图例标题对齐
									R
							 
R 多面板的更高分辨率图形
									R
							 
R中矩阵的平均列值
									R
							 
R 使用“：=”和双索引创建data.table列
									R
							 
用R描述功能（设置精度数字）
									R
							 									Statistics
							 
R+MonetDB-按内存占用率分组
									R
							 
从R中的字母数字列中删除字符？
									R
							 
在Ubuntu 16.04上安装geoR
									R
							 									Ubuntu
							 
使用不同的css选择器在网页矢量上运行rvest
									R
							 									Web Scraping
							 
R ggplot2中的堆叠条形图
									R
							 
总结dplyr中其他列上使用的所有内容
									R
							 
xlsx文件中的日期格式单元格到R
									R
							 									Date
							 
R循环在数据帧中寻找最小值和最大值
									R
							 
用于R中likert比例数据的漂亮但纯文本表
									R
							 
d3所有分支相互垂直排列。r2d3闪亮
									R
							 									D3.js
							 									Tree
							 									Shiny
							 
R x/x中出错。应为：不一致阵列
									R
							 
R 如何将行添加到一行中？
									R
							 
R 向箱线图添加方法
									R
							 
R 对照组？
									R
							 
R将熔化的数据收集到单个单元中
									R
							 
在R中按空格拆分字符串
									R
							 									Regex
							 
R SAS日期和时间到正常日期和时间格式（Y-M-D H:M:S）
									R
							 									Date
							 									Time
							 									Sas
							 
如何在分位数中标记R usmap
									R
							 
如何导入"；%>；%&引用；写R包的时候？
									R
							 
标识R中包含空格的列名
									R
							 									Vector
							 
如何使用R提取绝对路径中的文件名
x
									R
							 
按R中的类别平均值除以矩阵值
									R
							 									Matrix
							 
如何删除矩阵中字符串的开头？
让我们考虑矩阵跟随：
example_matrix <- matrix(c("group1_A", "group2_B", "C", 
                           "group11_E", "group3_F", "O", 
                           "K", &q
									R
							 									String
							 									Matrix
							 
                                                        
                                                

                                                
                                                        Tags
                                                        
Dll
C#
Zend Framework
Filesystems
Javascript
Vim
Discord.js
Ubuntu
Heroku
Codenameone
Formatting
Docusignapi
R
Tabs
Openshift
Docker
Primefaces
F#
Ibm Mq
Data Structures
Jpa
Maven 2
Encoding
Speech Recognition
Next.js
Glsl
Leaflet
Azure Data Factory
Yii2
Html5 Canvas
Oauth
Oracle10g
Linker
Quickbooks
Windows Phone 8.1
Windows
Azure Functions
Prolog
Processing
Logstash
Internet Explorer 8
Asp.net Mvc 2
Serialization
Alfresco
Migration
Markdown
Tensorflow
3d
Kdb
Menu
Composer Php
Select
Linq To Sql
Groovy
Cryptography
C# 3.0
Asynchronous
Synchronization
Wso2
Methods
Twitter Bootstrap
Asp.net Mvc 4
Orchardcms
Gtk
Kibana
Google Cloud Platform
Windows 7
Vaadin
Android Emulator
Model View Controller
Time Complexity
Itext
Gulp
Javafx 2
Windows Phone 7
Kubernetes
Twilio
Meteor
Prometheus
Boost
Artifactory
Windows Phone
Jasper Reports
Reflection
Timer
Cluster Computing
Entity Framework 4
Blazor
Teradata
Vbscript
Webpack
Programming Languages
Actions On Google
Objective C
Exception Handling
Llvm
Sms
Sap
Asp.net Mvc 5
Fluent Nhibernate
Ipython
Jwt
Adobe
Applescript
Compiler Construction
Autodesk Forge
Geometry
Sharepoint
Opencart
Phpstorm
Doctrine Orm
Swagger
Google Sheets
Angular6
Memory
Salesforce
Windows Services
.htaccess
Web Scraping
Google Cloud Dataflow
Office Js
Bootstrap 4
Colors
Parallel Processing
Asp.net Core
Silverlight 4.0
Omnet++
Mod Rewrite
Sql Server 2012
Ruby On Rails 3.1
Ag Grid
Devexpress
Parameters
Google Visualization
Odoo
Mdx
Gdb
Three.js
Opengl Es
Cobol
Zsh
Calendar
Rally
Tcp
Sip
.net
Plugins
Tkinter
Openlayers
Android Layout
Inheritance
Tridion
Gnuplot
Rabbitmq
Azure Cosmosdb
Scala
Nunit
Amazon Dynamodb
Dialogflow Es
Google Chrome
Jira
Nest
Transactions
Security
Forms
Ssis
Log4j
Vhdl
Domain Driven Design
Grid
Swift
Filter
Struts2
Twitter Bootstrap 3
Pandas
Perforce
Lambda
Bots
Oop
Tcl
Couchdb
Server
Nservicebus
Arduino
Dependency Injection
Yaml
Version Control
Dom
Url
Visual Studio
Jsf
Zend Framework2
Mobile
Rest
Ios5
Loopbackjs
Rss
C++ Cli
Webstorm
Ms Office
Xslt


                

                        
						
                        
                                
                                        
                                                
                                                        
                                                                Copyright © 2024. All Rights Reserved by  - Fatal编程技术网