R 计算包含定义的较短字符串的字符串数的有效方法_R - Fatal编程技术网

R 计算包含定义的较短字符串的字符串数的有效方法

r

R 计算包含定义的较短字符串的字符串数的有效方法,r,R,我有一个包含短字符串的字符向量： short <- c("aaa", "bah", "dju", "kjs") short我们循环通过“short”向量，得到stru计数，并将其减少为单个逻辑向量，得到总和 library(stringr) sum(Reduce(`|`, lapply(short, str_count, string = long))) #[1] 4 stru count使用stringi函数，这不取决于向量的长度，使用上述数据只需0.09s system.time(

我有一个包含短字符串的字符向量：

short <- c("aaa", "bah", "dju", "kjs")

short我们循环通过“short”向量，得到stru计数
，并将其减少为单个逻辑向量，得到总和

library(stringr)
sum(Reduce(`|`, lapply(short, str_count, string = long)))
#[1] 4

stru count
使用stringi
函数，这不取决于向量的长度
，使用上述数据只需0.09s
system.time(sum(sapply(regmatches(long, gregexpr(paste(short, collapse = "|"), long, ignore.case = F, perl = T)), length) >= 1))
   User      System verstrichen 
   0.09        0.00        0.09

数据：
库（gsubfn）
u这在我的笔记本电脑上大约需要0.12秒，long
和short
来自结尾的注释，长度分别为10000和1000。没有使用包——只用于生成示例数据
system.time(num <- length(grep(paste(short, collapse = "|"), long, perl = TRUE)))
   user  system elapsed 
   0.08    0.00    0.12 

system.time（num我知道我在问题中没有问这个问题，但是我如何分别计算每个short
字符串的频率？@JackArnestad它应该是sapply（short，function（x）sum（stru count（long，x）））
library(gsubfn)
u <- "http://www.gutenberg.org/files/4300/4300-0.txt"
joyce <- readLines(u)
joycec <- paste(joyce, collapse = " ") 
words <- strapplyc(joycec, "\\w+")[[1]]
short <- head(words, 1000)
long <- head(words, 10000)

system.time(num <- length(grep(paste(short, collapse = "|"), long, perl = TRUE)))
   user  system elapsed 
   0.08    0.00    0.12 

library(gsubfn)

u <- "http://www.gutenberg.org/files/4300/4300-0.txt"
joyce <- readLines(u)
joycec <- paste(joyce, collapse = " ") 
words <- strapplyc(joycec, "\\w+")[[1]]
short <- head(words, 1000)
long <- head(words, 10000)




[jekyll]相关文章推荐



                                                        
Jekyll Front Matter中的自定义变量
jekyll 
将广告添加到Jekyll帖子列表中
jekyll 
Jekyll 我如何为杰基尔建立一个画廊标签？
jekyll 
Jekyll 我怎样才能停下来；“杰基尔建筑”；从覆盖输出目录中的现有文件开始？
jekyll 
Jekyll生成空文件
jekyll 
无法在jekyll中格式化
jekyll 
Jekyll 杰基尔邮报摘录：如何删除第一段
jekyll 
Jekyll 对于循环，在div中每两个立柱包裹一次
jekyll 
第二个Jekyll站点上的换行符不起作用
jekyll 
如何将linkedin链接添加到github上的jekyll页面？
jekyll 
Jekyll 杰基尔在本地工作，但不在github工作。要导入的文件找不到或不可读：最小值
jekyll 
如何对已排序的Jekyll集合进行分页？
jekyll 
Jekyll 杰基尔：包含不同级别的菜单会产生问题
jekyll 
Jekyll模板/剪贴画/快捷方式
jekyll 
Jekyll 杰基尔是否阅读《每一篇文章》+；在生成站点之前使用元数据？
jekyll 
Jekyll 是否可以为集合创建单个文件？
jekyll 
Jekyll 如何在可变的子目录中生成整个网站？（杰基尔）
jekyll 
Jekyll 如何在液体中取消设置变量？
jekyll 
Jekyll无法从集合中找到包含文件
jekyll 
Jekyll 如何在github页面中禁用排版？
jekyll 
                                       





随机文章推荐



                                                        
Pandas nan、浮点和整数
pandas 
Pandas 通过切片将元组作为元素填充字段
pandas 
Pandas 将值的子集分组到每个键的单行列表中，但如果条件为true，则不添加任何值
pandas 
Pandas 按某些列分组，并计算一列和另一列之间的最大差值
pandas 
Pandas 在数据帧中的阈值处切断值
pandasdataframe 
Pandas 每月特定日期的日期范围
pandas 
Pandas 蛇人与熊猫
pandas 
Pandas 多维键使用.loc和布尔值时出错
pandas 
pandas groupby然后聚合结果顺序不可重复？
pandas 
Pandas 函数确定更改点日期
pandas 
Pandas 按日期索引对齐多个系列
pandasdataframe 
Pandas 以10分钟的间隔对数据帧进行分组
pandas 
Pandas 基于条件创建新列，并从其他列中提取相应的值。熊猫数据帧
pandas 
Pandas 使用python将多个附加值转换为panda数据帧
pandasnumpydataframedate 
Pandas 无法使用索引就地删除行
pandas 
Pandas 如何将numpy一维数组转换为熊猫系列或数据帧
pandasnumpydataframe 
Pandas 查找字段A是字段B的子字符串的行
pandas 
Pandas pd.merge后使用另一个键进行进一步匹配
pandasdataframemerge 
Pandas 条件和数据帧
pandasdataframe 
Pandas 将每日OHLC重新采样为每周，其中周五为第一天，周四为最后一天？
pandas


                                        

                                        
                                        


                                                
                                                        [r]相关推荐
                                                        
R 转置数据帧
									R
							 									Dataframe
							 
R：提取“；“干净”；使用RCurl刮取的网页中的UTF-8文本
									R
							 									Web Scraping
							 
从R中的example（）中获取函数
									R
							 
R 复杂函数的约束优化
									R
							 									Optimization
							 
R 无法存储循环的结果
									R
							 									Function
							 									Loops
							 
R 对'没有可见的绑定<<-'；分配
									R
							 
R 向多个散点图添加回归线
									R
							 
R ggplot2中的面和多个数据集
									R
							 
R 在表中搜索精确值
									R
							 
R 无法从简单数据集生成直方图
									R
							 
R:plotly：如何自定义地图打印上的范围？
									R
							 									Dictionary
							 
R 查找最少两列的行
									R
							 
RDCOMClient+；Outlook电子邮件
									R
							 									Outlook
							 
R nlm函数因解析Hessian而失败
									R
							 
基于数量的滑动比例尺价格在R中的应用
									R
							 
使用purrr捕捉mapply的错误
									R
							 
R 更改栏宽在geom_栏功能中不起作用
									R
							 
R 关于过热包装中的ggsave
									R
							 
在R data.table矢量化函数中，是否能够引用.SD列之外的列？
									R
							 
R 无法格式化计算的滑块最小值和最大值以减少小数位数
									R
							 									Shiny
							 
循环不适用于R中的字符列
									R
							 									List
							 									Function
							 									Loops
							 									Class
							 
R 基于条件的滞后
									R
							 
在应用程序中加载非基本R数据集
									R
							 									Shiny
							 
purr map_df输出一个新的嵌套数据帧列
									R
							 									For Loop
							 
R可先按一列，然后按另一列对行进行排序
									R
							 
在R中，使用列表中的向量命名列后，如何找到匹配的列名（grep和match-give-integer（0），NA）？
									R
							 
如何在R中导航较长的选项卡？
									R
							 									Shiny
							 
将带有两个不同后缀的dataframe列堆叠成两列，最好使用tidyverse
									R
							 
R 在ggplot2的每个面上覆盖相同的线图
									R
							 
R 无法使用我拥有的数据框创建注释图表（googlevis）
									R
							 
                                                        
                                                

                                                
                                                        Tags
                                                        
Wolfram Mathematica
Rabbitmq
Workflow
Canvas
Imagemagick
Django
C#
Gremlin
Debugging
Ssis
Lucene
Google Cloud Platform
Clang
Twig
Matplotlib
Asp.net Mvc
Dask
Tensorflow
Opengl Es
Iframe
Azure
Silverlight 4.0
Pip
Ibm Cloud
Stata
Next.js
Tabs
Twitter Bootstrap
Ios
Jsp
Caching
Audio
Keycloak
Iis
Asp.net
Ffmpeg
Phpunit
Sequelize.js
Here Api
Spring Batch
Tkinter
Cocos2d Iphone
Linq
Session
Titanium
Doxygen
Matrix
Rdf
Asp.net Mvc 5
Ionic Framework
Vector
Orientdb
Reactjs
Graphics
Z3
Postgresql
Mercurial
Vhdl
Processing
Latex
Botframework
Yocto
Jekyll
Openshift
Com
If Statement
Single Sign On
Http
Snowflake Cloud Data Platform
Sails.js
Drupal 6
Visual Studio 2013
Menu
Macos
C# 3.0
Silverlight
Visual Studio 2010
Authentication
Maven 2
Properties
Login
Swift
Enums
Octave
Cocoa
Qt4
Umbraco
Msbuild
Rest
Windows 7
Batch File
Puppet
Azure Ad B2c
Paypal
Printing
Teamcity
Sencha Touch
Nest
Jdbc
Python 3.x
Math
Artifactory
Twitter
Instagram
String
Solr
Dataframe
Symfony1
Java
Common Lisp
Continuous Integration
Google Maps
Data Binding
Apache Spark
Logstash
Dotnetnuke
Websphere
Frameworks
Three.js
Excel Formula
Ignite
Prestashop
Fullcalendar
Azure Active Directory
Javafx 2
Jetty
Api
Llvm
Typo3
Ansible
Groovy
Mongoose
Erlang
Actionscript
Nhibernate
Xna
Architecture
Macros
Cakephp
Linux
Exception
Google Cloud Storage
Time
.net Core
Debian
User Interface
Dialogflow Es
Concurrency
Https
Notifications
Go
Apache Storm
Perforce
Awk
Windows Store Apps
Google Plus
Entity Framework Core
Google Api
Orm
Build
Reflection
Charts
Date
Firebase
Itext
Cluster Computing
Filter
Web Applications
Terminal
Listview
.htaccess
Android Layout
Shiny
.net
Uwp
Facebook
Pandas
Google Cloud Dataflow
Data Structures
Triggers
Yii2
Mongodb
Io
Monitoring
Arm
Dns
Asp.net Mvc 4
Visual C++
Yaml
Youtube Api
Xpath
Embedded
Rust
Memory Leaks
Drools
Activemq
Ios6
Swift2
Entity Framework 4
Django Models
Visual Studio 2017


                

                        
						
                        
                                
                                        
                                                
                                                        
                                                                Copyright © 2024. All Rights Reserved by  - Fatal编程技术网