String 如何用更快的东西取代agrep？_String_Grep_Match - Fatal编程技术网

String 如何用更快的东西取代agrep？

string grep

String 如何用更快的东西取代agrep？,string,grep,match,String,Grep,Match,我目前正在使用近似grep（Agrep）来获得数千个短字符串列表与数百万个长字符串列表之间的匹配任务：在“ABCDE”中找到“ABCD”，“…XYZABCDEFG…”甚至“…XYZqBCDEFG…”（1不匹配） agrep工作得很好，但对于我必须做的事情来说太慢了（字符串匹配与1不匹配）。有人能推荐一个更快的替代方案吗？我不知道这个答案的性能与您现在的相比会如何从 one_mismatch_regex() { local patterns for ((i=0; i <

我目前正在使用近似grep（Agrep）来获得数千个短字符串列表与数百万个长字符串列表之间的匹配

任务：

在“ABCDE”中找到“ABCD”，“…XYZABCDEFG…”甚至“…XYZqBCDEFG…”（1不匹配）

agrep工作得很好，但对于我必须做的事情来说太慢了（字符串匹配与1不匹配）。有人能推荐一个更快的替代方案吗？

我不知道这个答案的性能与您现在的相比会如何

从

one_mismatch_regex() {
    local patterns
    for ((i=0; i < ${#1}; i++)); do
        patterns+=( "${1:0:i}.${1:i+1}" )
    done
    local IFS='|'
    echo "${patterns[*]}"
}

因此：

阅读搜索词时

；做
一个正则表达式“$search\u word”
已完成


while循环将搜索词列表转换为正则表达式，该正则表达式将匹配一个不匹配的词，并将正则表达式写入stdout。然后，grep将使用扩展正则表达式匹配（-E
）并从名为-
（stdin）的文件中读取正则表达式。您需要更明确地说明“必须做什么”。使用示例更新感谢您的帮助。它看起来需要相同的时间：17:08:58.450521007+0100 end_regex.txt 17:08:20.494522421+0100 start_regex.txt 17:07:14.41852483+0100 end_agrep.txt 17:06:39.930526168+0100 start_agrep.txt agrep为35秒，regex为38秒
$ one_mismatch_regex foobar
.oobar|f.obar|fo.bar|foo.ar|foob.r|fooba.

while read search_word; do
    one_mismatch_regex "$search_word"
done < searches.txt |
grep -E -f - data.txt




[grep]相关文章推荐



                                                        
在grep中有没有办法找出有多少行与grep结果相匹配？
grep 
python中的传递值grep命令
grep 
文件中的grep通配符
grep 
Grep 在Linux中查找包含完全相同字符的单词
grep 
Jenkinsfile如何在变量中grep文件名
grep 
grep lookbehind，锚定意外结果
grep 
如何使用grep匹配搜索字符串的部分匹配
greptcl 
                                       





随机文章推荐



                                                        
可以用整数索引CUDA纹理吗
cuda 
cudaErrorInvalidResourceHandle？
cuda 
用CUDA求解二维扩散（热）方程
cuda 
CUDA中二维扩散（热）方程解的优化
cuda 
忽略'CUDA\u VISIBLE\u DEVICES'环境变量
cuda 
纹理提取比直接全局访问慢，第7章自；Cuda举例说明”；书
cuda 
CUDA中所有线程的全局变量
cuda 
Cuda 使用SM核的gpu卡块处理模式
cuda 
Cuda 在内核中调用cublas
cuda 
cudaMemset未能将所有值设置为0
cuda 
Cuda 用Fortran&；库达
cudafortran 
Cuda 袖口双到复杂
cuda 
Cuda 是否可以在NVVP上自动重复多次执行？
cuda 
cuda样本汇编'；opensuse 13.1'；
cuda 
Cuda 不能声明超过512个动态共享内存浮动
cuda 
Cuda计算模式和“CUBLAS\u状态\u分配\u失败”
cuda 
如何从CUDA内核代码中的字符数组元素打印单词？
cuda 
Cuda 如何对更大阵列中的特定感兴趣区域（ROI）执行cufft fwd和inv变换？
cuda 
如何从python项目中禁用或删除numba和cuda？
cuda 
CUDA原子操作线程级还是块级？
cuda


                                        

                                        
                                        


                                                
                                                        [string]相关推荐
                                                        
String Scala原始字符串：每行开头的额外选项卡
									String
							 									Scala
							 
String IronRuby使用WebClient下载文件；存储空间不足，无法处理此命令；
									String
							 
String 规范化分类术语的精确算法？
									String
							 
String 将Common Lisp中的宏参数视为（区分大小写）字符串
									String
							 									Common Lisp
							 
String 指向具有二维数组的结构的指针
									String
							 									Pointers
							 
String 这是不是；“字符串模式匹配”；算法？还是别的什么？
									String
							 									Algorithm
							 									Language Agnostic
							 
String 带or运算符的字符串赋值
									String
							 
String Scala最多包含指定字符的字符串
									String
							 									Scala
							 
String perl字符串与另一个字符串完全匹配
									String
							 									Perl
							 
String 按字符拆分文件basename
									String
							 									Matlab
							 									Path
							 
String 如果我更改schema.xml，那么在Solr中是否需要重新索引？
									String
							 									Solr
							 									Types
							 									Indexing
							 
String http Gzip响应的精确副本压缩为字符串
									String
							 									Http
							 									D
							 
String 交换字符串大小写-swift
									String
							 									Cocoa
							 									Swift
							 
String 找出两次之间的差值，然后乘以一个值
									String
							 									Excel
							 									Time
							 									Excel Formula
							 
String 为什么字符串对象在Java中是不可变的？
									String
							 									Oop
							 									Object
							 
String Excel VBA根据名称列表添加和命名多张图纸
									String
							 									Excel
							 									List
							 									Vba
							 									Variables
							 
String “如何删除字符”；{“和”}；在使用TCL从文件中读取字符串之后，是否从字符串中读取？
									String
							 									Tcl
							 
String Swift nil可选字符串=空字符串
									String
							 									Swift
							 									Struct
							 
String 在Qt中的另一个字符串中查找复杂的子字符串
									String
							 									Qt
							 
String 在Swift 2中访问字符串中的每个字符
									String
							 									Swift
							 									Swift2
							 
String 批处理文件，如何删除文本文件中的第一个单词，并且仅删除第一行中的第一个单词？
									String
							 									Batch File
							 									Text
							 
String 从字符串中提取第n个发生数
									String
							 									Excel
							 									Excel Formula
							 
String 创建由“+”和“-”分隔的文本列表
									String
							 									Perl
							 
String 在bash中查找字符串所有实例的字符位置
									String
							 									Bash
							 									Awk
							 
String 如何在Python3中以多行打印长字符串
									String
							 									Python 3.x
							 									Logging
							 									Printing
							 
String 将多项式格式化为标准格式>（如何让最终结果成为lisp中的字符串？（包括所有函数））
									String
							 									Loops
							 									Printing
							 									Lisp
							 									Common Lisp
							 
String 除了做I/O之外，我应该总是使用符文而不是字符串吗
									String
							 									Go
							 
String cpython'的规则是什么；什么是实习？
									String
							 
String can'；t调用数据属性中定义的函数
									String
							 									Function
							 
VIsual Basic String.Trim（String）方法和.NET String.Trim方法之间有区别吗？
									String
							 									Vb.net
							 
                                                        
                                                

                                                
                                                        Tags
                                                        
Maps
Programming Languages
User Interface
Hadoop
Google Cloud Storage
Amazon Dynamodb
Apache Storm
Windbg
Animation
Internet Explorer 8
Twilio
Continuous Integration
Windows Services
Fortran
Logstash
Netsuite
Excel Formula
D3.js
Typescript
Ios8
Awk
Drupal 6
Swagger
Jsf
Zend Framework2
Sublimetext3
Opengl Es
Tkinter
Protractor
Database
Yocto
Uwp
Android Layout
.net
String
Tags
Algorithm
Serialization
Google Bigquery
Internet Explorer
Kernel
Multithreading
Timer
Hash
Anaconda
Responsive Design
Django
Coffeescript
Docker Compose
Amazon Web Services
Ckeditor
Dom
Vector
Floating Point
Azure Active Directory
Sencha Touch
Image
Indexing
Reference
R
Dynamic
Exchange Server
Single Sign On
Doctrine Orm
Plone
Jsf 2
Scripting
Menu
Graphviz
Ios5
Kendo Ui
Devexpress
Svn
Java
Orm
Ruby On Rails 3.2
Angular Material
Autohotkey
Keyboard
Jvm
Swing
Ios4
Ruby
Actionscript 3
Talend
Weblogic
Bison
Binding
Gis
Go
Sed
Chart.js
Oauth 2.0
Drupal 7
Less
Postgresql
Sap
Smtp
Mapreduce
Oracle11g
Swift3
Applescript
Quickbooks
Directx
Lucene
Computer Vision
Requirejs
Arrays
Common Lisp
Stata
Cookies
Scroll
Keycloak
Antlr
Webpack
Transactions
Grails
Arm
Asp.net
Sorting
Stanford Nlp
Rally
Django Rest Framework
Material Ui
C# 3.0
Google Chrome Devtools
Symfony
Browser
Outlook
Tfs
Teradata
Wcf
Visual C++
Highcharts
Apache Zookeeper
Google Api
Windows Store Apps
Ldap
Activemq
Sonarqube
Atom Editor
Ios6
Redux
Gremlin
Asp.net Mvc 5
Spring Cloud
Pyspark
Windows
Search
Winforms
Android
Numpy
Terraform
Csv
Composer Php
Qml
Kibana
Youtube
Php
Dataframe
Mysql
Matrix
Postman
Couchbase
Pascal
Variables
Internationalization
Opencl
Events
Windows 10
Io
Gps
Input
Service
Perl
Ssas
Scala
Asynchronous
Ubuntu
React Native
Angular6
Compilation
Url Rewriting
Signalr
Akka
Time
Unity3d
Certificate
Jboss
Alfresco
Colors
Android Ndk
Entity Framework Core
Sqlite
Grep
Ocaml
Url
Mediawiki
Selenium Webdriver
Gwt
Reactjs


                

                        
						
                        
                                
                                        
                                                
                                                        
                                                                Copyright © 2024. All Rights Reserved by  - Fatal编程技术网