String 执行Boyer-Moore模式匹配时是否必须考虑编码？_String_Character Encoding_Pattern Matching_Boyer Moore - Fatal编程技术网

String 执行Boyer-Moore模式匹配时是否必须考虑编码？

string character-encoding

String 执行Boyer-Moore模式匹配时是否必须考虑编码？,string,character-encoding,pattern-matching,boyer-moore,String,Character Encoding,Pattern Matching,Boyer Moore,我即将实现Boyer-Moore模式匹配算法的一个变体（具体来说是Sunday算法），我问自己：我的字母表大小是多少这取决于编码（=可能的字符数）还是我可以假设我的字母表由256个符号组成（=可以用一个字节表示的符号数）在许多其他情况下，将字符视为字节将是一个问题，因为根据编码的不同，一个字符可以由多个字节组成，但在我的例子中，如果两个字符串具有相同的编码，那么相等的字符由相等的字节序列表示，因此我认为这无关紧要那么：我是否必须考虑编码并假设一个由实际字符组成的字母表（Unicode大于9

我即将实现Boyer-Moore模式匹配算法的一个变体（具体来说是Sunday算法），我问自己：我的字母表大小是多少

这取决于编码（=可能的字符数）还是我可以假设我的字母表由256个符号组成（=可以用一个字节表示的符号数）

在许多其他情况下，将字符视为字节将是一个问题，因为根据编码的不同，一个字符可以由多个字节组成，但在我的例子中，如果两个字符串具有相同的编码，那么相等的字符由相等的字节序列表示，因此我认为这无关紧要

那么：我是否必须考虑编码并假设一个由实际字符组成的字母表（Unicode大于90000），或者我是否可以将文本和模式作为字节流处理

多字节编码可与面向字节的搜索例程一起使用，如果是这样的话
因此，您可以安全地使用Boyer Moore：

CESU-8

UTF-8

UTF-EBCDIC

但是不能将其用于：

大5

EUC-JP

GBK/GB18030

ISO 2022

约翰

小码

轮班JIS

UTF-7

UTF-16

UTF-32

[character encoding]相关文章推荐

Character encoding 这是什么类型的字符？如何将其转换为文本？ character-encoding

Character encoding 如何在所选Jquery上设置字符集？ character-encoding

Character encoding Apache Camel:错误WMQMsg-应为MQ消息字符集'；819'；，但收到'；1208'； character-encoding apache-camel ibm-mq

Character encoding 当记录包含空值时，使用BizTalk反汇编平面文件 character-encoding xsd biztalk

随机文章推荐

Pentaho：如何逐行读取SQL结果以逐个执行？ pentaho

Pentaho 替换属性文件中定义的查询中的变量 pentaho

Pentaho 如果没有数据，则隐藏图表 pentaho

Pentaho 水壶勺在windows 10中运行，总是失败 pentaho windows-10

Pentaho 如何找到“水壶之家”的定义 pentaho

如何在pentaho报表设计器工具中动态添加图像路径？ pentaho

Pentaho报告：在Pentaho报告设计器中添加报告标题和详细信息的两个部分 pentaho

Pentaho 行扁平化器未正确处理空值 pentaho

Pentaho 表输入中的参数整数 pentaho

[string]相关推荐

String 在地图中构建堆栈
String Scala

String 字符串匹配中的前缀与后缀Trie
String

String 在Visual Basic 6中，如何删除字符串的第一个字符？
String Vb6

String perl中的后缀数组？
String Algorithm Perl

String 将带时区的字符串datetime转换为GMT datetime变量
String Sql Server 2008

String d编程，解析或转换字符串为双精度
String D

String 用于检索距离接近Levenshtein的字符串的数据结构
String Algorithm Data Structures

String 如何将一个字符串复制到另一个字符串，在第一个位置留下一个空白字符？
String Delphi

String 在Bash中的While循环中设置变量
String Bash Variables Loops Grep

String 复制字符串时出错-ASM
String Assembly X86

String bash，检查字符串是否以{“nextId”开头；
String Bash

String 将两列合并为一个R
String R Text Merge

String Bash：用引号替换字符串（错误的替换错误）
String Bash Replace

String 输入字符串后删除额外空格
String Assembly Mips

String 如何比较范围的.startIndex<；字符串索引>；
String Swift

String Haskell：返回在&；之前的字符串；在给定字符串之后
String Haskell

String Powershell字符串不包含
String Powershell

String 将字典和字符串列表转换为变量以解决ODE问题
String List Dictionary

String PowerShell从字符串中提取字符
String Powershell

String 如何强制文本为除选择性字符串外的大写字母c#
String

String 我应该如何更改此函数，使其能够在Python2和Python3中灵活地处理字符串和unicode？
String Python 3.x Unicode

String 将glm:：Mat4转换为字符串
String

Vector3.ToString"；轮数；生成后的小数
String Unity3d Vector

String Haskell中的XORing字符串
String Haskell

String fmt.Sscanf无法正确读取十六进制
String Go

String visualworks smalltalk：如何从字符串中检测子字符串，可能吗？
String Smalltalk

String 有人能告诉我这是否意味着什么吗
String Random Passwords

String 建造管柱后更换可变管柱
String Flutter Dart Replace

String postgres pgjwt中的Concat导致错误
String Postgresql

String Shell脚本（bash）将字符串变量与多个值匹配
String Bash

Tags

Windows Phone Instagram Adobe Ms Office Zsh Google Drive Api Mapping Doxygen View Dart Pine Script Twig Plugins Linux Sharepoint 2007 Ios4 Phantomjs Chef Infra Machine Learning Network Programming Identityserver4 Ssas Extjs4 Fullcalendar Data Structures Cocoa Azure Devops Vmware Calendar Windbg Geolocation Selenium Dotnetnuke Laravel 5 Artificial Intelligence Ruby On Rails 4 Office365 Sql Server 2012 Postman Azure Service Fabric Windows Phone 8.1 Build Concurrency Silverlight 4.0 Yaml Aws Lambda Google Chrome Content Management System Authentication Office Js Signalr Markdown Couchbase Antlr4 Terminal Events Ffmpeg Asp.net Mvc Ssrs 2008 Model View Controller Dialogflow Es Image Processing Mediawiki Sapui5 Libgdx Google Chrome Extension Octave Npm Automated Tests Nlp Magento Post Scikit Learn Sencha Touch 2 Tabs Docker Jquery Mobile Odata Bootstrap 4 Oracle Web Crawler Jsf Common Lisp Amazon S3 Rss Fortran Mapbox Mobile Google Visualization Navigation Jms Mpi Mips Three.js Xml Discord Session Phpmyadmin Android Studio Requirejs Autohotkey Data Binding Datatables Css Modelica Xslt Botframework Csv Rxjs Map Android Layout Svg Inheritance Spring Security Jetty Yii2 Msbuild Linux Kernel Javafx 2 Struts2 Enums Migration Wcf Compression Verilog Encoding Hazelcast Azure Ad B2c Computer Vision Latex Parameters Nunit Http Hibernate Deep Learning Jekyll Html5 Canvas Listview Playframework Layout Spring Batch Zend Framework2 D3.js Iphone Charts Sip Iis 7 Sprite Kit F# Programming Languages Imagemagick Reference Qml Shell Aem Redux Sublimetext2 For Loop Unix Arm Elixir Qt4 Caching Ssh Asp.net Core Dask Gruntjs Command Line Swagger Keyboard Kernel Google Cloud Storage Ruby On Rails 3.2 Sms C++11 Timer Active Directory Excel Formula Elm Ruby On Rails 3.1 Haskell Mercurial Internet Explorer Hive Junit Arduino Artifactory Ruby On Rails Asp.net Mvc 5 Printing Orchardcms Debugging Eclipse Oauth Cuda Snowflake Cloud Data Platform Processing Google Colaboratory Tsql Performance Cakephp

Copyright © 2024. All Rights Reserved by - Fatal编程技术网