Notepad++ 如何搜索既不在西班牙语字母表中也不在英语字母表中的无效字符?

Notepad++ 如何搜索既不在西班牙语字母表中也不在英语字母表中的无效字符?,notepad++,Notepad++,我有一个2000行的SQL代码文件,其中包含一些垃圾字符。我的意思是,这些字符不属于西班牙语或英语字母表。在记事本++中,有没有任何方法可以像这样搜索无效字符 例如,考虑下面的行, UPDATE table A SET some_string = 'No se encontró un producto fìsico para el plan ingresado' WHERE some_ID = 'XYZ001' 这里的特殊字符是³和­,但Ã不是,因为它是一个有效的西班牙语字符 如果还有其他

我有一个2000行的SQL代码文件,其中包含一些垃圾字符。我的意思是,这些字符不属于西班牙语或英语字母表。在记事本++中,有没有任何方法可以像这样搜索无效字符

例如,考虑下面的行,

UPDATE table A SET some_string = 'No se encontró un producto fìsico para el plan ingresado' WHERE some_ID = 'XYZ001'
这里的特殊字符是³和­,但Ã不是,因为它是一个有效的西班牙语字符


如果还有其他方法,请随意建议。

我找不到任何关于西班牙语字母ã/Ã的参考。这里是一个编码错误的例子,垃圾字母就是其结果。要解决此问题,请执行以下操作:

1. Open a new empty document, Ctrl+N.
2. Change the encoding to cp1252 (Encoding -> Character sets -> Western European -> Windows-1252.
3. Paste your original text ("... encontró...")
4. Change encoding to UTF-8 (Encoding -> Encode in UTF-8).
Regex search:  [^\x00-\x7FãáéíñóúüÃÁÉÍÑÓÚÜ¿¡]
结果字符串是“…se encontroóun producto fìsico para…”,顺便说一句,该字符串不包含ã/Ã

可供替代的 但是,如果您想查找“西班牙语”字符,如您的问题所示,请这样做:

1. Open a new empty document, Ctrl+N.
2. Change the encoding to cp1252 (Encoding -> Character sets -> Western European -> Windows-1252.
3. Paste your original text ("... encontró...")
4. Change encoding to UTF-8 (Encoding -> Encode in UTF-8).
Regex search:  [^\x00-\x7FãáéíñóúüÃÁÉÍÑÓÚÜ¿¡]

(Notepad++附带内置支持。)上述表达式将匹配所有非ASCII、非“西班牙语”字符,如上面列出的两个字符³和。

我找不到任何关于西班牙语字母ã/Ã的引用。这里是一个编码错误的例子,垃圾字母就是其结果。要解决此问题,请执行以下操作:

1. Open a new empty document, Ctrl+N.
2. Change the encoding to cp1252 (Encoding -> Character sets -> Western European -> Windows-1252.
3. Paste your original text ("... encontró...")
4. Change encoding to UTF-8 (Encoding -> Encode in UTF-8).
Regex search:  [^\x00-\x7FãáéíñóúüÃÁÉÍÑÓÚÜ¿¡]
结果字符串是“…se encontroóun producto fìsico para…”,顺便说一句,该字符串不包含ã/Ã

可供替代的 但是,如果您想查找“西班牙语”字符,如您的问题所示,请这样做:

1. Open a new empty document, Ctrl+N.
2. Change the encoding to cp1252 (Encoding -> Character sets -> Western European -> Windows-1252.
3. Paste your original text ("... encontró...")
4. Change encoding to UTF-8 (Encoding -> Encode in UTF-8).
Regex search:  [^\x00-\x7FãáéíñóúüÃÁÉÍÑÓÚÜ¿¡]

(Notepad++附带内置支持。)上述表达式将匹配所有非ASCII、非“西班牙语”字符,如上面列出的两个字符³和­­。

为什么您希望Notepad++知道哪些字符不适合英语或西班牙语,只要这些字符在所选字符集中?@KenWhite,如果不是这样定义的话,好吧。那么,有没有解决办法?这就是我要问的。为什么你希望记事本++知道哪些字符不适合英语或西班牙语,只要这些字符在所选的字符集中?@KenWhite,如果不是这样定义的,很好。那么,有没有解决办法?这就是我所要求的。