使用grep查找所有重音单词(变音符号)?

使用grep查找所有重音单词(变音符号)?,grep,Grep,我在一个文本文件中有一个很大的单词列表(每行一个单词),有些单词有重音字符(变音符号)。如何使用grep仅显示包含重音字符的行?我有一个解决方案。首先使用“iconv”去除重音符号,然后对原始文件中的行执行“diff”: cat text-file | iconv -f utf8 -t ascii//TRANSLIT > noaccents-file diff text-file noaccents-file | grep '<' cat文本文件| iconv-f utf8-t a

我在一个文本文件中有一个很大的单词列表(每行一个单词),有些单词有重音字符(变音符号)。如何使用grep仅显示包含重音字符的行?

我有一个解决方案。首先使用“iconv”去除重音符号,然后对原始文件中的行执行“diff”:

cat text-file | iconv -f utf8 -t ascii//TRANSLIT > noaccents-file
diff text-file noaccents-file | grep '<'
cat文本文件| iconv-f utf8-t ascii//translatit>noaccents文件

diff text file noaccents file | grep'对于更大类别的字符(“哪些单词不是纯ASCII?”),我找到的最佳解决方案是使用带有
-p
选项的PCRE:

grep -P "[\x7f-\xff]" filename

这将发现UTF-8和ISO-8859-1(5)(拉丁文1、win1252、cp850)重音字符相似。

返回此错误:用法:grep[-abcdefghhiijllmnooqrsussvwxz][-A num][-B num][-C[num][-e pattern][-f file][-binary files=value][-color=when][-context[=num][-directories=action][-label][-line buffered][-null][pattern][文件…]查看答案,您可能只需将一系列unicode字符
[\u00C0-\u017F]
作为旁注进行匹配。请参见ASCII表。a-Z和a-Z分别由\x41-\x5a和\x61-\x7a表示。因此
grep-Po“[^\x41-\x5a\x61-\x7a]”哪些grep适用于除a-Za-Z以外的所有字符。