Regex 如何检查和替换tcl中的非UTF-8字符?
如果给定字符串在tcl中包含非UTF-8字符,那么最好的搜索方法是什么?regexp'ingRegex 如何检查和替换tcl中的非UTF-8字符?,regex,tcl,utf,Regex,Tcl,Utf,如果给定字符串在tcl中包含非UTF-8字符,那么最好的搜索方法是什么?regexp'ing“^[\x00-\x7f]+$”是唯一的前进之路吗 我试图编写一个tcl进程来检查给定变量是否包含非UTF-8字符,以及是否将其替换为“不受支持”所有tcl字符都是Unicode字符 好吧,那没用。实际上,您似乎在询问非ASCII字符。假设要用?替换每个非ASCII字符,可以使用正则表达式替换,如下所示: regsub -all {[\u0080-\uffff]} $inputString "?" out
“^[\x00-\x7f]+$”
是唯一的前进之路吗
我试图编写一个tcl进程来检查给定变量是否包含非UTF-8字符,以及是否将其替换为“不受支持”所有tcl字符都是Unicode字符 好吧,那没用。实际上,您似乎在询问非ASCII字符。假设要用
?
替换每个非ASCII字符,可以使用正则表达式替换,如下所示:
regsub -all {[\u0080-\uffff]} $inputString "?" outputString
这里的关键是RE在大括号中(实际上总是强烈推荐的),我们使用的是\uxxx
转义序列(RE引擎也理解)。这可能会使许多?
陷入困境,但我相信您可以调整