unicode.RangeTable是如何工作的?
我想要一些关于理解unicode软件包的帮助 使用此功能(假定有帮助):unicode.RangeTable是如何工作的?,unicode,go,Unicode,Go,我想要一些关于理解unicode软件包的帮助 使用此功能(假定有帮助): func printChars(ranges []unicode.Range16) { for _, r := range ranges { if r.Hi >= 0x80 { // show only ascii break } fmt.Println("\nLo:", r.Lo, "Hi:", r.Hi, "Stride:", r.Stride) for c :
func printChars(ranges []unicode.Range16) {
for _, r := range ranges {
if r.Hi >= 0x80 { // show only ascii
break
}
fmt.Println("\nLo:", r.Lo, "Hi:", r.Hi, "Stride:", r.Stride)
for c := r.Lo; c <= r.Hi; c++ {
fmt.Print(string(c) + " ")
}
}
fmt.Println()
}
但是,要获取标点符号printChars(unicode.Punct.R16)
会导致
// Lo: 33 Hi: 35 Stride: 1
// ! " #
// Lo: 37 Hi: 42 Stride: 1
// % & ' ( ) *
// Lo: 44 Hi: 47 Stride: 1
// , - . /
// Lo: 58 Hi: 59 Stride: 1
// : ;
// Lo: 63 Hi: 64 Stride: 1
// ? @
// Lo: 91 Hi: 93 Stride: 1
// [ \ ]
// Lo: 95 Hi: 123 Stride: 28
// _ ` a b c d e f g h i j k l m n o p q r s t u v w x y z {
我很惊讶小写字母也包括在内。还有,“跨步”是什么意思?除了最后一个,所有的都是1,但是hi-lo差异不同
另一个例子是,printChars(unicode.Pe.R16)
。我认为这应该只给出结尾标点:
- )右括号(U+0029,Pe)
- ]右方支架(U+005D,Pe)
- }右曲括号(U+007D,Pe)
// Lo: 41 Hi: 93 Stride: 52
// ) * + , - . / 0 1 2 3 4 5 6 7 8 9 : ; < = > ? @ A B C D E F G H I J K L M N O P Q R S T U V W X Y Z [ \ ]
//Lo:41 Hi:93步幅:52
// ) * + , - . / 0 1 2 3 4 5 6 7 8 9 : ; < = > ? @ A B C D E F G H I J K L M N O P Q R S T U V W X Y Z[\]
大概我完全误解了这是怎么回事
如何正确获取给定类别中的字符列表,例如,如上所述的标点符号结束(Pe)?跨步是您必须在该范围内迭代的步骤。让我们稍微提高
0x80
的边界,并使用Stride
进行循环迭代:
package main
import (
"fmt"
"unicode"
)
func printChars(ranges []unicode.Range16) {
for _, r := range ranges {
if r.Hi >= 0x100 {
break
}
fmt.Println("\nLo:", r.Lo, "Hi:", r.Hi, "Stride:", r.Stride)
for c := r.Lo; c <= r.Hi; c+=r.Stride {
fmt.Print(string(c) + " ")
}
}
fmt.Println()
}
func main() {
printChars(unicode.Punct.R16)
}
在我看来非常正确。这里有一个帮助函数,可以轻松地迭代范围表中包含的所有符文:
func RunesFromRange(tab *unicode.RangeTable) <-chan rune {
res := make(chan rune)
go func() {
for _, r16 := range tab.R16 {
for c := r16.Lo; c <= r16.Hi; c += r16.Stride {
res <- rune(c)
}
}
for _, r32 := range tab.R32 {
for c := r32.Lo; c <= r32.Hi; c += r32.Stride {
res <- rune(c)
}
}
close(res)
}()
return res
}
要播放的可运行代码位于上(我喜欢输出中以0x 0df4开头的字符)
func RunesFromRange(tab *unicode.RangeTable) <-chan rune {
res := make(chan rune)
go func() {
for _, r16 := range tab.R16 {
for c := r16.Lo; c <= r16.Hi; c += r16.Stride {
res <- rune(c)
}
}
for _, r32 := range tab.R32 {
for c := r32.Lo; c <= r32.Hi; c += r32.Stride {
res <- rune(c)
}
}
close(res)
}()
return res
}
for c := range RunesFromRange(unicode.Punct) {
fmt.Printf("%04x %s\n", c, string(c))
}