unicode.RangeTable是如何工作的？_Unicode_Go

unicode.RangeTable是如何工作的？

unicode go

unicode.RangeTable是如何工作的？,unicode,go,Unicode,Go,我想要一些关于理解unicode软件包的帮助使用此功能（假定有帮助）： func printChars(ranges []unicode.Range16) { for _, r := range ranges { if r.Hi >= 0x80 { // show only ascii break } fmt.Println("\nLo:", r.Lo, "Hi:", r.Hi, "Stride:", r.Stride) for c :

我想要一些关于理解unicode软件包的帮助

使用此功能（假定有帮助）：

func printChars(ranges []unicode.Range16) {
  for _, r := range ranges {

    if r.Hi >= 0x80 { // show only ascii
      break
    }
    fmt.Println("\nLo:", r.Lo, "Hi:", r.Hi, "Stride:", r.Stride)

    for c := r.Lo; c <= r.Hi; c++ {
      fmt.Print(string(c) + " ")
    }
  }
  fmt.Println()
}

但是，要获取标点符号

printChars（unicode.Punct.R16）

会导致

 // Lo: 33 Hi: 35 Stride: 1
 // ! " #
 // Lo: 37 Hi: 42 Stride: 1
 // % & ' ( ) *
 // Lo: 44 Hi: 47 Stride: 1
 //  , - . /
 // Lo: 58 Hi: 59 Stride: 1
 // : ;
 // Lo: 63 Hi: 64 Stride: 1
 // ? @
 // Lo: 91 Hi: 93 Stride: 1
 // [ \ ]
 // Lo: 95 Hi: 123 Stride: 28
 // _ ` a b c d e f g h i j k l m n o p q r s t u v w x y z {

我很惊讶小写字母也包括在内。还有，“跨步”是什么意思？除了最后一个，所有的都是1，但是hi-lo差异不同

另一个例子是，

printChars（unicode.Pe.R16）

。我认为这应该只给出结尾标点：

)右括号（U+0029，Pe）
]右方支架（U+005D，Pe）
}右曲括号（U+007D，Pe）

但是我的函数会打印出来

 // Lo: 41 Hi: 93 Stride: 52
 // ) * + , - . / 0 1 2 3 4 5 6 7 8 9 : ; < = > ? @ A B C D E F G H I J K L M N O P Q R S T U V W X Y Z [ \ ]

//Lo:41 Hi:93步幅：52
// ) * + , - . / 0 1 2 3 4 5 6 7 8 9 : ; < = > ? @ A B C D E F G H I J K L M N O P Q R S T U V W X Y Z[\]

大概我完全误解了这是怎么回事

如何正确获取给定类别中的字符列表，例如，如上所述的标点符号结束（Pe）？

跨步是您必须在该范围内迭代的步骤。让我们稍微提高

0x80

的边界，并使用

Stride

进行循环迭代：

package main

import (
    "fmt"
    "unicode"
)

func printChars(ranges []unicode.Range16) {
  for _, r := range ranges {

    if r.Hi >= 0x100 {
      break
    }
    fmt.Println("\nLo:", r.Lo, "Hi:", r.Hi, "Stride:", r.Stride)

    for c := r.Lo; c <= r.Hi; c+=r.Stride {
      fmt.Print(string(c) + " ")
    }
  }
  fmt.Println()
}

func main() {
    printChars(unicode.Punct.R16)
}

在我看来非常正确。

这里有一个帮助函数，可以轻松地迭代范围表中包含的所有符文：

func RunesFromRange(tab *unicode.RangeTable) <-chan rune {
    res := make(chan rune)
    go func() {
        for _, r16 := range tab.R16 {
            for c := r16.Lo; c <= r16.Hi; c += r16.Stride {
                res <- rune(c)
            }
        }
        for _, r32 := range tab.R32 {
            for c := r32.Lo; c <= r32.Hi; c += r32.Stride {
                res <- rune(c)
            }
        }
        close(res)
    }()
    return res
}

要播放的可运行代码位于上（我喜欢输出中以0x 0df4开头的字符）

func RunesFromRange(tab *unicode.RangeTable) <-chan rune {
    res := make(chan rune)
    go func() {
        for _, r16 := range tab.R16 {
            for c := r16.Lo; c <= r16.Hi; c += r16.Stride {
                res <- rune(c)
            }
        }
        for _, r32 := range tab.R32 {
            for c := r32.Lo; c <= r32.Hi; c += r32.Stride {
                res <- rune(c)
            }
        }
        close(res)
    }()
    return res
}

for c := range RunesFromRange(unicode.Punct) {
    fmt.Printf("%04x %s\n", c, string(c))
}