Unicode 如何解码ISDB(ARIB)传输流中编码的文本字符串?

Unicode 如何解码ISDB(ARIB)传输流中编码的文本字符串?,unicode,character,Unicode,Character,如何解码ISDB(ARIB)传输流中编码的文本字符串?ARIB STD-B24第5.2版(第1卷)规范第2部分(单媒体编码)第7章规定了一些编码技术。但我不确定这种编码是否不同于其他标准的日文字符编码技术,如EUC-JP、ISO-2022-JP、JIS X208等。这种编码标准名称是什么 如果我知道ISDB流中使用的编码名称(代码页),我可以使用第三方库,如ICU,如下所示 UConverter*ucnv\u打开(常量字符*转换器名称,用户代码*错误) conv=ucnv\u open(“shi

如何解码ISDB(ARIB)传输流中编码的文本字符串?ARIB STD-B24第5.2版(第1卷)规范第2部分(单媒体编码)第7章规定了一些编码技术。但我不确定这种编码是否不同于其他标准的日文字符编码技术,如EUC-JP、ISO-2022-JP、JIS X208等。这种编码标准名称是什么

如果我知道ISDB流中使用的编码名称(代码页),我可以使用第三方库,如ICU,如下所示

UConverter*ucnv\u打开(常量字符*转换器名称,用户代码*错误) conv=ucnv\u open(“shift\u jis”和状态); len=ucnv\U触摸屏(conv、目标、100、源、strlen(源)和状态); ucnv_关闭(conv)

我还试着自己解码ISDB传输流中的ARIB字符串,但我没有成功,因为我遇到了几个问题,我不清楚

有4个图形集G0、G1、G2和G3。我所理解的是,集合的初始值是 G0:汉字系统集 G1:字母数字集 G2:平假名集 G3:宏代码集

G0、G1、G2和G3的值可以随时更改还是保持不变? 这个宏代码集是什么

在解码时,有两个概念,“调用代码元素”和“指定图形集”。如何从转义码中使用这个?例如,我尝试解码从流中提取的以下字符串:

1b 7c c1 e3 f3 cd eb 26 41 1b 7d fe 4e 78 30 26 37 6b 3a 27 ce 4b 21 42 27 0e 28 1b 7c eb f9 eb 29 0f 21 21 21 0e 23 38 1b 24 3b 0f 7a 6a 56 7a 59

如何获取GL和GR值,比如上面的字符串,以及每个字符是使用2字节还是1字节?如果任何人都能给出一些提示来解码上面的字符串,这将非常有帮助。

解码由

6-STD-B24v5_2-1p3-E1.pdf

第2部分,第7章

默认设置第3部分第8章

名称

G0 = Kanji (2 Byte) JIS X 0213:2004 8-bit code vs Unicode mapping table
G1 = AlphaNumeric (1 Byte)
G2 = Hiragana (1 Byte)
G3 = Macro code set (not decoded by the example below!!)
调用

GL <= G0
GR <= G2
GL解码由

6-STD-B24v5_2-1p3-E1.pdf

第2部分,第7章

默认设置第3部分第8章

名称

G0 = Kanji (2 Byte) JIS X 0213:2004 8-bit code vs Unicode mapping table
G1 = AlphaNumeric (1 Byte)
G2 = Hiragana (1 Byte)
G3 = Macro code set (not decoded by the example below!!)
调用

GL <= G0
GR <= G2
GL