无法通过eggdrop将utf-8字符转换为html实体

无法通过eggdrop将utf-8字符转换为html实体,utf-8,tcl,eggdrop,Utf 8,Tcl,Eggdrop,首先要解决这个问题。。我已经用utf-8编码重新编译了eggdrop。如果我在字符串中写入转义序列(\u00a7),我能够回显utf-8字符,但由于某些原因,我还无法理解。。我无法将使用正则表达式的它们与它们的对应项进行比较 我正在尝试开发一个基于eggdrop的日志脚本,它是在tcl下编码的。我已经花了几个小时什么都没做,只是做研究,但要么没有任何帮助,要么我找错了地方 用户在机器人所在的irc通道中键入输入字符串§。日志脚本linux端将这个字符解释为一个特殊的控制字符(我认为-),它在ge

首先要解决这个问题。。我已经用utf-8编码重新编译了eggdrop。如果我在字符串中写入转义序列(
\u00a7
),我能够回显utf-8字符,但由于某些原因,我还无法理解。。我无法将使用正则表达式的它们与它们的对应项进行比较

我正在尝试开发一个基于eggdrop的日志脚本,它是在tcl下编码的。我已经花了几个小时什么都没做,只是做研究,但要么没有任何帮助,要么我找错了地方

用户在机器人所在的irc通道中键入输入字符串§。日志脚本linux端将这个字符解释为一个特殊的控制字符(我认为-),它在gedit中呈现为一个两行的特殊字符,其外观类似于“FFA7”,第一行是FF,第二行是A7,都包含在一个框中

我的正则表达式非常简单:

regexp -all {\u00a7} $text
我当然也尝试过:

regexp -all {\247} $text
不幸的是,如前所述。。它不起作用。我每次都得到一个0,这意味着它永远不会与角色匹配

在我所做的所有研究中,我一直无法确定eggdrop将字符串发送到tcl脚本的格式。唯一有效的方法是将gedit中的长方体字符直接复制到脚本中。。但由于我无法复制这个字符,所以编写代码变得相当困难


回答这个问题。。我想知道我在这里做错了什么,如果事实上有一种正确的方法来解释bot发送的字符串,这样我就可以正确地将其中的特殊字符转换为html实体。

对于那些想知道的人,从我的测试中可以看出,我已经用简单的方法解决了这个问题:

set text [encoding convertfrom utf-8 $text]

我的其他函数用于替换转义序列。我不知道我之前的研究中怎么会错过这一点。

对于那些想知道的人,从我的测试中可以看出,我已经用简单的方法解决了这个问题:

set text [encoding convertfrom utf-8 $text]
我的其他函数用于替换转义序列。我不知道我之前的研究怎么会错过这个