Unicode 在UTF-16编码输入上使用gperf?

Unicode 在UTF-16编码输入上使用gperf?,unicode,hash,utf-16,Unicode,Hash,Utf 16,当移动使用gperf生成的哈希函数的代码以将UTF-16用于其字符串时,您将如何调整/调用哈希函数?我可以看到的选项有: 将UTF-16转换为UTF-8进行散列。 这应该是开箱即用的,但涉及到一个转换步骤,我希望能够避免 使用-c选项使gperf使用strncmp并相应地编码输入文件,为hello写入\000h\000e\000l\000o 我并没有实际测试这个,而是希望保持输入文件可读性和grep能力。但是我想转换步骤可以用来自实际源文件的预处理脚本来完成

当移动使用gperf生成的哈希函数的代码以将UTF-16用于其字符串时,您将如何调整/调用哈希函数?我可以看到的选项有:

  • 将UTF-16转换为UTF-8进行散列。
    这应该是开箱即用的,但涉及到一个转换步骤,我希望能够避免
  • 使用
    -c
    选项使gperf使用
    strncmp
    并相应地编码输入文件,为
    hello
    写入
    \000h\000e\000l\000o
    我并没有实际测试这个,而是希望保持输入文件可读性和grep能力。但是我想转换步骤可以用来自实际源文件的预处理脚本来完成