用于测试Unicode相关问题的Unicode示例文本文件?
我正在寻找一个示例文本unicode文件(UTF-8),该文件可用于测试与文本编码和解码相关的不同问题,包括:用于测试Unicode相关问题的Unicode示例文本文件?,unicode,utf-8,character-encoding,normalization,unicode-normalization,Unicode,Utf 8,Character Encoding,Normalization,Unicode Normalization,我正在寻找一个示例文本unicode文件(UTF-8),该文件可用于测试与文本编码和解码相关的不同问题,包括: ascii字符使用率低,如前32个代码 BMP之外的字符 NFC相关问题 XML编码/解码问题 我主要希望将文本复制到剪贴板中,粘贴到应用程序的HTML文本区域中,并能够在之后从页面中检索它 这将有助于识别可能在解码、编码甚至数据库级别发生的不同Unicode相关问题。此页面已用于测试web浏览器,其中包含多个脚本中的文本: 哥特式的“我能吃玻璃”词条尤其超出了BMP:规范化表达:
- ascii字符使用率低,如前32个代码
- BMP之外的字符
- NFC相关问题
- XML编码/解码问题
这将有助于识别可能在解码、编码甚至数据库级别发生的不同Unicode相关问题。此页面已用于测试web浏览器,其中包含多个脚本中的文本:
哥特式的“我能吃玻璃”词条尤其超出了BMP:规范化表达:相等但不同字符串的比较:“拞”=u-扬抑或“拞”=字母-u+组合变音扬抑。XML 1.1,标记中有特殊字符。现在我需要为一些人提供一个测试文件,以便他们测试您粘贴的内容是否会到达数据库,以及稍后的浏览器,因此Unicode比较超出了问题的范围。