强制MongoDB将字符串解释为unicode的正确前缀?
我试图将unicode信息存储在MongoDB数据库中,以便在网页上呈现字符。我知道MongoDB以BSON格式存储所有内容,特别是以utf-8编码(按照)存储BSON字符串,所以我打赌这个问题可以由比我了解更多的人来解决 问题是:我想渲染希伯来文字符。我制作了一个CSV文件,其中我以纯文本形式列出了它们的unicode代码点,我需要弄清楚在这个文本字符串中包含什么前缀,这样我就可以用MongoDB正确地处理它 像“05D8”这样的字符串没有问题——在我的CSV文件中,它表示为“05D8”,然后在MongoDB中表示为“05D8”没有问题 然而,字符串“05E0”——unicode中的U+05E0——希伯来语字母“nun”——正被MongoDB接收并强制转换为整数。。。科学符号解释。希伯来语字母表中的十个字符都有这个问题,尽管MongoDB正确地吸收了我的所有其他字符串 两个问题: Q1:为了让MongoDB将“05E0”视为U+05E0,我应该在CSV文件的字符串前面加上什么前缀?你。。u“…我试过u'05E0',但它在MongoDB中存储为“u'05E0',这不是我想要的。(这是我的问题,不是mongo的问题--我只是不知道在CSV文件中键入什么)强制MongoDB将字符串解释为unicode的正确前缀?,mongodb,python-3.x,unicode,Mongodb,Python 3.x,Unicode,我试图将unicode信息存储在MongoDB数据库中,以便在网页上呈现字符。我知道MongoDB以BSON格式存储所有内容,特别是以utf-8编码(按照)存储BSON字符串,所以我打赌这个问题可以由比我了解更多的人来解决 问题是:我想渲染希伯来文字符。我制作了一个CSV文件,其中我以纯文本形式列出了它们的unicode代码点,我需要弄清楚在这个文本字符串中包含什么前缀,这样我就可以用MongoDB正确地处理它 像“05D8”这样的字符串没有问题——在我的CSV文件中,它表示为“05D8”,然后
Q2:mongoimport是否有一个标志,我可以使用它强制将此CSV中的信息解释为文本而不是科学符号?好的,这似乎有效:
eval(“'\\u”+“05E0”+””)
不熟悉MongoDB,但您是否尝试过将UTF-8字符串写入.CSV?