Java tweet中的表情显示为“?”&引用;在MongoDB
目前,我正在收集基于情绪的推文并进行分析。我有带表情符号的推特,但在收集时,它只是带着问号返回 例如: 原始tweet(在Twitter中):Java tweet中的表情显示为“?”&引用;在MongoDB,java,mongodb,emoji,tweets,Java,Mongodb,Emoji,Tweets,目前,我正在收集基于情绪的推文并进行分析。我有带表情符号的推特,但在收集时,它只是带着问号返回 例如: 原始tweet(在Twitter中): 立顿冰茶MongoDB默认使用UTF-8,因此,除非您将其配置为不使用UTF-8,否则它完全能够存储表情符号 这一次我花了整整一周的时间把头撞在墙上,因为MongoDB不会存储拉丁特殊字符。事实证明MongoDB工作得很好,它是Log4j,没有配置为使用UTF-8打印日志,所以我在日志中看到的只是?,而不是ñáÜ 如果您像我一样使用MongoShell(
立顿冰茶MongoDB默认使用UTF-8,因此,除非您将其配置为不使用UTF-8,否则它完全能够存储表情符号
这一次我花了整整一周的时间把头撞在墙上,因为MongoDB不会存储拉丁特殊字符。事实证明MongoDB工作得很好,它是Log4j,没有配置为使用UTF-8打印日志,所以我在日志中看到的只是?
,而不是ñáÜ
如果您像我一样使用MongoShell(/bin/Mongo.exe
在Windows中)连接到MongoDB实例并查询数据,您应该能够看到emojis。这是一个例子
问题在于JSON visor,或者发送到MongoDB的字符串的编码
在Java中,您可能希望将file.encoding
系统属性设置为UTF-8
,以确保您的程序在读取文件、输入流等时使用正确的编码。MongoDB默认使用UTF-8,因此,除非您将其配置为不使用,否则它完全能够存储表情
这一次我花了整整一周的时间把头撞在墙上,因为MongoDB不会存储拉丁特殊字符。事实证明MongoDB工作得很好,它是Log4j,没有配置为使用UTF-8打印日志,所以我在日志中看到的只是?
,而不是ñáÜ
如果您像我一样使用MongoShell(/bin/Mongo.exe
在Windows中)连接到MongoDB实例并查询数据,您应该能够看到emojis。这是一个例子
问题在于JSON visor,或者发送到MongoDB的字符串的编码
在Java中,您可能希望将file.encoding
系统属性设置为UTF-8
,以确保程序在读取文件、输入流等时使用正确的编码。如果您使用的是Robomongo,这是一个Robomongo问题
Robomongo在表格模式下显示一个?
,而不是表情符号 如果您使用的是Robomongo,这是一个Robomongo问题
Robomongo在表格模式下显示一个?
,而不是表情符号 我猜这是管道中某个地方的编码问题,你在哪里看到问号?在mongodb的外壳里?或者当你把它取回显示在你的页面上时?同样,“lipton”是大写的。这是怎么发生的?@SergioTulentsev我在本地以JSON格式存储我的所有推文,后来存储在MongoDB中。在存储到MongoDB之前,我使用JSON查看器检查JSON格式的信息。在这方面,我发现问号而不是表情符号。所以,这都是在MongoDB函数之前。所以也许你的JSON查看器不能处理unicode表情符号?我猜这是管道中的某个编码问题。你在哪里看到问号?在mongodb的外壳里?或者当你把它取回显示在你的页面上时?同样,“lipton”是大写的。这是怎么发生的?@SergioTulentsev我在本地以JSON格式存储我的所有推文,后来存储在MongoDB中。在存储到MongoDB之前,我使用JSON查看器检查JSON格式的信息。在这方面,我发现问号而不是表情符号。所以,所有这些都是在MongoDB函数之前完成的。那么,也许您的JSON查看器无法处理unicode表情符号?