Python 如何将此unicode字符串从数据库转换为utf-8_Python_Utf 8

Python 如何将此unicode字符串从数据库转换为utf-8

python utf-8

Python 如何将此unicode字符串从数据库转换为utf-8,python,utf-8,Python,Utf 8,通过对sqlite3的数据库调用中的项进行迭代，我得到了以下信息 (u'9', u'HS 09 - Coffee, Tea, Mat\xe9 and Spices', u'Bangladesh', 2000, 6127) 我需要将其转换为utf-8，特别是第二个字段u'HS 09-咖啡、茶、垫子和香料“结果文本应为： 'HS 09-咖啡、茶、材料和香料' 如何做到这一点？使用.encode（'utf-8'）。例如： >>> u'HS 09 - Coffee, Tea, Mat

通过对sqlite3的数据库调用中的项进行迭代，我得到了以下信息

(u'9', u'HS 09 - Coffee, Tea, Mat\xe9 and Spices', u'Bangladesh', 2000, 6127)

我需要将其转换为utf-8，特别是第二个字段

u'HS 09-咖啡、茶、垫子和香料“

结果文本应为：

'HS 09-咖啡、茶、材料和香料'

如何做到这一点？

使用

.encode（'utf-8'）

。例如：

>>> u'HS 09 - Coffee, Tea, Mat\xe9 and Spices'.encode('utf-8')
'HS 09 - Coffee, Tea, Mat\xc3\xa9 and Spices'

关于术语的说明-数据库调用的结果是unicode。您想将unicode对象转换（编码）为utf-8的问题文本是正确的，但是您的标题有点不正确。我对它进行了编辑以反映这一点-由TestRing编码的utf-8不是Unicode字符串。

使用

.encode（'utf-8'）

。例如：

>>> u'HS 09 - Coffee, Tea, Mat\xe9 and Spices'.encode('utf-8')
'HS 09 - Coffee, Tea, Mat\xc3\xa9 and Spices'

使用

.encode（'utf-8'）

。例如：

>>> u'HS 09 - Coffee, Tea, Mat\xe9 and Spices'.encode('utf-8')
'HS 09 - Coffee, Tea, Mat\xc3\xa9 and Spices'

使用

.encode（'utf-8'）

。例如：

>>> u'HS 09 - Coffee, Tea, Mat\xe9 and Spices'.encode('utf-8')
'HS 09 - Coffee, Tea, Mat\xc3\xa9 and Spices'

关于术语的说明-数据库调用的结果是unicode。您想将unicode对象转换（编码）为utf-8的问题文本是正确的，但是您的标题有点不正确。我对它进行了编辑以反映这一点——由TestRing编码的utf-8不是Unicode字符串。

哇，真的那么简单吗？但是，即使字符串上有一个u“”，但\xe9肯定不是有效的unicode字符。所以它不是真正的utf-8，对吗？如果是这样，如果python不知道\xe9的原始编码是什么，它如何知道如何对字符进行编码，例如latin-1、iso-8859-2等。我只是为问题添加了更多的上下文，例如，生成的文本应该打印为“HS 09-咖啡、茶、Maté和香料”确实是一个有效的Unicode代码点。@P.Jakobsen，是

\xe9

是有效的Unicode字符U+00e9。要获取所需字符，只需按原样打印即可。如果打印包含该字符串的列表或元组，它将使用该字符串的

repr

，这将转义ASCII集合之外的任何字符。@P.Jakobsen，

replace

应该没有任何区别

u'\xe9'

和

u'é'

应该相同。尝试

print data[1]

而不是

print data

，看看我刚才说的是什么。

encode

将Unicode字符串转换为字节字符串，因此应该有所不同。也许你的文件不是UTF-8？如果你能直接写一个Unicode字符串，就会有一些隐式编码。哇，真的这么简单吗？但是，即使字符串上有一个u“”，但\xe9肯定不是有效的unicode字符。所以它不是真正的utf-8，对吗？如果是这样，如果python不知道\xe9的原始编码是什么，它如何知道如何对字符进行编码，例如latin-1、iso-8859-2等。我只是为问题添加了更多的上下文，例如，生成的文本应该打印为“HS 09-咖啡、茶、Maté和香料”确实是一个有效的Unicode代码点。@P.Jakobsen，是

\xe9

是有效的Unicode字符U+00e9。要获取所需字符，只需按原样打印即可。如果打印包含该字符串的列表或元组，它将使用该字符串的

repr

，这将转义ASCII集合之外的任何字符。@P.Jakobsen，

replace

应该没有任何区别

u'\xe9'

和

u'é'

应该相同。尝试

print data[1]

而不是

print data

，看看我刚才说的是什么。

encode

\xe9

是有效的Unicode字符U+00e9。要获取所需字符，只需按原样打印即可。如果打印包含该字符串的列表或元组，它将使用该字符串的

repr

，这将转义ASCII集合之外的任何字符。@P.Jakobsen，

replace

应该没有任何区别

u'\xe9'

和

u'é'

应该相同。尝试

print data[1]

而不是

print data

，看看我刚才说的是什么。

encode

将Unicode字符串转换为字节字符串，因此应该有所不同。也许你的文件不是UTF-8？如果你能直接写一个Unicode字符串，就会有一些隐式编码。哇，真的这么简单吗？但是，即使字符串上有一个u“”，但\xe9肯定不是有效的unicode字符。所以它不是真正的utf-8，对吗？如果是这样的话，如果python不知道\xe9的原始编码是什么，它如何知道如何编码字符，例如latin-1、iso-8859-2等。我只是为这个问题添加了更多的上下文，例如，生成的文本应该打印为“HS 09-咖啡、茶、Maté和香料”确实是一个有效的Unicode代码点。@P.Jakobsen，yes




[utf 8]相关文章推荐



                                                        
提交表单中允许的字符（包括UTF-8）
utf-8 
Utf 8 向UITextView添加换行符
utf-8 
Utf 8 如何获取Microsoft'；s AntiXss库是否将URL编码为URI标准（RFC3986）而不是IRI（RFC3987）？
utf-8seo 
LineNumberReader支持UTF-8编码
utf-8 
Utf 8 ANTLR 3-如何使用非交叉特殊字符制作独特的令牌
utf-8antlr 
Utf 8 Lua string.match utf-询问西班牙语字符-获得半葡萄牙语
utf-8lua 
Utf 8 如何取消JavaFX密码字段的屏蔽或正确屏蔽文本字段？
utf-8javafx-2 
Pharo中的XMLParser声明U+；00A0是“0”；无效的UTF-8“；
utf-8smalltalk 
Utf 8 FTP支持UTF字符集吗？
utf-8character-encodingftp 
Utf 8 长生不老药
utf-8elixir 
Utf 8 从bash中的大型文本文件中删除拉丁语-1字符
utf-8 
当数组包含UTF-8字符时，CodeCeption assertContains失败
utf-8phpunit 
                                       





随机文章推荐



                                                        
Visual studio 运行Visual Studio中不可用的测试
visual-studio 
Visual studio 接口是否应该在与其实现分离的项目中？
visual-studiointerface 
Visual studio FogBugz随需应变&x2B；低成本/无成本的在线源代码控制？
visual-studioversion-control 
Visual studio 如何从VisualStudio2008解决方案导出类列表
visual-studiovisual-studio-2008 
Visual studio 在MSVC 2010项目中的每个文件上运行预构建事件
visual-studiobatch-file 
Visual studio 是否可以从TFS中的源资源管理器创建新的团队项目？
我们只使用Team Foundation Server 2010进行源代码管理。我们并不真正使用it的应用程序生命周期管理方面
visual-studiovisual-studio-2010tfs 
Visual studio 我可以在Microsoft Visual Studio Express 2013 windows 8中创建windows窗体应用程序吗？
visual-studio 
Visual studio 为什么Visual Studio 2013非常慢？
visual-studiovisual-studio-2013 
Visual studio CUIT在其他机器上失败
visual-studiotestinguser-interfaceautomated-tests 
Visual studio 如何在visual studio 2013 Comunity中开发windows phone 8.0应用程序？
visual-studiowindows-phone-8windows-phonewindows-phone-8.1 
Visual studio 如何隐藏项目？
visual-studiovisual-studio-2013 
Visual studio RDLC报告：在表头使用列标题
visual-studio 
Visual studio 什么是；“加载播放列表已启动”；在VisualStudio中是什么意思？
visual-studiovisual-studio-2015 
Visual studio powershell pmc:can'；t使用通配符将包安装到特定项目
visual-studiopowershellnuget 
Visual studio Visual Studio dotnet核心复制和粘贴引用
visual-studio.net-corevisual-studio-2017 
Visual studio 自动更新不适用于已配置的目标平台最低版本
visual-studiouwpvisual-studio-2017 
Visual studio node gyp-如何生成包含NatVis文件的Visual Studio项目
visual-studiovisual-studio-2017 
Visual studio DevOps CI管道无法声明Microsoft.Bcl.Build
visual-studio 
Visual studio VisualStudio诊断工具。无法启用提供程序
visual-studio 
Visual studio 是否有方法更改VisualStudio中项目的默认包含路径？
visual-studio