Python 使用unicode替换特殊字符
如何根据德语拼写,将双引号替换为风格正确的引号(“U+201e”或“U+201c”) 例如: zitat=“涂尔干是”塔特贝斯特学院和韦尼格尔学院[…]学院学院” 我试过这个密码Python 使用unicode替换特殊字符,python,regex,unicode,Python,Regex,Unicode,如何根据德语拼写,将双引号替换为风格正确的引号(“U+201e”或“U+201c”) 例如: zitat=“涂尔干是”塔特贝斯特学院和韦尼格尔学院[…]学院学院” 我试过这个密码 import re zitatnew = re.sub(r'"', r'[u+201e]', zitat) print(zitatnew) Laut Durkheim ist ein [u+201e]soziologischer Tatbestand jede mehr oder weniger [...]
import re
zitatnew = re.sub(r'"', r'[u+201e]', zitat)
print(zitatnew)
Laut Durkheim ist ein [u+201e]soziologischer Tatbestand jede mehr oder weniger [...] unabhängiges Eigenleben besitzt[u+201e]
如何使用unicode将双引号替换为正确的引号
也许你们中的一个能帮我。
另外,我很抱歉我的英语不好!
我想你在找这个
re.sub(r'"', u"\u201E", zitat)
还是更合适
s = 'Laut Durkheim ist ein "soziologischer Tatbestand jede mehr oder weniger [...] unabhängiges Eigenleben besitzt"'
# substitute the opening quote
output = re.sub('\B"', u"\u201C", s)
# substitute the closing quote as well
output = re.sub('"\B', u"\u201D", output)
>>> output
'Laut Durkheim ist ein “soziologischer Tatbestand jede mehr oder weniger [...] unabhängiges Eigenleben besitzt”'
给
“涂尔干湖是”塔特贝斯特的soziologischer Tatbestand jede mehr Order weniger[…]unabhängies eignleben besitzt””
您可以在字符串中有
“
时进行迭代,并在每次迭代中替换一对引号:
zitat='Laut Durkheim is ein“soziologischer tatbest and jede mehr order weniger[…]unabhängages eignleben besitzt”'
打印(f“替换前:{zitat}”)
而zitat中的“\”:
zitat=zitat。替换(“\”,“\u201e”,1)
zitat=zitat。替换(“\”,“\u201c”,1)
打印(f“替换后:{zitat}”)
1
作为replace()
中的第三个参数,对于仅替换“
的第一个出现非常重要。这应该为任何具有偶数个”
的字符串提供正确的输出
输出:
更换前:劳特·迪尔凯姆是“塔特贝斯特和杰德·迈尔·奥德·维尼格尔[…]的建筑师”
更换后:劳特·迪尔凯姆被称为“塔特贝斯特学院和杰德·梅尔·奥德·维尼格尔学院[…]学院学院”
re.sub
比一次又一次地更换效率更高,使用更换功能可以一次完成:
重新导入
s=“this”是“一个”测试“字符串”
s=re.sub(r'(\b“)|(“\b)”,lambda m:'\u201c'如果m.group(1)else'\u201e',s)
印刷品
“此”是“测试”字符串
从这个答案开始:如果您想获得正确的“开始”和“结束”引号,取决于您的原始引号是在某个空格之后还是在新行开始,还是在行尾,或者后面是标点或空格,您可以使用以下两个命令:zitatnew=re.sub(“(\s))“^”,u“\\1\u201C”,zitat)
后接zitatnew=re.sub(“([\s\.?!])),“$”,u“\u201D\\1”,zitatnew)
。在您的示例中,这将给出:Laut Durkheim ist ein“soziologischer tatbest和jede mehr order weniger[…]unabhänges eignleben Besitz”