使用Python在CSV中处理非标准美式英语字符和符号
我有一个商店名称的列表,有几千个,其中一些有非标准的美式英语字符,这是一个问题 例如,我的输入文件如下所示:使用Python在CSV中处理非标准美式英语字符和符号,python,csv,Python,Csv,我有一个商店名称的列表,有几千个,其中一些有非标准的美式英语字符,这是一个问题 例如,我的输入文件如下所示: store_name yéché Ázak ótndle #!/usr/bin/python -u # -*- coding: utf-8 -*- ## ## cp1252 to UTF-8 decoder ## ## An expansion of the code found at http://effbot.org/zone/unicode-gremlins.htm ##
store_name
yéché
Ázak
ótndle
#!/usr/bin/python -u
# -*- coding: utf-8 -*-
##
## cp1252 to UTF-8 decoder
##
## An expansion of the code found at http://effbot.org/zone/unicode-gremlins.htm
##
"""Converts stupid microsoft Windows 1252 characters to actual unicode,
so that the rest of the world can still use it.
"""
import re
## small collection:
#~ cp1252 = {
#~ # from http://www.microsoft.com/typography/unicode/1252.htm
#~ u"\x80": u"\u20AC", # EURO SIGN
#~ u"\x82": u"\u201A", # SINGLE LOW-9 QUOTATION MARK
#~ u"\x83": u"\u0192", # LATIN SMALL LETTER F WITH HOOK
#~ u"\x84": u"\u201E", # DOUBLE LOW-9 QUOTATION MARK
#~ u"\x85": u"\u2026", # HORIZONTAL ELLIPSIS
#~ u"\x86": u"\u2020", # DAGGER
#~ u"\x87": u"\u2021", # DOUBLE DAGGER
#~ u"\x88": u"\u02C6", # MODIFIER LETTER CIRCUMFLEX ACCENT
#~ u"\x89": u"\u2030", # PER MILLE SIGN
#~ u"\x8A": u"\u0160", # LATIN CAPITAL LETTER S WITH CARON
#~ u"\x8B": u"\u2039", # SINGLE LEFT-POINTING ANGLE QUOTATION MARK
#~ u"\x8C": u"\u0152", # LATIN CAPITAL LIGATURE OE
#~ u"\x8E": u"\u017D", # LATIN CAPITAL LETTER Z WITH CARON
#~ u"\x91": u"\u2018", # LEFT SINGLE QUOTATION MARK
#~ u"\x92": u"\u2019", # RIGHT SINGLE QUOTATION MARK
#~ u"\x93": u"\u201C", # LEFT DOUBLE QUOTATION MARK
#~ u"\x94": u"\u201D", # RIGHT DOUBLE QUOTATION MARK
#~ u"\x95": u"\u2022", # BULLET
#~ u"\x96": u"\u2013", # EN DASH
#~ u"\x97": u"\u2014", # EM DASH
#~ u"\x98": u"\u02DC", # SMALL TILDE
#~ u"\x99": u"\u2122", # TRADE MARK SIGN
#~ u"\x9A": u"\u0161", # LATIN SMALL LETTER S WITH CARON
#~ u"\x9B": u"\u203A", # SINGLE RIGHT-POINTING ANGLE QUOTATION MARK
#~ u"\x9C": u"\u0153", # LATIN SMALL LIGATURE OE
#~ u"\x9E": u"\u017E", # LATIN SMALL LETTER Z WITH CARON
#~ u"\x9F": u"\u0178", # LATIN CAPITAL LETTER Y WITH DIAERESIS
#~ }
## bigger collection:
cp1252 = {
u"\x80": u"\u20AC", # e282ac
u"\x81": u"\uFFFD", # ` ? efbfbd
u"\x82": u"\u201A", # e2809a
u"\x83": u"\u0192", # à à c692
u"\x84": u"\u201E", # Ġ Ġ e2809e
u"\x85": u"\u2026", # Š Š e280a6
u"\x86": u"\u2020", # Ơ Ơ e280a0
u"\x87": u"\u2021", # Ǡ Ǡ e280a1
u"\x88": u"\u02C6", # Ƞ Ƞ cb86
u"\x89": u"\u2030", # ɠ ɠ e280b0
u"\x8a": u"\u0160", # ʠ ʠ c5a0
u"\x8b": u"\u2039", # ˠ ˠ e280b9
u"\x8c": u"\u0152", # ̠ ̠ c592
u"\x8d": u"\uFFFD", # ͠ ? efbfbd
u"\x8e": u"\u017D", # Π Π c5bd
u"\x8f": u"\uFFFD", # Ϡ ? efbfbd
u"\x90": u"\uFFFD", # Р ? efbfbd
u"\x91": u"\u2018", # Ѡ Ѡ e28098
u"\x92": u"\u2019", # Ҡ Ҡ e28099
u"\x93": u"\u201C", # Ӡ Ӡ e2809c
u"\x94": u"\u201D", # Ԡ Ԡ e2809d
u"\x95": u"\u2022", # ՠ ՠ e280a2
u"\x96": u"\u2013", # ֠ ֠ e28093
u"\x97": u"\u2014", # נ נ e28094
u"\x98": u"\u02DC", # ؠ ؠ cb9c
u"\x99": u"\u2122", # ٠ ٠ e284a2
u"\x9a": u"\u0161", # ڠ ڠ c5a1
u"\x9b": u"\u203A", # ۠ ۠ e280ba
u"\x9c": u"\u0153", # ܠ ܠ c593
u"\x9d": u"\uFFFD", # ݠ ? efbfbd
u"\x9e": u"\u017E", # ޠ ޠ c5be
u"\x9f": u"\u0178", # ߠ ߠ c5b8
u"\xa0": u"\u00A0", # c2a0
u"\xa1": u"\u00A1", # ` ` c2a1
u"\xa2": u"\u00A2", # c2a2
u"\xa3": u"\u00A3", # à à c2a3
u"\xa4": u"\u00A4", # Ġ Ġ c2a4
u"\xa5": u"\u00A5", # Š Š c2a5
u"\xa6": u"\u00A6", # Ơ Ơ c2a6
u"\xa7": u"\u00A7", # Ǡ Ǡ c2a7
u"\xa8": u"\u00A8", # Ƞ Ƞ c2a8
u"\xa9": u"\u00A9", # ɠ ɠ c2a9
u"\xaa": u"\u00AA", # ʠ ʠ c2aa
u"\xab": u"\u00AB", # ˠ ˠ c2ab
u"\xac": u"\u00AC", # ̠ ̠ c2ac
u"\xad": u"\u00AD", # ͠ ͠ c2ad
u"\xae": u"\u00AE", # Π Π c2ae
u"\xaf": u"\u00AF", # Ϡ Ϡ c2af
u"\xb0": u"\u00B0", # Р Р c2b0
u"\xb1": u"\u00B1", # Ѡ Ѡ c2b1
u"\xb2": u"\u00B2", # Ҡ Ҡ c2b2
u"\xb3": u"\u00B3", # Ӡ Ӡ c2b3
u"\xb4": u"\u00B4", # Ԡ Ԡ c2b4
u"\xb5": u"\u00B5", # ՠ ՠ c2b5
u"\xb6": u"\u00B6", # ֠ ֠ c2b6
u"\xb7": u"\u00B7", # נ נ c2b7
u"\xb8": u"\u00B8", # ؠ ؠ c2b8
u"\xb9": u"\u00B9", # ٠ ٠ c2b9
u"\xba": u"\u00BA", # ڠ ڠ c2ba
u"\xbb": u"\u00BB", # ۠ ۠ c2bb
u"\xbc": u"\u00BC", # ܠ ܠ c2bc
u"\xbd": u"\u00BD", # ݠ ݠ c2bd
u"\xbe": u"\u00BE", # ޠ ޠ c2be
u"\xbf": u"\u00BF", # ߠ ߠ c2bf
u"\xc0": u"\u00C0", # c380
u"\xc1": u"\u00C1", # ` ` c381
u"\xc2": u"\u00C2", # c382
u"\xc3": u"\u00C3", # à à c383
u"\xc4": u"\u00C4", # Ġ Ġ c384
u"\xc5": u"\u00C5", # Š Š c385
u"\xc6": u"\u00C6", # Ơ Ơ c386
u"\xc7": u"\u00C7", # Ǡ Ǡ c387
u"\xc8": u"\u00C8", # Ƞ Ƞ c388
u"\xc9": u"\u00C9", # ɠ ɠ c389
u"\xca": u"\u00CA", # ʠ ʠ c38a
u"\xcb": u"\u00CB", # ˠ ˠ c38b
u"\xcc": u"\u00CC", # ̠ ̠ c38c
u"\xcd": u"\u00CD", # ͠ ͠ c38d
u"\xce": u"\u00CE", # Π Π c38e
u"\xcf": u"\u00CF", # Ϡ Ϡ c38f
u"\xd0": u"\u00D0", # Р Р c390
u"\xd1": u"\u00D1", # Ѡ Ѡ c391
u"\xd2": u"\u00D2", # Ҡ Ҡ c392
u"\xd3": u"\u00D3", # Ӡ Ӡ c393
u"\xd4": u"\u00D4", # Ԡ Ԡ c394
u"\xd5": u"\u00D5", # ՠ ՠ c395
u"\xd6": u"\u00D6", # ֠ ֠ c396
u"\xd7": u"\u00D7", # נ נ c397
u"\xd8": u"\u00D8", # ؠ ؠ c398
u"\xd9": u"\u00D9", # ٠ ٠ c399
u"\xda": u"\u00DA", # ڠ ڠ c39a
u"\xdb": u"\u00DB", # ۠ ۠ c39b
u"\xdc": u"\u00DC", # ܠ ܠ c39c
u"\xdd": u"\u00DD", # ݠ ݠ c39d
u"\xde": u"\u00DE", # ޠ ޠ c39e
u"\xdf": u"\u00DF", # ߠ ߠ c39f
u"\xe0": u"\u00E0", # ࠠ ࠠ c3a0
u"\xe1": u"\u00E1", # ᠠ ᠠ c3a1
u"\xe2": u"\u00E2", # ⠠ ⠠ c3a2
u"\xe3": u"\u00E3", # 㠠 㠠 c3a3
u"\xe4": u"\u00E4", # 䠠 䠠 c3a4
u"\xe5": u"\u00E5", # 堠 堠 c3a5
u"\xe6": u"\u00E6", # 栠 栠 c3a6
u"\xe7": u"\u00E7", # 砠 砠 c3a7
u"\xe8": u"\u00E8", # 蠠 蠠 c3a8
u"\xe9": u"\u00E9", # 頠 頠 c3a9
u"\xea": u"\u00EA", # ꠠ ꠠ c3aa
u"\xeb": u"\u00EB", # 렠 렠 c3ab
u"\xec": u"\u00EC", # 젠 젠 c3ac
u"\xed": u"\u00ED", # �� �� c3ad
u"\xee": u"\u00EE", # c3ae
u"\xef": u"\u00EF", # c3af
u"\xf0": u"\u00F0", # You can use decode and encode:
print a
péché
Álak
óundle
print a.decode('latin9').encode('utf8'),
péché
Ãlak
óundle
我希望输出文件实际看起来像这样(顺便说一句,我认为是谷歌文档实现了这一点):
只有大约10条这样的规则可以将非标准美式英语字符转换成这种格式,所以我在excel中通过控制f来实现。但是我希望将来能够通过计算来做类似的事情,我只是想知道是否有一种使用Python快速完成这项工作的方法。明确地说,我想做的是:
é become é
Á become Ãi
您的问题很可能与MS Office套件的CP-1252“Windows Unicode”编码有关。如果你把它读成ASCII或UTF,你会得到时髦的字符
你可以做两件事:
强制MS Office使用其他编码。有些Office程序支持它,有些则不支持
在MS Office保存文件后重写该文件
要在python中执行2,可以使用如下内容:
store_name
yéché
Ázak
ótndle
#!/usr/bin/python -u
# -*- coding: utf-8 -*-
##
## cp1252 to UTF-8 decoder
##
## An expansion of the code found at http://effbot.org/zone/unicode-gremlins.htm
##
"""Converts stupid microsoft Windows 1252 characters to actual unicode,
so that the rest of the world can still use it.
"""
import re
## small collection:
#~ cp1252 = {
#~ # from http://www.microsoft.com/typography/unicode/1252.htm
#~ u"\x80": u"\u20AC", # EURO SIGN
#~ u"\x82": u"\u201A", # SINGLE LOW-9 QUOTATION MARK
#~ u"\x83": u"\u0192", # LATIN SMALL LETTER F WITH HOOK
#~ u"\x84": u"\u201E", # DOUBLE LOW-9 QUOTATION MARK
#~ u"\x85": u"\u2026", # HORIZONTAL ELLIPSIS
#~ u"\x86": u"\u2020", # DAGGER
#~ u"\x87": u"\u2021", # DOUBLE DAGGER
#~ u"\x88": u"\u02C6", # MODIFIER LETTER CIRCUMFLEX ACCENT
#~ u"\x89": u"\u2030", # PER MILLE SIGN
#~ u"\x8A": u"\u0160", # LATIN CAPITAL LETTER S WITH CARON
#~ u"\x8B": u"\u2039", # SINGLE LEFT-POINTING ANGLE QUOTATION MARK
#~ u"\x8C": u"\u0152", # LATIN CAPITAL LIGATURE OE
#~ u"\x8E": u"\u017D", # LATIN CAPITAL LETTER Z WITH CARON
#~ u"\x91": u"\u2018", # LEFT SINGLE QUOTATION MARK
#~ u"\x92": u"\u2019", # RIGHT SINGLE QUOTATION MARK
#~ u"\x93": u"\u201C", # LEFT DOUBLE QUOTATION MARK
#~ u"\x94": u"\u201D", # RIGHT DOUBLE QUOTATION MARK
#~ u"\x95": u"\u2022", # BULLET
#~ u"\x96": u"\u2013", # EN DASH
#~ u"\x97": u"\u2014", # EM DASH
#~ u"\x98": u"\u02DC", # SMALL TILDE
#~ u"\x99": u"\u2122", # TRADE MARK SIGN
#~ u"\x9A": u"\u0161", # LATIN SMALL LETTER S WITH CARON
#~ u"\x9B": u"\u203A", # SINGLE RIGHT-POINTING ANGLE QUOTATION MARK
#~ u"\x9C": u"\u0153", # LATIN SMALL LIGATURE OE
#~ u"\x9E": u"\u017E", # LATIN SMALL LETTER Z WITH CARON
#~ u"\x9F": u"\u0178", # LATIN CAPITAL LETTER Y WITH DIAERESIS
#~ }
## bigger collection:
cp1252 = {
u"\x80": u"\u20AC", # e282ac
u"\x81": u"\uFFFD", # ` ? efbfbd
u"\x82": u"\u201A", # e2809a
u"\x83": u"\u0192", # à à c692
u"\x84": u"\u201E", # Ġ Ġ e2809e
u"\x85": u"\u2026", # Š Š e280a6
u"\x86": u"\u2020", # Ơ Ơ e280a0
u"\x87": u"\u2021", # Ǡ Ǡ e280a1
u"\x88": u"\u02C6", # Ƞ Ƞ cb86
u"\x89": u"\u2030", # ɠ ɠ e280b0
u"\x8a": u"\u0160", # ʠ ʠ c5a0
u"\x8b": u"\u2039", # ˠ ˠ e280b9
u"\x8c": u"\u0152", # ̠ ̠ c592
u"\x8d": u"\uFFFD", # ͠ ? efbfbd
u"\x8e": u"\u017D", # Π Π c5bd
u"\x8f": u"\uFFFD", # Ϡ ? efbfbd
u"\x90": u"\uFFFD", # Р ? efbfbd
u"\x91": u"\u2018", # Ѡ Ѡ e28098
u"\x92": u"\u2019", # Ҡ Ҡ e28099
u"\x93": u"\u201C", # Ӡ Ӡ e2809c
u"\x94": u"\u201D", # Ԡ Ԡ e2809d
u"\x95": u"\u2022", # ՠ ՠ e280a2
u"\x96": u"\u2013", # ֠ ֠ e28093
u"\x97": u"\u2014", # נ נ e28094
u"\x98": u"\u02DC", # ؠ ؠ cb9c
u"\x99": u"\u2122", # ٠ ٠ e284a2
u"\x9a": u"\u0161", # ڠ ڠ c5a1
u"\x9b": u"\u203A", # ۠ ۠ e280ba
u"\x9c": u"\u0153", # ܠ ܠ c593
u"\x9d": u"\uFFFD", # ݠ ? efbfbd
u"\x9e": u"\u017E", # ޠ ޠ c5be
u"\x9f": u"\u0178", # ߠ ߠ c5b8
u"\xa0": u"\u00A0", # c2a0
u"\xa1": u"\u00A1", # ` ` c2a1
u"\xa2": u"\u00A2", # c2a2
u"\xa3": u"\u00A3", # à à c2a3
u"\xa4": u"\u00A4", # Ġ Ġ c2a4
u"\xa5": u"\u00A5", # Š Š c2a5
u"\xa6": u"\u00A6", # Ơ Ơ c2a6
u"\xa7": u"\u00A7", # Ǡ Ǡ c2a7
u"\xa8": u"\u00A8", # Ƞ Ƞ c2a8
u"\xa9": u"\u00A9", # ɠ ɠ c2a9
u"\xaa": u"\u00AA", # ʠ ʠ c2aa
u"\xab": u"\u00AB", # ˠ ˠ c2ab
u"\xac": u"\u00AC", # ̠ ̠ c2ac
u"\xad": u"\u00AD", # ͠ ͠ c2ad
u"\xae": u"\u00AE", # Π Π c2ae
u"\xaf": u"\u00AF", # Ϡ Ϡ c2af
u"\xb0": u"\u00B0", # Р Р c2b0
u"\xb1": u"\u00B1", # Ѡ Ѡ c2b1
u"\xb2": u"\u00B2", # Ҡ Ҡ c2b2
u"\xb3": u"\u00B3", # Ӡ Ӡ c2b3
u"\xb4": u"\u00B4", # Ԡ Ԡ c2b4
u"\xb5": u"\u00B5", # ՠ ՠ c2b5
u"\xb6": u"\u00B6", # ֠ ֠ c2b6
u"\xb7": u"\u00B7", # נ נ c2b7
u"\xb8": u"\u00B8", # ؠ ؠ c2b8
u"\xb9": u"\u00B9", # ٠ ٠ c2b9
u"\xba": u"\u00BA", # ڠ ڠ c2ba
u"\xbb": u"\u00BB", # ۠ ۠ c2bb
u"\xbc": u"\u00BC", # ܠ ܠ c2bc
u"\xbd": u"\u00BD", # ݠ ݠ c2bd
u"\xbe": u"\u00BE", # ޠ ޠ c2be
u"\xbf": u"\u00BF", # ߠ ߠ c2bf
u"\xc0": u"\u00C0", # c380
u"\xc1": u"\u00C1", # ` ` c381
u"\xc2": u"\u00C2", # c382
u"\xc3": u"\u00C3", # à à c383
u"\xc4": u"\u00C4", # Ġ Ġ c384
u"\xc5": u"\u00C5", # Š Š c385
u"\xc6": u"\u00C6", # Ơ Ơ c386
u"\xc7": u"\u00C7", # Ǡ Ǡ c387
u"\xc8": u"\u00C8", # Ƞ Ƞ c388
u"\xc9": u"\u00C9", # ɠ ɠ c389
u"\xca": u"\u00CA", # ʠ ʠ c38a
u"\xcb": u"\u00CB", # ˠ ˠ c38b
u"\xcc": u"\u00CC", # ̠ ̠ c38c
u"\xcd": u"\u00CD", # ͠ ͠ c38d
u"\xce": u"\u00CE", # Π Π c38e
u"\xcf": u"\u00CF", # Ϡ Ϡ c38f
u"\xd0": u"\u00D0", # Р Р c390
u"\xd1": u"\u00D1", # Ѡ Ѡ c391
u"\xd2": u"\u00D2", # Ҡ Ҡ c392
u"\xd3": u"\u00D3", # Ӡ Ӡ c393
u"\xd4": u"\u00D4", # Ԡ Ԡ c394
u"\xd5": u"\u00D5", # ՠ ՠ c395
u"\xd6": u"\u00D6", # ֠ ֠ c396
u"\xd7": u"\u00D7", # נ נ c397
u"\xd8": u"\u00D8", # ؠ ؠ c398
u"\xd9": u"\u00D9", # ٠ ٠ c399
u"\xda": u"\u00DA", # ڠ ڠ c39a
u"\xdb": u"\u00DB", # ۠ ۠ c39b
u"\xdc": u"\u00DC", # ܠ ܠ c39c
u"\xdd": u"\u00DD", # ݠ ݠ c39d
u"\xde": u"\u00DE", # ޠ ޠ c39e
u"\xdf": u"\u00DF", # ߠ ߠ c39f
u"\xe0": u"\u00E0", # ࠠ ࠠ c3a0
u"\xe1": u"\u00E1", # ᠠ ᠠ c3a1
u"\xe2": u"\u00E2", # ⠠ ⠠ c3a2
u"\xe3": u"\u00E3", # 㠠 㠠 c3a3
u"\xe4": u"\u00E4", # 䠠 䠠 c3a4
u"\xe5": u"\u00E5", # 堠 堠 c3a5
u"\xe6": u"\u00E6", # 栠 栠 c3a6
u"\xe7": u"\u00E7", # 砠 砠 c3a7
u"\xe8": u"\u00E8", # 蠠 蠠 c3a8
u"\xe9": u"\u00E9", # 頠 頠 c3a9
u"\xea": u"\u00EA", # ꠠ ꠠ c3aa
u"\xeb": u"\u00EB", # 렠 렠 c3ab
u"\xec": u"\u00EC", # 젠 젠 c3ac
u"\xed": u"\u00ED", # �� �� c3ad
u"\xee": u"\u00EE", # c3ae
u"\xef": u"\u00EF", # c3af
u"\xf0": u"\u00F0", # You can use decode and encode:
print a
péché
Álak
óundle
print a.decode('latin9').encode('utf8'),
péché
Ãlak
óundle
#/usr/bin/python-u
#-*-编码:utf-8-*-
##
##cp1252至UTF-8解码器
##
##在中找到的代码的扩展http://effbot.org/zone/unicode-gremlins.htm
##
“”“将愚蠢的microsoft Windows 1252字符转换为实际的unicode,
这样世界其他地区仍然可以使用它。
"""
进口稀土
##小型收藏:
#~cp1252={
#来自http://www.microsoft.com/typography/unicode/1252.htm
#~u“\x80”:u“\u20AC”,欧元符号
#~u“\x82”:u“\u201A”#单低9引号
#~u“\x83”:u“\u0192”,#带钩子的拉丁文小写字母F
#~u“\x84”:u“\u201E”#双低9引号
#~u“\x85”:u“\u2026”#水平省略号
#~u“\x86”:u“\u2020”,匕首
#~u“\x87”:u“\u2021”,双匕首
#~u“\x88”:u“\u02C6”,#修饰字母扬抑重音
#~u“\x89”:u“\u2030”,每千符号
#~u“\x8A”:u“\u0160”,拉丁文大写字母S随以CARON
#~u“\x8B”:u“\u2039”#单左尖角引号
#~u“\x8C”:u“\u0152”,#拉丁文大写连字OE
#~u“\x8E”:u“\u017D”,#带卡隆的拉丁文大写字母Z
#~u“\x91”:u“\u2018”,左单引号
#~u“\x92”:u“\u2019”,右单引号
#~u“\x93”:u“\u201C”,左双引号
#~u“\x94”:u“\u201D”,右双引号
#~u“\x95”:u“\u2022”,子弹头
#~u“\x96”:u“\u2013”
#~u“\x97”:u“\u2014”,EM DASH
#~u“\x98”:u“\u02DC”#小瓷砖
#~u“\x99”:u“\u2122”#商标符号
#~u“\x9A”:u“\u0161”,带CARON的拉丁文小写字母S
#~u“\x9B”:u“\u203A”,#单直角引号
#~u“\x9C”:u“\u0153”,#拉丁小连字OE
#~u“\x9E”:u“\u017E”,#带CARON的拉丁文小写字母Z
#~u“\x9F”:u“\u0178”,#带分音符的拉丁文大写字母Y
#~ }
##更大的收藏:
cp1252={
u“\x80”:u“\u20AC”,#e282ac
u“\x81”:u“\uFFFD”、#`?efbfbd
u“\x82”:u“\u201A”,#e2809a
u“\x83”:u“\u0192”,#a#c692
u“\x84”:u“\u201E”,#Ġe2809e
u“\x85”:u“\u2026”,#Še280a6
u“\x86”:u“\u2020”,#ƠƠe280a0
u“\x87”:u“\u2021”,#ǠǠe280a1
u“\x88”:u“\u02C6”,ŢȠȠcb86
u“\x89”:u“\u2030”,#ɠɠe280b0
u“\x8a”:u“\u0160”,Šʠc5a0
u“\x8b”:u“\u2039”,Ťˠˠe280b9
u“\x8c”:u“\u0152”;#̠̠c592
u“\x8d”:u“\uFFFD”、#͠?efbfbd
u“\x8e”:u“\u017D”,#∏∏∏c5bd
u“\x8f”:u“\uFFFD”、#efbfbd
u“\x90”:u“\uFFFD”、#П?efbfbd
u“\x91”:u“\u2018”,ѠѠe28098
u“\x92”:u“\u2019”,#ҠҠe28099
u“\x93”:u“\u201C”,“ӠӠӠe2809c”
u“\x94”:u“\u201D”,ŠԠe2809d
u“\x95”:u“\u2022”,#ՠՠe280a2
u“\x96”:u“\u2013”;#֠֠e28093
u“\x97”:u“\u2014”,Ţננe28094
u“\x98”:u“\u02DC”;#ؠؠcb9c
u“\x99”:u“\u2122”,#٠٠e284a2
u“\x9a”:u“\u0161”,#ڠڠc5a1
u“\x9b”:u“\u203A”,e280ba
u“\x9c”:u“\u0153”,#ܠܠc593
u“\x9d”:u“\uFFFD”,#ݠ?efbfbd
u“\x9e”:u“\u017E”,Šޠc5be
u“\x9f”:u“\u0178”、#ߠߠc5b8
u“\xa0”:u“\u00A0”、#c2a0
u“\xa1”:u“\u00A1”,“c2a1”
u“\xa2”:u“\u00A2”,#c2a2
u“\xa3”:u“\u00A3”,#aác2a3
u“\xa4”:u“\u00A4”,#Ġc2a4
u“\xa5”:u“\u00A5”,#Šc2a5
u“\xa6”:u“\u00A6”、Ơc2a6
u“\xa7”:u“\u00A7”,#Ǡc2a7
u“\xa8”:u“\u00A8”,ŢȠc2a8
u“\xa9”:u“\u00A9”,“#ɠc2a9”
u“\xaa”:u“\u00AA”,Šʠc2aa
u“\xab”:u“\u00AB”,“c2ab”
u“\xac”:u“\u00AC”,#̠̠c2ac
u“\xad”:u“\u00AD”,“c2ad”
u“\xae”:u“\u00AE”,“#∏∏c2ae”
u“\xaf”:u“\u00AF”、#ϠϠc2af
u“\xb0”:u“\u00B0”、#####
u“\xb1”:u“\u00B1”,“ѠѠc2b1”
u“\xb2”:u“\u00B2”,#ҠҠc2b2
u“\xb3”:u“\u00B3”,#ӠӠc2b3
u“\xb4”:u“\u00B4”、ŠԠc2b4
u“\xb5”:u“\u00B5”、#ՠՠc2b5
u“\xb6”:u“\u00B6”;#֠֠c2b6
u“\xb7”:u“\u00B7”,Ţנc2b7
u“\xb8”:u“\u00B8”;#ؠؠc2b8
u“\xb9”:u“\u00B9”,#٠٠c2b9
u“\xba”:u“\u00BA”,“c2ba”
u“\xbb”:u“\u00BB”,#۠۠c2bb
u“\xbc”:u“\u00BC”,#ܠܠc2bc
u“\xbd”:u“\u00BD”,#ݠݠc2bd