Warning: file_get_contents(/data/phpspider/zhask/data//catemap/4/regex/16.json): failed to open stream: No such file or directory in /data/phpspider/zhask/libs/function.php on line 167

Warning: Invalid argument supplied for foreach() in /data/phpspider/zhask/libs/tag.function.php on line 1116

Notice: Undefined index: in /data/phpspider/zhask/libs/function.php on line 180

Warning: array_chunk() expects parameter 1 to be array, null given in /data/phpspider/zhask/libs/function.php on line 181
Java 正则表达式中的Unicode脚本_Java_Regex_Unicode_Character Properties - Fatal编程技术网

Java 正则表达式中的Unicode脚本

Java 正则表达式中的Unicode脚本,java,regex,unicode,character-properties,Java,Regex,Unicode,Character Properties,我想猜字符串的人类语言。我发现正则表达式中的Unicode脚本可以做到这一点。但我不知道这个剧本的名字代表什么。据我所知,Han代表中文,但是其他人呢?不知道它是否有用,但是这是一个关于编写脚本和语言的信息的很好的资源:。在使用regexp的功能时,您可能需要了解这些不同的脚本。我想这就是我需要的。谢谢@Jesper Unicode脚本名称及其速记别名列表,复制自: Unicode网站不回答这个问题吗?还有,你真的能做到吗?写语言的语言比脚本多得多。@Jesper谢谢,但它在哪里?@johus

我想猜字符串的人类语言。我发现正则表达式中的Unicode脚本可以做到这一点。但我不知道这个剧本的名字代表什么。据我所知,
Han
代表中文,但是其他人呢?

不知道它是否有用,但是这是一个关于编写脚本和语言的信息的很好的资源:。在使用regexp的功能时,您可能需要了解这些不同的脚本。

我想这就是我需要的。谢谢@Jesper

Unicode脚本名称及其速记别名列表,复制自:


Unicode网站不回答这个问题吗?还有,你真的能做到吗?写语言的语言比脚本多得多。@Jesper谢谢,但它在哪里?@johusman我不打算支持所有的语言Shere:
# Script (sc)

sc ; Aghb                ; Caucasian_Albanian
sc ; Arab                ; Arabic
sc ; Armi                ; Imperial_Aramaic
sc ; Armn                ; Armenian
sc ; Avst                ; Avestan
sc ; Bali                ; Balinese
sc ; Bamu                ; Bamum
sc ; Bass                ; Bassa_Vah
sc ; Batk                ; Batak
sc ; Beng                ; Bengali
sc ; Bopo                ; Bopomofo
sc ; Brah                ; Brahmi
sc ; Brai                ; Braille
sc ; Bugi                ; Buginese
sc ; Buhd                ; Buhid
sc ; Cakm                ; Chakma
sc ; Cans                ; Canadian_Aboriginal
sc ; Cari                ; Carian
sc ; Cham                ; Cham
sc ; Cher                ; Cherokee
sc ; Copt                ; Coptic                           ; Qaac
sc ; Cprt                ; Cypriot
sc ; Cyrl                ; Cyrillic
sc ; Deva                ; Devanagari
sc ; Dsrt                ; Deseret
sc ; Dupl                ; Duployan
sc ; Egyp                ; Egyptian_Hieroglyphs
sc ; Elba                ; Elbasan
sc ; Ethi                ; Ethiopic
sc ; Geor                ; Georgian
sc ; Glag                ; Glagolitic
sc ; Goth                ; Gothic
sc ; Gran                ; Grantha
sc ; Grek                ; Greek
sc ; Gujr                ; Gujarati
sc ; Guru                ; Gurmukhi
sc ; Hang                ; Hangul
sc ; Hani                ; Han
sc ; Hano                ; Hanunoo
sc ; Hebr                ; Hebrew
sc ; Hira                ; Hiragana
sc ; Hmng                ; Pahawh_Hmong
sc ; Hrkt                ; Katakana_Or_Hiragana
sc ; Ital                ; Old_Italic
sc ; Java                ; Javanese
sc ; Kali                ; Kayah_Li
sc ; Kana                ; Katakana
sc ; Khar                ; Kharoshthi
sc ; Khmr                ; Khmer
sc ; Khoj                ; Khojki
sc ; Knda                ; Kannada
sc ; Kthi                ; Kaithi
sc ; Lana                ; Tai_Tham
sc ; Laoo                ; Lao
sc ; Latn                ; Latin
sc ; Lepc                ; Lepcha
sc ; Limb                ; Limbu
sc ; Lina                ; Linear_A
sc ; Linb                ; Linear_B
sc ; Lisu                ; Lisu
sc ; Lyci                ; Lycian
sc ; Lydi                ; Lydian
sc ; Mahj                ; Mahajani
sc ; Mand                ; Mandaic
sc ; Mani                ; Manichaean
sc ; Mend                ; Mende_Kikakui
sc ; Merc                ; Meroitic_Cursive
sc ; Mero                ; Meroitic_Hieroglyphs
sc ; Mlym                ; Malayalam
sc ; Modi                ; Modi
sc ; Mong                ; Mongolian
sc ; Mroo                ; Mro
sc ; Mtei                ; Meetei_Mayek
sc ; Mymr                ; Myanmar
sc ; Narb                ; Old_North_Arabian
sc ; Nbat                ; Nabataean
sc ; Nkoo                ; Nko
sc ; Ogam                ; Ogham
sc ; Olck                ; Ol_Chiki
sc ; Orkh                ; Old_Turkic
sc ; Orya                ; Oriya
sc ; Osma                ; Osmanya
sc ; Palm                ; Palmyrene
sc ; Pauc                ; Pau_Cin_Hau
sc ; Perm                ; Old_Permic
sc ; Phag                ; Phags_Pa
sc ; Phli                ; Inscriptional_Pahlavi
sc ; Phlp                ; Psalter_Pahlavi
sc ; Phnx                ; Phoenician
sc ; Plrd                ; Miao
sc ; Prti                ; Inscriptional_Parthian
sc ; Rjng                ; Rejang
sc ; Runr                ; Runic
sc ; Samr                ; Samaritan
sc ; Sarb                ; Old_South_Arabian
sc ; Saur                ; Saurashtra
sc ; Shaw                ; Shavian
sc ; Shrd                ; Sharada
sc ; Sidd                ; Siddham
sc ; Sind                ; Khudawadi
sc ; Sinh                ; Sinhala
sc ; Sora                ; Sora_Sompeng
sc ; Sund                ; Sundanese
sc ; Sylo                ; Syloti_Nagri
sc ; Syrc                ; Syriac
sc ; Tagb                ; Tagbanwa
sc ; Takr                ; Takri
sc ; Tale                ; Tai_Le
sc ; Talu                ; New_Tai_Lue
sc ; Taml                ; Tamil
sc ; Tavt                ; Tai_Viet
sc ; Telu                ; Telugu
sc ; Tfng                ; Tifinagh
sc ; Tglg                ; Tagalog
sc ; Thaa                ; Thaana
sc ; Thai                ; Thai
sc ; Tibt                ; Tibetan
sc ; Tirh                ; Tirhuta
sc ; Ugar                ; Ugaritic
sc ; Vaii                ; Vai
sc ; Wara                ; Warang_Citi
sc ; Xpeo                ; Old_Persian
sc ; Xsux                ; Cuneiform
sc ; Yiii                ; Yi
sc ; Zinh                ; Inherited                        ; Qaai
sc ; Zyyy                ; Common
sc ; Zzzz                ; Unknown