Warning: file_get_contents(/data/phpspider/zhask/data//catemap/9/javascript/408.json): failed to open stream: No such file or directory in /data/phpspider/zhask/libs/function.php on line 167

Warning: Invalid argument supplied for foreach() in /data/phpspider/zhask/libs/tag.function.php on line 1116

Notice: Undefined index: in /data/phpspider/zhask/libs/function.php on line 180

Warning: array_chunk() expects parameter 1 to be array, null given in /data/phpspider/zhask/libs/function.php on line 181
Javascript 如何获取字符的Unicode属性?_Javascript_Python - Fatal编程技术网

Javascript 如何获取字符的Unicode属性?

Javascript 如何获取字符的Unicode属性?,javascript,python,Javascript,Python,在Python中,我将使用Unicode数据包来标识字符串开头的标点字符: import unicodedata as UD _string = '¿para qué?' if UD.category(_string[0]).startswith('P'): print('Punctuation at beginning of string.') 在Javascript中有这样做的方法吗?您可以使用: !!str.match(/^[.,:!?]/) 这将告诉您字符串是否以[]中的任

在Python中,我将使用Unicode数据包来标识字符串开头的标点字符:

import unicodedata as UD

_string = '¿para qué?'
if UD.category(_string[0]).startswith('P'):
    print('Punctuation at beginning of string.')
在Javascript中有这样做的方法吗?

您可以使用:

!!str.match(/^[.,:!?]/)
这将告诉您字符串是否以[]中的任何字符开头。

您可以使用:

!!str.match(/^[.,:!?]/)

这将告诉您字符串是否以[]中的任何字符开头。

似乎没有内置的方法来获取此信息

粗略的搜索显示,它有一个流行的包,其构建脚本使用名为的包编译JSON数据库

codepoints包包含几个大型文本文件,这些文件似乎来自位于的Unicode字符数据库


由此我可以得出结论,在JS中获取信息的唯一方法是通过这个外部源。

似乎没有内置的方法来获取这些信息

粗略的搜索显示,它有一个流行的包,其构建脚本使用名为的包编译JSON数据库

codepoints包包含几个大型文本文件,这些文件似乎来自位于的Unicode字符数据库


由此我可以得出结论,在JS中获取信息的唯一方法是通过这个外部源。

谢谢Christoph!正是我想要的。 在使用npm安装unicode属性之后

var unicode = require('unicode-properties')
unicode.getCategory('¿para qué?'.charCodeAt())

这将返回'Po',它告诉我我有一个标点符号

谢谢克里斯托夫!正是我想要的。 在使用npm安装unicode属性之后

var unicode = require('unicode-properties')
unicode.getCategory('¿para qué?'.charCodeAt())

这将返回'Po',它告诉我我有一个标点符号

@close投票者:这个问题要求提供与此功能相当的功能,但不是要求提供图书馆推荐。如果这个功能在JS中不存在,并且需要外部软件包,那么写一个答案说明这一点。这个问题没有离题,完全正确。我几乎想马上开始悬赏,但不能,因为现在它还新鲜。我意识到,作为一名js开发人员,我对unicode问题几乎没有经验。希望看到更多的输入。@close投票者:问题要求提供与此功能相当的功能,但不是要求提供库建议。如果这个功能在JS中不存在,并且需要外部软件包,那么写一个答案说明这一点。这个问题没有离题,完全正确。我几乎想马上开始悬赏,但不能,因为现在它还新鲜。我意识到,作为一名js开发人员,我对unicode问题几乎没有经验。我很想看到更多的输入。伙计,我想你把java和JavaScription搞混了。除了这些,Unicode还有很多标点符号。所有分类为Pc、Pd、Pi、Pf、Ps、Pe或Po的符号,显然目前总共有598个加号,\p{Punct}只匹配US-ASCII标点符号,这是!$%&'*+,-./:@[\]^{{124;}~我还发现了XRegExp。有了这个JavaScript库,我可以用以下模式匹配所有标点:var re=new XRegExp'\\p{percentration}';伙计,我觉得你把java和JavaScription搞混了。除了这些,Unicode还有很多标点符号。所有分类为Pc、Pd、Pi、Pf、Ps、Pe或Po的符号,显然目前总共有598个加号,\p{Punct}只匹配US-ASCII标点符号,这是!$%&'*+,-./:@[\]^{{124;}~我还发现了XRegExp。有了这个JavaScript库,我可以用以下模式匹配所有标点:var re=new XRegExp'\\p{percentration}';