Warning: file_get_contents(/data/phpspider/zhask/data//catemap/1/cocoa/3.json): failed to open stream: No such file or directory in /data/phpspider/zhask/libs/function.php on line 167

Warning: Invalid argument supplied for foreach() in /data/phpspider/zhask/libs/tag.function.php on line 1116

Notice: Undefined index: in /data/phpspider/zhask/libs/function.php on line 180

Warning: array_chunk() expects parameter 1 to be array, null given in /data/phpspider/zhask/libs/function.php on line 181
在iOS中检测自然语言中的数字,例如;1/2“-&燃气轮机;0.5,”;三十三“-&燃气轮机;33,“;打-&燃气轮机;12_Ios_Cocoa_Nlp - Fatal编程技术网

在iOS中检测自然语言中的数字,例如;1/2“-&燃气轮机;0.5,”;三十三“-&燃气轮机;33,“;打-&燃气轮机;12

在iOS中检测自然语言中的数字,例如;1/2“-&燃气轮机;0.5,”;三十三“-&燃气轮机;33,“;打-&燃气轮机;12,ios,cocoa,nlp,Ios,Cocoa,Nlp,我已经尝试过了,这在某种程度上是很好的,并且标记了一些示例,例如: "1" // assigns Number tag "one" // assigns Number tag "thirty" // assigns Number tag "1/2" // assigns Number,Punctuation,Number tags "0.5" // assigns OtherWord tag "½" [unicode half] // assigns OtherWord tag "half"

我已经尝试过了,这在某种程度上是很好的,并且标记了一些示例,例如:

"1" // assigns Number tag
"one" // assigns Number tag
"thirty" // assigns Number tag
"1/2" // assigns Number,Punctuation,Number tags
"0.5" // assigns OtherWord tag
"½" [unicode half] // assigns OtherWord tag
"half" // assigns Adverb tag (this one is technically accurate)
"ninety-nine" // assigns Number,Number or Number,Dash,Number depending on options
"dozen" // assigns OtherWord
但对于以下示例进行了分解:

"1" // assigns Number tag
"one" // assigns Number tag
"thirty" // assigns Number tag
"1/2" // assigns Number,Punctuation,Number tags
"0.5" // assigns OtherWord tag
"½" [unicode half] // assigns OtherWord tag
"half" // assigns Adverb tag (this one is technically accurate)
"ninety-nine" // assigns Number,Number or Number,Dash,Number depending on options
"dozen" // assigns OtherWord
有没有一种方法:

  • 扩展/改进NSLingusticTagger以获得所需的行为
  • 使用与iOS兼容的替代方法/API/库
或者我应该回到启发式,例如,尝试强制令牌浮动(应该捕获
0.5
),然后创建一个包含其他可能性的字典(例如
half
quarter
8th
,等等)进行搜索,然后查找分数的模式
数字、标点符号、数字


无论哪种方式,我都希望以某种方式提取这些浮点数!如果在iOS中没有这样做的好方法,那么了解从何处开始(例如Python/NLTK)将不胜感激。

使用软件包:

谢谢;这正是我想要的,但似乎并不适合iOS。它的许可证是有限制的,并且是用Java编写的,这在iOS中是不受支持的。你知道有什么出版物解释过这是怎么做的吗?伊利诺伊认知计算小组似乎还没有发表这项工作。通常,这些方法使用大量正则表达式。用来描述数字的词只有这么多。你也可以看看(除了它也是Java)。@mayhewsw谢谢你的链接;该页面上有一些有用的出版物可供开始使用。我不确定他们只是在使用正则表达式,它看起来像是和词性标记器结合在一起的。