在iOS中检测自然语言中的数字,例如;1/2“-&燃气轮机;0.5,”;三十三“-&燃气轮机;33,“;打-&燃气轮机;12
我已经尝试过了,这在某种程度上是很好的,并且标记了一些示例,例如:在iOS中检测自然语言中的数字,例如;1/2“-&燃气轮机;0.5,”;三十三“-&燃气轮机;33,“;打-&燃气轮机;12,ios,cocoa,nlp,Ios,Cocoa,Nlp,我已经尝试过了,这在某种程度上是很好的,并且标记了一些示例,例如: "1" // assigns Number tag "one" // assigns Number tag "thirty" // assigns Number tag "1/2" // assigns Number,Punctuation,Number tags "0.5" // assigns OtherWord tag "½" [unicode half] // assigns OtherWord tag "half"
"1" // assigns Number tag
"one" // assigns Number tag
"thirty" // assigns Number tag
"1/2" // assigns Number,Punctuation,Number tags
"0.5" // assigns OtherWord tag
"½" [unicode half] // assigns OtherWord tag
"half" // assigns Adverb tag (this one is technically accurate)
"ninety-nine" // assigns Number,Number or Number,Dash,Number depending on options
"dozen" // assigns OtherWord
但对于以下示例进行了分解:
"1" // assigns Number tag
"one" // assigns Number tag
"thirty" // assigns Number tag
"1/2" // assigns Number,Punctuation,Number tags
"0.5" // assigns OtherWord tag
"½" [unicode half] // assigns OtherWord tag
"half" // assigns Adverb tag (this one is technically accurate)
"ninety-nine" // assigns Number,Number or Number,Dash,Number depending on options
"dozen" // assigns OtherWord
有没有一种方法:
- 扩展/改进NSLingusticTagger以获得所需的行为
- 使用与iOS兼容的替代方法/API/库
0.5
),然后创建一个包含其他可能性的字典(例如half
,quarter
,8th
,等等)进行搜索,然后查找分数的模式数字、标点符号、数字
无论哪种方式,我都希望以某种方式提取这些浮点数!如果在iOS中没有这样做的好方法,那么了解从何处开始(例如Python/NLTK)将不胜感激。使用软件包:
谢谢;这正是我想要的,但似乎并不适合iOS。它的许可证是有限制的,并且是用Java编写的,这在iOS中是不受支持的。你知道有什么出版物解释过这是怎么做的吗?伊利诺伊认知计算小组似乎还没有发表这项工作。通常,这些方法使用大量正则表达式。用来描述数字的词只有这么多。你也可以看看(除了它也是Java)。@mayhewsw谢谢你的链接;该页面上有一些有用的出版物可供开始使用。我不确定他们只是在使用正则表达式,它看起来像是和词性标记器结合在一起的。