Java UMBC语义相似性实现

Java UMBC语义相似性实现,java,nlp,semantics,semantic-web,information-retrieval,Java,Nlp,Semantics,Semantic Web,Information Retrieval,我正在使用UMBC提供的语义相似性web API。在我的java程序中,我发送一个HTTP请求 我解析输出以得到结果 我遇到的问题是,我正在处理大规模数据。这需要很长时间,我不得不做很多次。我想知道是否有一种更快的方法可以用java查询Web API?或者,是否有此工具的可实现版本?对于不是NLP专家的人来说,实现它有多容易?听起来您想要快速处理许多短语对,而这里提供的API不可用 您可以选择以下选项来避免网络带来的痛苦: 使用批量可用的替代API。如果有一个调用同时接受多对短语并输出多个相似性

我正在使用UMBC提供的语义相似性web API。在我的java程序中,我发送一个HTTP请求 我解析输出以得到结果


我遇到的问题是,我正在处理大规模数据。这需要很长时间,我不得不做很多次。我想知道是否有一种更快的方法可以用java查询Web API?或者,是否有此工具的可实现版本?对于不是NLP专家的人来说,实现它有多容易?

听起来您想要快速处理许多短语对,而这里提供的API不可用

您可以选择以下选项来避免网络带来的痛苦:

  • 使用批量可用的替代API。如果有一个调用同时接受多对短语并输出多个相似性分数,这将允许您加快速度——但只要它们的API包含
    的函数调用(lhs,rhs)->score
    您将受到调用函数速度的限制 有一个被关闭为脱离主题的API,但它提到了一个提供“批量”比较的API

  • 要求源代码自己运行。联系API托管组织,询问他们是否可以公开或仅向您提供源代码
  • 自己实施他们的方法或类似的方法。
  • 为了帮助3,我在下面提供了一些资源

    翻开他们的书,我发现这本书可能很有趣

    Abhay L.Kashyap等人,《语言资源与评估》,2016年1月,73次下载

    对于一些更容易实现,至少在性能上有竞争力的东西,我建议使用单词向量的方法来表示相似性,比如or(你可能需要重新训练才能得到你想要的短语大小,或者你可以通过平均或添加向量来表示短语)