Java 社交媒体俚语标识符
我正在做一个关于社交媒体俚语标识符的项目。我必须从不同的评论中识别缩写。但问题是,假设在一个特定的评论中写的是GM(意思是早上好),同时在其他一些评论中又写了GM(意思是总经理) 因此,我需要区分这两种情况,尽管在这两种情况下(即通用汽车)显示相同。Java 社交媒体俚语标识符,java,spring,Java,Spring,我正在做一个关于社交媒体俚语标识符的项目。我必须从不同的评论中识别缩写。但问题是,假设在一个特定的评论中写的是GM(意思是早上好),同时在其他一些评论中又写了GM(意思是总经理) 因此,我需要区分这两种情况,尽管在这两种情况下(即通用汽车)显示相同。 我对这个问题真的很困惑。我对此一无所知 有谁能帮我克服这个困难吗 这是一个难题。您需要一些语义算法来进行区分。 您不能仅从语法或仅从文本表示推断其含义 谷歌“消除歧义自然语言处理”。您将看到大量资源。 这只是给你一个提示。如前所述,这个问题是广泛而
我对这个问题真的很困惑。我对此一无所知
有谁能帮我克服这个困难吗 这是一个难题。您需要一些语义算法来进行区分。
您不能仅从语法或仅从文本表示推断其含义 谷歌“消除歧义自然语言处理”。您将看到大量资源。
这只是给你一个提示。如前所述,这个问题是广泛而复杂的 这听起来是一个非常复杂的问题。 根据我的理解,你需要一本包含这些缩写词的大词典,还有
词法字段(也称为它们的使用)
为了检测词法字段
,你还可以将说话者分为“工作相关”或“大学同事”或“酒友”,并可能对这些组有一个标准,以便使用其他用户的数据。为了理解这一点,你可能可以理解俚语的一种同义词,即
因此,例如,如果有人说“GM的反馈实际上相当好”,你不仅会理解这是一个常用名词,而且反馈也来自“业务”词汇字段
一个实际的时间框架,以及您将使用的数据将非常有用,我将相应地编辑此答案。搜索的实际术语非常有用。+1您能给我一些更清楚的想法吗