Search 同义词样式的文本查找和解析
我们有一个客户,他正在寻找一种方法来导入和分类大量文本数据。必须对这些数据进行分类,有人建议,最简单的方法是查看description字段,并尝试匹配其中的单词,以查看是否可以为该特定记录派生一个类别 人们认为最好的方法是将这些词与每个类别的关键词进行匹配,如果不成功,则使用某种同义词查找,看看是否可以使用这些词。因此,例如,如果某个特定记录中有“automobile”一词,那么同义词查找可以将该词与“car”一词相匹配,后者将保留在“vehicle”类别中 有人知道web服务或其他查找字典以查找特定单词同义词的方法吗?项目经理建议为此购买谷歌企业搜索许可证,但据我所知,这并不能提供这些人想要的东西 任何关于让客户得到他们想要的东西的建议都将被感激地接受Search 同义词样式的文本查找和解析,search,import,synonym,Search,Import,Synonym,我们有一个客户,他正在寻找一种方法来导入和分类大量文本数据。必须对这些数据进行分类,有人建议,最简单的方法是查看description字段,并尝试匹配其中的单词,以查看是否可以为该特定记录派生一个类别 人们认为最好的方法是将这些词与每个类别的关键词进行匹配,如果不成功,则使用某种同义词查找,看看是否可以使用这些词。因此,例如,如果某个特定记录中有“automobile”一词,那么同义词查找可以将该词与“car”一词相匹配,后者将保留在“vehicle”类别中 有人知道web服务或其他查找字典以查
谢谢!我会调查Wordnet
你知道还有其他类型的文本分类软件产品吗。我看到有一些关于使用Bayasian算法的讨论,但我看不到任何真实世界的例子。首先想到的是。Wordnet是一个人工生成的词汇和相关词汇数据库,包括同义词。列出了Wordnet的几个接口。我相信其中一些是web服务。 你也可以自己滚。展示了如何做到这一点 话虽如此,您是否解决了正确的问题?如何建立类别列表?
这是一种等级制度吗?标签云?请参阅,以获取对等级类别的批评。我认为,如果你根据一组单词(例如朴素贝叶斯)而不是单个单词进行分类,那么同义词就不那么重要了。你应该看看如何使用WordNet。您可以访问他们的网站以获取更多信息,但有许多库可用于以多种语言与他们进行集成 转到他们的在线工具,查看其在此处的实际使用情况:。如果您查找一个单词,然后单击每个定义旁边的“S”,您将得到一个与该定义语义相关的单词列表 我还认为您应该查看允许您执行“文档集群”的软件。下面是一个示例:。这将有助于引导类别创建过程
我认为这将有助于你实现你的目标 对于文本分类,您可以查看