Warning: file_get_contents(/data/phpspider/zhask/data//catemap/0/search/2.json): failed to open stream: No such file or directory in /data/phpspider/zhask/libs/function.php on line 167

Warning: Invalid argument supplied for foreach() in /data/phpspider/zhask/libs/tag.function.php on line 1116

Notice: Undefined index: in /data/phpspider/zhask/libs/function.php on line 180

Warning: array_chunk() expects parameter 1 to be array, null given in /data/phpspider/zhask/libs/function.php on line 181
Search 同义词样式的文本查找和解析_Search_Import_Synonym - Fatal编程技术网

Search 同义词样式的文本查找和解析

Search 同义词样式的文本查找和解析,search,import,synonym,Search,Import,Synonym,我们有一个客户,他正在寻找一种方法来导入和分类大量文本数据。必须对这些数据进行分类,有人建议,最简单的方法是查看description字段,并尝试匹配其中的单词,以查看是否可以为该特定记录派生一个类别 人们认为最好的方法是将这些词与每个类别的关键词进行匹配,如果不成功,则使用某种同义词查找,看看是否可以使用这些词。因此,例如,如果某个特定记录中有“automobile”一词,那么同义词查找可以将该词与“car”一词相匹配,后者将保留在“vehicle”类别中 有人知道web服务或其他查找字典以查

我们有一个客户,他正在寻找一种方法来导入和分类大量文本数据。必须对这些数据进行分类,有人建议,最简单的方法是查看description字段,并尝试匹配其中的单词,以查看是否可以为该特定记录派生一个类别

人们认为最好的方法是将这些词与每个类别的关键词进行匹配,如果不成功,则使用某种同义词查找,看看是否可以使用这些词。因此,例如,如果某个特定记录中有“automobile”一词,那么同义词查找可以将该词与“car”一词相匹配,后者将保留在“vehicle”类别中

有人知道web服务或其他查找字典以查找特定单词同义词的方法吗?项目经理建议为此购买谷歌企业搜索许可证,但据我所知,这并不能提供这些人想要的东西

任何关于让客户得到他们想要的东西的建议都将被感激地接受


谢谢!我会调查Wordnet


你知道还有其他类型的文本分类软件产品吗。我看到有一些关于使用Bayasian算法的讨论,但我看不到任何真实世界的例子。

首先想到的是。Wordnet是一个人工生成的词汇和相关词汇数据库,包括同义词。列出了Wordnet的几个接口。我相信其中一些是web服务。 你也可以自己滚。展示了如何做到这一点

话虽如此,您是否解决了正确的问题?如何建立类别列表?
这是一种等级制度吗?标签云?请参阅,以获取对等级类别的批评。我认为,如果你根据一组单词(例如朴素贝叶斯)而不是单个单词进行分类,那么同义词就不那么重要了。

你应该看看如何使用WordNet。您可以访问他们的网站以获取更多信息,但有许多库可用于以多种语言与他们进行集成

转到他们的在线工具,查看其在此处的实际使用情况:。如果您查找一个单词,然后单击每个定义旁边的“S”,您将得到一个与该定义语义相关的单词列表

我还认为您应该查看允许您执行“文档集群”的软件。下面是一个示例:。这将有助于引导类别创建过程


我认为这将有助于你实现你的目标

对于文本分类,您可以查看