Warning: file_get_contents(/data/phpspider/zhask/data//catemap/2/google-app-engine/4.json): failed to open stream: No such file or directory in /data/phpspider/zhask/libs/function.php on line 167

Warning: Invalid argument supplied for foreach() in /data/phpspider/zhask/libs/tag.function.php on line 1116

Notice: Undefined index: in /data/phpspider/zhask/libs/function.php on line 180

Warning: array_chunk() expects parameter 1 to be array, null given in /data/phpspider/zhask/libs/function.php on line 181
Google app engine 谷歌搜索API消除了停止词吗?_Google App Engine_Search - Fatal编程技术网

Google app engine 谷歌搜索API消除了停止词吗?

Google app engine 谷歌搜索API消除了停止词吗?,google-app-engine,search,Google App Engine,Search,考虑一下谷歌搜索API中的搜索查询是否为“我爱你”。 在这个查询中,“I”和“you”是停止词,它们几乎出现在每个文档中。此搜索中出现的关键字是“Love”,应进行搜索。因此,必须有一个过程来检测停止词,并将它们从我们提供给API的文档列表中删除。谷歌是在他们的搜索API中自动完成的,还是我们必须在启动查询之前处理搜索查询?如果谷歌已经使用IDF(反向文档频率)表来消除(或降低优先级)停止词,他们怎么做?如果没有,我们如何才能消除这些停止词?该算法(如果有的话)是否也适用于其他(本地)语言 指向

考虑一下谷歌搜索API中的搜索查询是否为“我爱你”。 在这个查询中,“I”和“you”是停止词,它们几乎出现在每个文档中。此搜索中出现的关键字是“Love”,应进行搜索。因此,必须有一个过程来检测停止词,并将它们从我们提供给API的文档列表中删除。谷歌是在他们的搜索API中自动完成的,还是我们必须在启动查询之前处理搜索查询?如果谷歌已经使用IDF(反向文档频率)表来消除(或降低优先级)停止词,他们怎么做?如果没有,我们如何才能消除这些停止词?该算法(如果有的话)是否也适用于其他(本地)语言


指向谷歌搜索API的链接

谷歌全文搜索API不会消除停止词

如果您使用搜索查询“我爱您”执行全局搜索,您将只获得包含所有3个单词的文档,而不仅仅是停止词

单词、带引号的字符串、数字和日期之间的空白为 作为隐式AND运算符处理

如果您希望在字段内搜索时使用相同的功能,请使用以下方法:

如果将查询括在括号中,则搜索将只返回包含查询中所有单词的文档

对于“我爱你”的情况,搜索查询应为:

field_name = "(I Love You)"


这样,您将只获得包含所有单词的文档,而不只是停止单词。

您只需在索引中搜索单词“Love”。 如果要在文本中的任何位置搜索单词,可以使用通配符*

field_name = "Love*"

它们不会被消除,但你可以控制你给索引的内容。
field_name = "Love*"