Warning: file_get_contents(/data/phpspider/zhask/data//catemap/9/java/326.json): failed to open stream: No such file or directory in /data/phpspider/zhask/libs/function.php on line 167

Warning: Invalid argument supplied for foreach() in /data/phpspider/zhask/libs/tag.function.php on line 1116

Notice: Undefined index: in /data/phpspider/zhask/libs/function.php on line 180

Warning: array_chunk() expects parameter 1 to be array, null given in /data/phpspider/zhask/libs/function.php on line 181
Java 从谷歌搜索中提取国家、城市和地点_Java_Google Search Api - Fatal编程技术网

Java 从谷歌搜索中提取国家、城市和地点

Java 从谷歌搜索中提取国家、城市和地点,java,google-search-api,Java,Google Search Api,我需要从谷歌搜索结果中提取场馆*国家*,城市。例如,我搜索“EEE图像处理计算智能研讨会”。我正在使用谷歌的自定义搜索api 我得到了这样一个片段 "snippet": "The Computer Security Foundations Symposium is an annual conference for researchers in ... It was created in 1988 as a workshop of the IEEE Computer Society Techn

我需要从谷歌搜索结果中提取场馆*国家*,城市。例如,我搜索“EEE图像处理计算智能研讨会”。我正在使用谷歌的自定义搜索api

我得到了这样一个片段

"snippet": "The Computer Security Foundations Symposium is an annual conference for 
researchers in ... It was created in 1988 as a workshop of the IEEE Computer 
Society Technical Committee on Security and ... CSF-26 was held at Tulane 
University, New Orleans, LA, June 26-28, 2013. ... CSFW-19 program and 5-
minute talks.", 

我如何从回复中提取“新奥尔良杜兰大学”……请注意,有多个结果,但假设我只取第一个包含此结果的结果。

鉴于您处理的是自然语言,这很困难。有一些可能性。这真的取决于输入

  • 您可以尝试使用templates/regex查找这些。如果您知道场馆由“举办地点”或“组织地点”等介绍,您可以使用该信息提取场馆/地点

  • 您可以使用POS/NE标记器标记单词。使用Standford CoreNLP管道产量(缩短,仅使用相关句子和信息):

    脑脊液-26 是VBD O吗 持有VBN O 在伊诺 杜兰NNP组织 大学NNP组织 新NNP位置 奥尔良NNP位置 拉尼普位置 六月NNP日期 26-28 CD日期 2013年CD日期

    单词后面跟着POS标记,后面跟着NE实体标记。O代表“其他”,其余的应该是不言自明的。然后,您可以查找位置和周围的位置或组织

  • 您可以使用一个地名数据库来查找国家/城市,然后查看周围的x字。如果您还可以提供常用的“场馆”名称列表,您可以将其包括在内,以进一步改善结果。此步骤也可以集成到任何其他方法中


  • 这份清单并非详尽无遗。这在很大程度上取决于输入的方差