Warning: file_get_contents(/data/phpspider/zhask/data//catemap/0/xml/14.json): failed to open stream: No such file or directory in /data/phpspider/zhask/libs/function.php on line 167

Warning: Invalid argument supplied for foreach() in /data/phpspider/zhask/libs/tag.function.php on line 1116

Notice: Undefined index: in /data/phpspider/zhask/libs/function.php on line 180

Warning: array_chunk() expects parameter 1 to be array, null given in /data/phpspider/zhask/libs/function.php on line 181
Web services 如何从真实语言中生成随机词_Web Services_Asp.net Web Api_Words - Fatal编程技术网

Web services 如何从真实语言中生成随机词

Web services 如何从真实语言中生成随机词,web-services,asp.net-web-api,words,Web Services,Asp.net Web Api,Words,如何从真实语言生成随机单词 有人知道互联网上的API有这个功能吗 例如,我向“ht\u tp://www.any…api.com/getword?lang=en”发送http请求,然后得到响应“Town”。或者“快”。或“收到”。。。例如,我向“ht_tp://www.any…api.com/getword?lang=ru”发送http请求,并得到一次响应“Ⅹ砦砦砦”。或“ааПа”。或“аааааааа”。。。任何语言单词的任何形式(名词、形容词、动词等) 我找到了资源“”。但这不是JSON格

如何从真实语言生成随机单词

有人知道互联网上的API有这个功能吗

例如,我向“ht\u tp://www.any…api.com/getword?lang=en”发送http请求,然后得到响应“Town”。或者“快”。或“收到”。。。例如,我向“ht_tp://www.any…api.com/getword?lang=ru”发送http请求,并得到一次响应“Ⅹ砦砦砦”。或“ааПа”。或“аааааааа”。。。任何语言单词的任何形式(名词、形容词、动词等)

我找到了资源“”。但这不是JSON格式,只有英文,并且在很长一段时间内不会有任何保修工作


请给出任何想法。

这个问题可以从两个方面来看,因此我给出两个答案:

  • 为了收集单词,我会在使用已知语言的网站上运行一个蜘蛛(Wikipedia是一个很好的起点)并去除HTML标记
  • 从一种真正的语言中生成单词更为棘手。使用收集的单词的统计信息,可以使用生成统计真实单词的Markow链。我尝试过一个字母一个字母地生成,但效果很差。使用音节结构可能是更好的方法
    • 看看这个答案:下载一本单词词典,插入数据库,每次从文件中随机取出一条记录或读取一行。这样,您就不需要依赖第三方API,您可以将其扩展到您可以找到的所有语言中。

      您可以下载。它们作为扩展名(oxt)提供,与ZIP文件没有什么不同。您可以用7zip或类似的方法打开它们。在里面你会发现很多文件,你感兴趣的是*.dic文件。它们还将包含决议或数字词

      当您遇到类似于放弃/LdS的情况时,请摆脱
      /LdS
      ,这用于拼写

      以这些*.dic文件为例,使用它们的名称作为键,将它们放入数据库,然后从数据库中为给定的语言代码随机选取一个单词

      更新


      更老,但更容易访问。

      两种方法都对。但第一种方式不适用于我的android应用程序,因为这会增加用户移动设备的流量。这条路并不清楚。第二条路很难走。我还考虑在所有语言上使用字典,但这需要使用自己的web服务(在网站上的case store dictionary中)或非常大的本地客户端应用程序(在用户移动设备上的case store dictionary中)。@TapaSave如果收集数据不成功,第二种方法将无法成功。关于流量:如果你阅读像维基百科这样包含大量文本的网页,你将从每一个数据量中获得大量的单词。为了减少搜索深度,只获取标题页上提到的页面和文章,并在本地缓存单词,运行几次后,您将收集一个单词日志。在这种情况下,当我解析Wiki等页面时,可以从其他语言获取单词。我无法确定这个词属于哪种语言。第二个负面案例:我可以找到缩写、首字母缩略词、数字、俚语和其他“垃圾”词。如果你坚持使用维基,你就会知道文章的语言。如果跳过参考资料部分,请暂时使用works中的内容。是的,我需要所有(或大多数)语言的单词。