Pattern matching 你会用什么算法给鹦鹉编码？_Pattern Matching

Pattern matching 你会用什么算法给鹦鹉编码？

Pattern matching 你会用什么算法给鹦鹉编码？,pattern-matching,Pattern Matching,鹦鹉在附近学习最常用的单词和短语，以便在不适当的时候重复它们。那么，您将如何创建软件版本呢？假设它可以使用麦克风，并且可以随意录制声音，您将如何在不需要无限资源的情况下对其进行编码我能想象的最好的方法是使用声音中的静音来分割流，然后使用一些模式识别将每个流编码为一个标记列表，在遇到新标记时存储新标记。通过对标记序列进行散列并计算数据库中的出现次数，您可以构建最频繁使用的短语的图片。但是考虑到词组的巨大多样性，如何防止它变成一个巨大的列表？由于匹配的组合性质，要匹配的对的绝对数量肯定会产生很多误

鹦鹉在附近学习最常用的单词和短语，以便在不适当的时候重复它们。那么，您将如何创建软件版本呢？假设它可以使用麦克风，并且可以随意录制声音，您将如何在不需要无限资源的情况下对其进行编码

我能想象的最好的方法是使用声音中的静音来分割流，然后使用一些模式识别将每个流编码为一个标记列表，在遇到新标记时存储新标记。通过对标记序列进行散列并计算数据库中的出现次数，您可以构建最频繁使用的短语的图片。但是考虑到词组的巨大多样性，如何防止它变成一个巨大的列表？由于匹配的组合性质，要匹配的对的绝对数量肯定会产生很多误报

你会使用神经网络吗？因为一只真正的鹦鹉就是这样管理它的？或者有没有另一种更聪明的方法来匹配模拟数据中的大规模模式- 不要试图单独存储每个剪辑，相反，要与你想学习的目标号码进行相似性匹配，比如说可能一打。。。因此，出现了一个声音-您与正在跟踪的十几个声音中最接近的一个匹配-当您找到与其中一个匹配的足够模式时，您将此新声音平均到存储版本中-给出一个新版本

如果传入的声音与存储的任何声音不匹配，请将其丢弃

引导将是最困难的部分-区分目标短语的初始数量

不管怎么说，从我的头顶上。 hth，等等

编辑：好的，既然弗比已经出局了，我将建议一种棘手的解决方案。用一个扬声器和一个麦克风连接一个盒子，然后在里面放一只真正的鹦鹉。这对演示非常有用，一旦你获得了一些风险投资，你就可以开始开发你的神经网络版本了。神经网络（到目前为止已经实现了）实际上是无用的，但它们应该足够好，可以让你通过第二轮演示，到那时你将太大而不能失败。

我可能会使用马尔可夫链来模拟这一点

如果您以前没有使用马尔可夫链生成自然随机文本（或语音），请查看

如何防止这种情况发生一张大单子

我想你可以维持一个有限的最近单词列表，和一个无限的频繁单词列表。如果鹦鹉听到一个以前从未听到过的单词，它就会被储存在“短期记忆”中。如果它再次听到该词，它可以将该词移动到常用词列表中并无限期存储。偶尔，你可以清除只包含鹦鹉只听过一次的单词或声音的最新单词列表。

文章中：“有一种常见的误解，认为它们会重复周围说过的单词”@interjay:There的关键词是“common”，这意味着我不是唯一一个认为弗比斯重复了他们周围所说的话的白痴。我想我的愤怒是从别的地方得到的那些脏话-唷！或者不用清除，而是使用FIFO缓存，重复一个短语会将其推到列表的末尾，因此它在缓存中保留的时间更长。我附近的宠物店有一只鹦鹉，当人们进出商店时，它会说“你好”和“再见”，所以鹦鹉也会模仿理解上下文。