Python 寻找最常见的模式

Python 寻找最常见的模式,python,Python,可能重复: 我正在解决一个问题,我需要找到重复最多的模式 为了简单和方便,请考虑这个字符串: What is Lorem Ipsum? Lorem Ipsum is simply dummy text of the printing and typesetting industry. Lorem Ipsum has been the industry's standard dummy text ever since the 1500s... 重复次数最多的序列(例如,最初考虑字符串长度大于3

可能重复:

我正在解决一个问题,我需要找到重复最多的模式

为了简单和方便,请考虑这个字符串:

What is Lorem Ipsum?
Lorem Ipsum is simply dummy text of the printing and typesetting industry.
Lorem Ipsum has been the industry's standard dummy text ever since the 1500s...
重复次数最多的序列(例如,最初考虑字符串长度大于3个字符)是“Lorem Ipsum”。“Lorem”和“Ipsum”当然也重复相同的次数,但如果它们重复相同的次数,则较长的字符串优先于较短的字符串


什么样的算法可以有效地找到这种模式,最好是在Python中?

正如@fraxel所指出的,您需要进一步指定您的问题,但这听起来最多像是一个动态编程(http://en.wikipedia.org/wiki/Dynamic_programming)问题。但是,如果不进一步详细说明,就不可能知道您需要什么样的算法。例如,公式中的另一个不确定性是模式的定义。模式是简单的字符串吗?或者“ababa”被认为是与“acaca”相同的模式,因为它将匹配regex或glob模式“a*a*a”

如果一个较短的图案比一个较长的图案重复的次数更多,您想要哪一个?较短的(最初设置为较长,例如3),这与我的问题相同。请关闭这个可疑的模式是简单的Python字节串,或者如果理解起来更容易考虑长字符串的十进制数。我在常识中使用了单词模式,但没有暗示使用正则表达式。