python中快速堆排序时间的测量
我正在用Python测量快速排序和堆排序的时间,但是结果之间的差异太大了。请花点时间查看我的代码:python中快速堆排序时间的测量,python,quicksort,heapsort,Python,Quicksort,Heapsort,我正在用Python测量快速排序和堆排序的时间,但是结果之间的差异太大了。请花点时间查看我的代码: import time import linecache import random def shell_sort(some_list): h=1 while(h<=len(some_list)): h=3*h+1 while h>0: for i in xrange(len(some_list)): j
import time
import linecache
import random
def shell_sort(some_list):
h=1
while(h<=len(some_list)):
h=3*h+1
while h>0:
for i in xrange(len(some_list)):
j = i
temp = some_list[i]
while j >= h and some_list[j-h] > temp:
some_list[j] = some_list[j - h]
j -= h
some_list[j] = temp
h = h/3 if h/9 else (0 if h==1 else 1)
some_list.reverse()
def quick_sort_r(some_list):
l = []
e = []
g = []
if len(some_list) <= 1:
return some_list
else:
pivot = some_list[0]
for x in some_list:
if x < pivot:
l.append(x)
elif x > pivot:
g.append(x)
else:
e.append(x)
l = quick_sort_r(l)
g = quick_sort_r(g)
return g + e + l
def gen(number, b=100000):
#return [random.randint(0, b) for x in xrange(number)]
some_list = []
return [some_list.append(random.randint(0, b)) for x in xrange(number)]
domain = [10000, 25000, 50000, 100000, 200000, 300000, 400000, 500000, 750000, 1000000]
for element in domain:
print 'Results for: ' + str(element) + ' elements:'
for j in range(0, 10):
temp_list = gen(element)
start = time.time()
shell_sort(temp_list)
end = time.time() - start
print end
print '*************************'
导入时间
导入行缓存
随机输入
def外壳排序(一些列表):
h=1
而(h0:
对于xrange中的i(len(某些列表)):
j=i
temp=一些列表[i]
当j>=h和一些_列表[j-h]>温度:
some_list[j]=some_list[j-h]
j-=h
某些_列表[j]=temp
h=h/3如果h/9其他(如果h=1其他1,则为0)
有些人把清单倒过来
def快速排序(部分列表):
l=[]
e=[]
g=[]
如果len(某些列表)枢轴:
g、 附加(x)
其他:
e、 附加(x)
l=快速排序(l)
g=快速排序(g)
返回g+e+l
def发生器(编号,b=100000):
#返回[random.randint(0,b)表示x范围内的x(数字)]
some_list=[]
为xrange(number)中的x返回[some_list.append(random.randint(0,b))]
域名=[10000、25000、50000、100000、200000、300000、400000、500000、750000、1000000]
对于域中的元素:
打印“+str(元素)+”元素的结果:”
对于范围(0,10)内的j:
临时列表=发电机(元件)
开始=时间。时间()
外壳排序(临时列表)
结束=时间。时间()-开始
打印端
打印“***************************”
我在函数“gen”中使用了两种类型的代码。第一种用于堆排序,第二种用于快速排序。希望差异太大,这是不正确的。1000000个元素的QS大约为0.5秒,HS为23秒。怎么了
来自advance的感谢。此行:
return [some_list.append(random.randint(0, b)) for x in xrange(number)]
…是一个列表理解,它生成对某些列表的number
调用的结果。append(…)
,所有这些调用都返回None
:
>>> print gen(10)
[None, None, None, None, None, None, None, None, None, None]
None
s比较如下:
>>> None < None
False
>>> None > None
False
总之,使用return[random.randint(0,b)for x In xrange(number)]
代替。在我的机器上,这种更改使快速排序从0.43s变为8.9s,这可能比您预期的要多
顺便说一句,除非你有一台速度很快的机器,否则Python不会很好地接受1000000个数字的列表——这需要我的时间(有点慢)计算机大约需要3秒钟来生成一个包含100万个数字的列表。你的问题到底是什么?我不知道你在问什么。为什么差异太大?请注意,我会比较随机生成的相同数据集的排序时间。不同的排序算法根据数据的排序方式执行不同的操作。因此,sendi为每个算法添加两个不同的输入可能不是最好的测试。创建一个数据集来使用随机数进行测试,并将相同的数据集传递给两个算法。你是对的,但即使我对排序列表进行排序,问题也会出现。当我意识到排序升序、排序降序的快速排序的复杂性时,我开始感到困惑nding和not sorted(random)是一样的。这当然是错误的,因为悲观的复杂度是O(n^2),乐观的复杂度是O(n*logn)。谢谢你的回答。你用我的代码写QS了吗?它不能用这个“return[random.randint(0,b)表示x范围内的x(number)]“。即使我尝试对10000个元素的列表进行排序。好的,它可以对10000个元素进行排序,但仅当它们是随机的。当我尝试对10000个已排序元素的列表进行排序时,递归深度会出错。”。
def quick_sort_r(some_list):
e = []
if len(some_list) <= 1:
return some_list
else:
pivot = some_list[0]
for x in some_list:
# all other comparisons are False
e.append(x)
return e