大佬教程收集整理的这篇文章主要介绍了Python3 中 sorted() 和 heapq 函数的性能,大佬教程大佬觉得挺不错的,现在分享给大家,也给大家做个参考。
我想使用 python3 以最快的方式实现以下过程:给定一个 N
随机整数列表,我需要返回 K
最小的整数(并且我不需要返回的整数排序)。
我以三种不同的方式实现了它(如下面的代码所示)。
test_sorted()
函数使用内置的 sorted()
函数对整个整数列表进行排序,然后获取前 K
元素的切片。此操作的成本本质上应该是运行 sorted()
函数的成本,其时间复杂度为 O(N log(N))
。
test_heap()
函数使用堆仅存储最低的 K
元素并返回它们。在堆上插入一个元素的时间复杂度为 O(log(N))
,理论上我们需要在堆中推送一个项目的时间为 N
。但是,在第一个 K
插入之后,我们将从堆中推送和弹出,我希望如果传入的元素比堆中的任何元素都大,则不会发生插入,时间复杂度应该介于 {{ 1}} 和 O(K log(N))
(取决于输入列表的实际顺序)。无论如何,即使我的假设不正确,最坏的复杂度也应该是 O(N log(N))
(像往常一样,我认为我们需要的所有比较的成本可以忽略不计)。
O(N log(N))
函数使用 test_nsmallest()
模块中的 nsmallest()
函数。我对这种方法没有期望,因为在官方 python 文档中我只发现
对于较大的值,使用 sorted() 函数效率更高。 我决定试一试。
heapq
我的(旧)2011 年末 MACBook Pro 上的输出如下所示。
# test.py
from heapq import heappush,heappushpop,nsmallest
from random import randint
from timeit import timeit
N,K = 1000,50
RANDOM_INTS = [randint(1,100) for _ in range(N)]
def test_sorted():
return sorted(RANDOM_INTS)[:K]
def test_heap():
heap = []
for val in RANDOM_INTS:
if len(heap) < K:
heappush(heap,-val)
else:
heappushpop(heap,-val)
return [-val for val in heap]
def test_nsmallest():
return nsmallest(K,RANDOM_INTS)
def main():
sorted_result = timeit("test_sorted()",globals=globals(),number=100_000)
print(f"test_sorted took: {sorted_result}")
heap_result = timeit("test_heap()",number=100_000)
print(f"test_heap took: {heap_result}")
nsmallest_result = timeit("test_nsmallest()",number=100_000)
print(f"test_nsmallest took: {nsmallest_result}")
r1,r2,r3 = test_sorted(),test_heap(),test_nsmallest()
assert len(r1) == len(r2) == len(r3)
assert set(r1) == set(r2) == set(r3)
if __name__ == '__main__':
main()
使用 $ python --version
Python 3.9.2
$ python test.py
test_sorted took: 8.389572635999999
test_heap took: 18.586762750000002
test_nsmallest took: 13.772040639000004
的最简单的解决方案是迄今为止最好的,谁能详细说明为什么结果与我的期望不符(即 sorted()
函数应该至少快一点)?我错过了什么?
如果我用 pypy 运行相同的代码,结果是相反的。
test_heap()
这更接近我的期望。
假设我对 python 内部结构一无所知,并且我对为什么 pypy 比 python 快只有一个非常粗略的理解,任何人都可以详细说明这些结果并添加一些关于正在发生的事情的信息,以便让我正确预见未来类似情况的最佳选择?
另外,如果您对运行速度比上述更快的其他实现有任何建议,请随时分享!
更新:
如果我们需要根据一些不是项目本身的值的标准对输入列表进行排序怎么办(正如我在实际用例中实际需要的那样;以上只是一个简化)?那么,在这种情况下,结果更令人惊讶:
$ pypy --version
Python 3.7.10 (51efa818fd9b,Apr 04 2021,12:03:51)
[PyPy 7.3.4 with GCC Apple LLVM 12.0.0 (clang-1200.0.32.29)]
$ pypy test.py
test_sorted took: 7.1336525249998886
test_heap took: 3.1177806880004937
test_nsmallest took: 7.5453417899998385
输出:
# test2.py
from heapq import heappush,nsmallest
from random import randint
from timeit import timeit
N,100) for _ in range(N)]
def test_sorted():
return sorted(RANDOM_INTS,key=lambda x: X)[:K]
def test_heap():
heap = []
for val in RANDOM_INTS:
if len(heap) < K:
heappush(heap,(-val,val))
else:
heappushpop(heap,val))
return [val for _,val in heap]
def test_nsmallest():
return nsmallest(K,RANDOM_INTS,key=lambda x: X)
def main():
sorted_result = timeit("test_sorted()",test_nsmallest()
assert len(r1) == len(r2) == len(r3)
assert set(r1) == set(r2) == set(r3)
if __name__ == '__main__':
main()
这至少告诉我两件事:
使用外部键进行排序非常昂贵,无论是使用 $ python test2.py
test_sorted took: 18.740868524
test_heap took: 27.694126547999996
test_nsmallest took: 25.414596833000004
$ pypy test2.py
test_sorted took: 65.88409741500072
test_heap took: 3.9442632220016094
test_nsmallest took: 19.981832798999676
kwarg 提供 lambda 函数还是需要构建元组 key
以获得所需的排序堆。
在 pypy 中使用 lambdas 似乎非常昂贵,但我不知道为什么......也许 pypy 无法优化它们并且这与它执行的其他优化不兼容???>
您正在使用 CPython 解释器和 PyPy 即时编译器对一个小数组进行排序。结果,出现了许多复杂的开销。内置调用可能比手动编写的包含循环的纯 Python 代码更快。
渐近复杂度仅适用于大值,因为缺少常数因子:O(n log2(n) + 30 n)
算法可能比 O(2 n log2(n))
算法慢练习 n < 1 000 000 000
而两者都是 O(n log2(n))
...实际因素很难知道,因为应该考虑许多重要的硬件影响。
此外,对于堆排序,必须将所有项都插入到堆中,这样才能得到正确的结果(不添加的可以是最少的)。这可以在 O(n)
时间内完成。因此,要获得 k
大小的列表中的第一个 n
值,复杂度为 O(k log(n) + n)
(不考虑隐藏常量)。
使用 sorted() 的最简单的解决方案是迄今为止最好的,谁能详细说明为什么结果与我的期望不符(即 test_heap() 函数应该至少快一点)?
sorted
是一个非常优化的内置函数。蟒蛇uses the very fast Timsort algorithm。 Timsort 通常比朴素的 Heapsort 快。这就是为什么尽管复杂但它比 nsmallest
更快。此外,您的堆排序是用纯 Python 编写的。
另外,在 CPython 中,三个实现的大部分时间是处理排序列表和创建一个新列表的开销(大约一半时间在我的机器上)。 PyPy 可以减轻开销,但不能完全消除它们。 请记住,Python 列表是一个复杂的动态对象,具有许多内存间接性(需要在其中存储动态类型的对象)。
假设我对 python 内部结构一无所知,并且我对为什么 pypy 比 python 快只有一个非常粗略的理解,任何人都可以详细说明这些结果并添加一些关于正在发生的事情的信息,以便让我正确预见未来类似情况的最佳选择?
当您可以安全地说其中的所有类型都是本机类型时,最好的解决方案是不要使用 Python 列表:固定大小的整数、简单/双精度浮点数。相反,使用 Numpy!但是,请记住,Numpy/List 转换非常缓慢。
这里,最快的解决方案是使用 np.random.randint(0,100,N)
直接创建一个随机整数的 Numpy 数组,然后使用 分区算法 来检索 k
-最小的数字,使用 { {1}}。如果需要,您可以对生成的 np.partition(data,k)[:k]
大小的数组进行排序。请注意,使用堆是执行分区的一种方式,但这远不是最快的算法(例如,参见 Quick@R_674_10288@ct)。最后,请注意,对于 RadixSort 这样的整数,有快速的 k
排序算法。
在 pypy 中使用 lambdas 似乎非常昂贵,但我不知道为什么...
AFAIK,这种情况是 PyPy (due to internal guards) 的性能问题。该团队意识到了这一点,并计划在未来改进此类案件的表现。一般的经验法则是尽可能避免使用动态代码以获得快速执行(例如,纯 python 对象,如 list 和 Dict 以及 lambdas)。
以上是大佬教程为你收集整理的Python3 中 sorted() 和 heapq 函数的性能全部内容,希望文章能够帮你解决Python3 中 sorted() 和 heapq 函数的性能所遇到的程序开发问题。
如果觉得大佬教程网站内容还不错,欢迎将大佬教程推荐给程序员好友。
本图文内容来源于网友网络收集整理提供,作为学习参考使用,版权属于原作者。
如您有任何意见或建议可联系处理。小编QQ:384754419,请注明来意。