是否可以以某种方式自定义 QTabWidget？

Question

Глеб

Asked:2023-09-07 00:37:36 +0000 UTC2023-09-07 00:37:36 +0000 UTC 2023-09-07 00:37:36 +0000 UTC

生成不等数的大数组

772

假设我需要创建一个巨大的（大约一百万）随机数列表。但不仅仅是随机数，而且是不等的随机数。问题是：最快的方法是什么？

选项：

1：（添加前检查每个元素）

import random
nums = []
for i in range(10 ** 6):
    while True:
        x = random.random()
        if nums.find() + 1:
            nums.append(x)
            break
        else:
            continue

2：（生成整个列表后检查）

import random
while True:
    for i in range(10 ** 6):
        nums.append(random.random())
    if list(set(nums)) == nums: break
    else: continue

3：（野蛮☺）

import random
nums = []
x = random.random()
for i in range(10 ** 6):
    nums.append(x * i)

也许还有一些使用特殊方法的其他选项，也许来自其他模块，专门为生成不相等的数字而设计。如果有的话请告诉我。

那么哪个选项更好呢？或者有更快的算法吗？

4 个回答

Voted

Stanislav Volodarskiy · Answer 1 · 2023-09-07T03:49:16Z

第一个选项

人可以猜出它的含义if nums.find() + 1:，但编译器不能。表达式没有提到x，Python 中的列表没有方法find。如果我们假设其含义是什么if x not in nums:，那么该方法就有效。在我的电脑上，它将在一个半小时内运行。

第二个选项

如果条件if list(set(nums)) == nums:成立，那么我们确实会得到中一百万个唯一数字的列表nums。不幸的是，这种组合list(set(...))在某种程度上混淆了它的论点。如果所有数字都是唯一的并且它们的顺序nums与结果一致，list(set(...))则相等性成立。该事件发生的概率是多少？1 / (10 ⁶ !) ≈ 10 ^-5565709。循环的一次迭代大约需要一秒钟。^{您将需要等待大约 10,5565709}秒才能收到结果。宇宙年龄 - 10 ¹⁸秒你得等很长时间。但这只是故事的一半。即使剩下这个时间，也很可能无法生成所需的组合。我将省略原因以免让您感到厌烦。结论——该方法不起作用。

如果用它替换条件if len(set(nums)) == 10 ** 6:，该方法将有效并且速度非常快 - 它将有效大约一秒钟。

第三种选择

这些数字不是随机的。如果这样的事故适合你，那很好。但细心的观察者会注意到，这些数字在以一定的间隔增长。总之，缺点太明显了。

解决方案

大约0.69秒。

import random

s = set()
while len(s) < 1_000_000:
    s.add(random.random())
l = list(s)

其中，0.16s 用于生成本身。剩下的 0.53 秒是与大众一起工作的。

此选项稍快一些 - 0.6 秒：

import random

size = 1_000_000
s = set()
while len(s) < size:
    s.update(random.random() for _ in range(size - len(s)))
l = list(s)

甚至更快 - 0.55 秒：

import random

size = 1_000_000
s = set(random.random() for _ in range(size))
while len(s) < size:
    s.update(random.random() for _ in range(size - len(s)))
l = list(s)

第二个示例是否通常需要多次迭代？在最后一个示例中，您需要多久进入一次循环？这两个问题的答案是相同的：需要补充该集合的概率是6·10 ^-5。换句话说——很少。如果我的计算机在循环中生成随机数集，则需要平均每两个半小时添加一次到随机数集中。

PS老实说，我更喜欢第一个选项。简单且足够快。

PPS如果在生成过程中添加内存限制，将会出现一个更有趣的问题。

MBo · Answer 2 · 2023-09-07T00:56:22Z

MBo

2023-09-07T00:56:22Z2023-09-07T00:56:22Z

random.sample()可能适合你

import random

print([x/1000 for x in random.sample(range(1000), 10)])

3

Oopss · Answer 3 · 2023-09-07T02:23:00Z

Oopss

2023-09-07T02:23:00Z2023-09-07T02:23:00Z

import uuid

s=[uuid.uuid4().int for i in range(1_000_000)]
l=list(set(s))

...
19338761825466288640265314643851179312
178303052562301544546569716401959751820
147718195392286393968890593237377029069
196091551904263230486818310589002110116
42826159964564327211771179483953807288
297151613728264239240276251569460736275
...

https://docs.python.org/3/library/uuid.html

3

CrazyElf · Answer 4 · 2023-09-08T13:42:36Z

CrazyElf

2023-09-08T13:42:36Z2023-09-08T13:42:36Z

没有人写过任何关于使用进行混合的文章shuffle。嗯，那我就写吧。

纯Python：

from random import shuffle

n = 1_000_000
lst = [i/(n+1) for i in range(n)]
shuffle(lst)

长——大约0.75秒。

但我们有Numpy：

import numpy as np

n = 1_000_000
arr = np.arange(n) / (n+1)
np.random.shuffle(arr)

快速 - 大约 30 毫秒Google Colab。

2

生成不等数的大数组

第一个选项

第二个选项

第三种选择

解决方案

我看不懂措辞

请求的模块“del”不提供名为“default”的导出

"!+tab" 在 HTML 的 vs 代码中不起作用

我正在尝试解决“猜词”的问题。Python

可以使用哪些命令将当前指针移动到指定的提交而不更改工作目录中的文件？

Python解析野莓

问题：“警告：检查最新版本的 pip 时出错。”

帮助编写一个用值填充变量的循环。解决这个问题

尽管依赖数组为空，但在渲染上调用了 2 次 useEffect

数据不通过 Telegram.WebApp.sendData 发送

生成不等数的大数组

4 个回答

第一个选项

第二个选项

第三种选择

解决方案

相关问题