RError.com

RError.com Logo RError.com Logo

RError.com Navigation

  • 主页

Mobile menu

Close
  • 主页
  • 系统&网络
    • 热门问题
    • 最新问题
    • 标签
  • Ubuntu
    • 热门问题
    • 最新问题
    • 标签
  • 帮助
主页 / 问题 / 1539391
Accepted
Глеб
Глеб
Asked:2023-09-07 00:37:36 +0000 UTC2023-09-07 00:37:36 +0000 UTC 2023-09-07 00:37:36 +0000 UTC

生成不等数的大数组

  • 772

假设我需要创建一个巨大的(大约一百万)随机数列表。但不仅仅是随机数,而且是不等的随机数。问题是:最快的方法是什么?

选项:

1:(添加前检查每个元素)

import random
nums = []
for i in range(10 ** 6):
    while True:
        x = random.random()
        if nums.find() + 1:
            nums.append(x)
            break
        else:
            continue

2:(生成整个列表后检查)

import random
while True:
    for i in range(10 ** 6):
        nums.append(random.random())
    if list(set(nums)) == nums: break
    else: continue

3:(野蛮☺)

import random
nums = []
x = random.random()
for i in range(10 ** 6):
    nums.append(x * i)

也许还有一些使用特殊方法的其他选项,也许来自其他模块,专门为生成不相等的数字而设计。如果有的话请告诉我。

那么哪个选项更好呢?或者有更快的算法吗?

python
  • 4 4 个回答
  • 98 Views

4 个回答

  • Voted
  1. Best Answer
    Stanislav Volodarskiy
    2023-09-07T03:49:16Z2023-09-07T03:49:16Z

    第一个选项

    人可以猜出它的含义if nums.find() + 1:,但编译器不能。表达式没有提到x,Python 中的列表没有方法find。如果我们假设其含义是什么if x not in nums:,那么该方法就有效。在我的电脑上,它将在一个半小时内运行。

    第二个选项

    如果条件if list(set(nums)) == nums:成立,那么我们确实会得到 中一百万个唯一数字的列表nums。不幸的是,这种组合list(set(...))在某种程度上混淆了它的论点。如果所有数字都是唯一的并且它们的顺序nums与结果一致,list(set(...))则相等性成立。该事件发生的概率是多少?1 / (10 6 !) ≈ 10 -5565709。循环的一次迭代大约需要一秒钟。您将需要等待大约 10,5565709秒才能收到结果。宇宙年龄 - 10 18秒 你得等很长时间。但这只是故事的一半。即使剩下这个时间,也很可能无法生成所需的组合。我将省略原因以免让您感到厌烦。结论——该方法不起作用。

    如果用它替换条件if len(set(nums)) == 10 ** 6:,该方法将有效并且速度非常快 - 它将有效大约一秒钟。

    第三种选择

    这些数字不是随机的。如果这样的事故适合你,那很好。但细心的观察者会注意到,这些数字在以一定的间隔增长。总之,缺点太明显了。

    解决方案

    大约0.69秒。

    import random
    
    s = set()
    while len(s) < 1_000_000:
        s.add(random.random())
    l = list(s)
    

    其中,0.16s 用于生成本身。剩下的 0.53 秒是与大众一起工作的。

    此选项稍快一些 - 0.6 秒:

    import random
    
    size = 1_000_000
    s = set()
    while len(s) < size:
        s.update(random.random() for _ in range(size - len(s)))
    l = list(s)
    

    甚至更快 - 0.55 秒:

    import random
    
    size = 1_000_000
    s = set(random.random() for _ in range(size))
    while len(s) < size:
        s.update(random.random() for _ in range(size - len(s)))
    l = list(s)
    

    第二个示例是否通常需要多次迭代?在最后一个示例中,您需要多久进入一次循环?这两个问题的答案是相同的:需要补充该集合的概率是6·10 -5。换句话说——很少。如果我的计算机在循环中生成随机数集,则需要平均每两个半小时添加一次到随机数集中。

    PS老实说,我更喜欢第一个选项。简单且足够快。

    PPS如果在生成过程中添加内存限制,将会出现一个更有趣的问题。

    • 5
  2. MBo
    2023-09-07T00:56:22Z2023-09-07T00:56:22Z

    random.sample()可能适合你

    import random
    
    print([x/1000 for x in random.sample(range(1000), 10)])
    
    • 3
  3. Oopss
    2023-09-07T02:23:00Z2023-09-07T02:23:00Z
    import uuid
    
    s=[uuid.uuid4().int for i in range(1_000_000)]
    l=list(set(s))
    

    ...
    19338761825466288640265314643851179312
    178303052562301544546569716401959751820
    147718195392286393968890593237377029069
    196091551904263230486818310589002110116
    42826159964564327211771179483953807288
    297151613728264239240276251569460736275
    ...
    

    https://docs.python.org/3/library/uuid.html

    • 3
  4. CrazyElf
    2023-09-08T13:42:36Z2023-09-08T13:42:36Z

    没有人写过任何关于使用 进行混合的文章shuffle。嗯,那我就写吧。

    纯Python:

    from random import shuffle
    
    n = 1_000_000
    lst = [i/(n+1) for i in range(n)]
    shuffle(lst)
    

    长——大约0.75秒。

    但我们有Numpy:

    import numpy as np
    
    n = 1_000_000
    arr = np.arange(n) / (n+1)
    np.random.shuffle(arr)
    

    快速 - 大约 30 毫秒Google Colab。

    • 2

相关问题

  • 是否可以以某种方式自定义 QTabWidget?

  • telebot.anihelper.ApiException 错误

  • Python。检查一个数字是否是 3 的幂。输出 无

  • 解析多个响应

  • 交换两个数组的元素,以便它们的新内容也反转

Sidebar

Stats

  • 问题 10021
  • Answers 30001
  • 最佳答案 8000
  • 用户 6900
  • 常问
  • 回答
  • Marko Smith

    我看不懂措辞

    • 1 个回答
  • Marko Smith

    请求的模块“del”不提供名为“default”的导出

    • 3 个回答
  • Marko Smith

    "!+tab" 在 HTML 的 vs 代码中不起作用

    • 5 个回答
  • Marko Smith

    我正在尝试解决“猜词”的问题。Python

    • 2 个回答
  • Marko Smith

    可以使用哪些命令将当前指针移动到指定的提交而不更改工作目录中的文件?

    • 1 个回答
  • Marko Smith

    Python解析野莓

    • 1 个回答
  • Marko Smith

    问题:“警告:检查最新版本的 pip 时出错。”

    • 2 个回答
  • Marko Smith

    帮助编写一个用值填充变量的循环。解决这个问题

    • 2 个回答
  • Marko Smith

    尽管依赖数组为空,但在渲染上调用了 2 次 useEffect

    • 2 个回答
  • Marko Smith

    数据不通过 Telegram.WebApp.sendData 发送

    • 1 个回答
  • Martin Hope
    Alexandr_TT 2020年新年大赛! 2020-12-20 18:20:21 +0000 UTC
  • Martin Hope
    Alexandr_TT 圣诞树动画 2020-12-23 00:38:08 +0000 UTC
  • Martin Hope
    Air 究竟是什么标识了网站访问者? 2020-11-03 15:49:20 +0000 UTC
  • Martin Hope
    Qwertiy 号码显示 9223372036854775807 2020-07-11 18:16:49 +0000 UTC
  • Martin Hope
    user216109 如何为黑客设下陷阱,或充分击退攻击? 2020-05-10 02:22:52 +0000 UTC
  • Martin Hope
    Qwertiy 并变成3个无穷大 2020-11-06 07:15:57 +0000 UTC
  • Martin Hope
    koks_rs 什么是样板代码? 2020-10-27 15:43:19 +0000 UTC
  • Martin Hope
    Sirop4ik 向 git 提交发布的正确方法是什么? 2020-10-05 00:02:00 +0000 UTC
  • Martin Hope
    faoxis 为什么在这么多示例中函数都称为 foo? 2020-08-15 04:42:49 +0000 UTC
  • Martin Hope
    Pavel Mayorov 如何从事件或回调函数中返回值?或者至少等他们完成。 2020-08-11 16:49:28 +0000 UTC

热门标签

javascript python java php c# c++ html android jquery mysql

Explore

  • 主页
  • 问题
    • 热门问题
    • 最新问题
  • 标签
  • 帮助

Footer

RError.com

关于我们

  • 关于我们
  • 联系我们

Legal Stuff

  • Privacy Policy

帮助

© 2023 RError.com All Rights Reserve   沪ICP备12040472号-5