如何使用 CUDA 代码创建 .so 库？

Question

Володимир Дідик

Asked:2024-11-05 03:51:47 +0000 UTC2024-11-05 03:51:47 +0000 UTC 2024-11-05 03:51:47 +0000 UTC

每个 GPU 核心的程序大小

772

在 CUDA 环境中进行编程。（6 场讲座） https://www.youtube.com/watch?v=Oqebkc0NO_8

我把6个讲座都看完了，但还是没有弄清楚GPU核的程序存放在GPU内存的什么地方，以及它的大小有什么限制。我们到处都只谈论数据存储器。数据被发送到那里，数据被发送到船舶。 adra程序本身不发送到GPU吗？有 0 条与此相关的信息。

请有人分享您的知识。

1 个回答

Voted

user7860670 · Answer 1 · 2024-11-05T06:22:14Z

Best Answer

user7860670

2024-11-05T06:22:14Z2024-11-05T06:22:14Z

程序自然会以某种形式进入设备的内存来执行。具体如何以及在哪里是一个秘密。 Nvidia 发布了一份根据特定 NVPTX 虚拟机的操作对其设备进行编程的指南，该指南的规范并未阐明硬件实现的许多细节，包括。指令传递机制。实际上没有大小限制。 10版手册规定每个内核有512m条指令，这比实际需要的要多得多。而在版本12中，关于这种限制的信息被完全删除了。

您可以查看编译后的内核并使用CUDA 二进制实用程序估计其大小

3

每个 GPU 核心的程序大小

我看不懂措辞

请求的模块“del”不提供名为“default”的导出

"!+tab" 在 HTML 的 vs 代码中不起作用

我正在尝试解决“猜词”的问题。Python

可以使用哪些命令将当前指针移动到指定的提交而不更改工作目录中的文件？

Python解析野莓

问题：“警告：检查最新版本的 pip 时出错。”

帮助编写一个用值填充变量的循环。解决这个问题

尽管依赖数组为空，但在渲染上调用了 2 次 useEffect

数据不通过 Telegram.WebApp.sendData 发送

每个 GPU 核心的程序大小

1 个回答

相关问题