#### vsphere中的虚拟机配置直通GPU后,启动时出现 模块“DevicePowerOn”打开电源失败的解决方案
在虚拟机设置中的虚拟机选项中的配置参数中添加如下参数即可:
1、打开虚拟机选项
2、点击编辑配置
3、添加如下两项参数
pciPassthru.use64bitMMIO=TRUE
pciPassthru.64bitMMIOSizeGB=<GPU-SIZE>
<GPU-SIZE> 是集群中所有 GPU 的总帧缓存内存 GB,四舍五入到下一个更高的2次幂。
例如,对于两个40GBGPU,总缓存内存为80GB,四舍五入为128GB;因此,请将该值设置为 pciPassthru.64bitMMIOSizeGB=128。
#### GPU直通宿主机配置
##### 1、/etc/vmware/passthru.map 增加GPU卡的厂商id和设备ID: 两个ID通过硬件--》pci查看
10de 2684 flr false
10de 22ba flr false
passthru.map文件格式,reset methods要选择flr
# file format: vendor-id device-id resetMethod fptShareable
# vendor/device id: xxxx (in hex) (ffff can be used for wildchar match)
# reset methods: flr, d3d0, link, bridge, default
# fptShareable: true/default, false
这个文件`/etc/vmware/passthru.map`是VMware ESXi的一个配置文件,它定义了哪些PCI设备可以通过passthrough技术直接分配给虚拟机。文件内容包含了设备供应商ID(vendor-id)、设备ID(device-id)、重置方法(resetMethod)以及设备是否可共享(fptShareable)的详细信息。
这里是文件中各部分的详细解释:
1. 文件头:
- 这是一个注释部分,用于说明文件的用途和格式。
2. 文件格式:
- `vendor-id device-id resetMethod fptShareable`
- `vendor-id` 和 `device-id` 是PCI设备的唯一标识符,用十六进制表示。
- `resetMethod` 定义了当设备需要重置时使用的方法。
- `fptShareable` 指定了该PCI设备是否可以在不同的虚拟机或VMkernel之间共享。
3. 描述:
- `fptShareable`: 如果设置为`true`,意味着该PCI设备可以被多个实体共享。在多功能设备的情况下,不同的函数(functions)可以在不同的上下文中使用,例如两个虚拟机之间或虚拟机与VMkernel之间。
- `resetMethod`: 这是一个可选的重置方法覆盖。在某些情况下,你可能希望指定特定的重置方法而不是让VMkernel根据设备的能力来决定。不同的重置方法(如flr、d3d0、link、bridge)有不同的影响,特别是在多功能设备中。
4. 限制:
- PCI SR-IOV的物理和虚拟功能(PFs/VFs)不允许直接列在`passthru.map`文件中。这些功能必须支持功能级重置(FLR)并且是可共享的。
当你需要为虚拟机配置passthrough设备时,你需要在`/etc/vmware/passthru.map`文件中添加相应的条目,并确保虚拟机配置也允许passthrough。之后,你可能需要重启ESXi主机或虚拟机以使更改生效。
##### 2、/etc/vmware/esx.conf 将GPU设备信息添加到配置文件中:设备号从lspci获取
/device/0000:98:00.0/owner = "passthru"
/device/0000:b1:00.1/owner = "passthru"
/device/0000:98:00.1/owner = "passthru"
/device/0000:31:00.1/owner = "passthru"
/device/0000:31:00.0/owner = "passthru"
/device/0000:4b:00.1/owner = "passthru"
/device/0000:4b:00.0/owner = "passthru"
/device/0000:b1:00.0/owner = "passthru"
##### 3、重启宿主机
文章最后更新时间:
2024年07月29日 18:10:29