启动novelai后,来宾操作系统的Windows server就会蓝屏,接下来Tesla P4无法启动,设备管理器提示系统没有足够资源,代码10,必须重启主机操作系统才行。哪怕将显卡重新挂载到主机操作系统上也是提示代码10。
以下是相关错误截图
考虑到之前idrac报告PSU超功率,不知是否与此有关,进入客机的安全模式重装驱动与cuda并重启主机操作系统后再次将GPU挂载至客机运行则顺利启动并绘图,NVIDIA-SMi显示显卡功率来到50-69w。
目前解决方案为等待新的550W 80Plus银牌冷电源到货后再进行研究。
目前使用的是350W的80Plus 铜牌电源,经计算该服务器满载功耗应为280W,已达到350的80%,据了解80%为Dell电源报错的阈值。
服务器配置如下:
E5-2470v2@2.4Ghz 10核心20线程
40GB ECC内存
Tesla P4 GPU
512GB SATA SSD
16GB Optane SSD Cache
2*2TB HDD
1*1TB HDD
2*1Gbps NIC